Speech Codecs

AMR-WB

AMR-WB(Adaptive Multi-Rate Wideand)는 무선과 유선 서비스 모두를 위해 개발된 첫번째 코덱입니다. 2001년 12월에 ETSI/3GPP에서 처음으로 표준화가 되었고 2002년 1월에 ITU-T에서 G.722.2로 표준으로 채택되었습니다. 6.6에서 23.85 Kbps까지 넓은 범위의 비트율을 지원하며, GSM과 WCDMA망에서 광대역 음성을 위한 표준 코덱입니다. AMR-WB 코덱은 ITU에서 원격회의와 패킷을 통한 음성 전송 응용분야를 위해 ITU에서 채택되었습니다.

나선(nahsun)의 AMR-NB GSM 음성 코덱은 ITU-T G.722.2 표준에 완전한 호환성을 가지며 ARM 프로세서군에 최적화되어 구현되었습니다.

지원 비트스트림 특성

  • 호환성
    • ITU-T G.722.2 (ITU-T/3GPP 2002/2001)
  • 비트율 : 23.85/23.05/19.85/18.25/15.85/14.25/12.65/8.85/6.6 Kbps
  • 시간지연 :
    • 프레임 길이 : 20 ms
    • Lookahead : 5 ms
  • 채널 : 모노(1ch)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 85 MHz (인코더) 20 MHz (디코더)
  • Code ROM : 85 KB
  • Constant Data ROM : 45 KB
  • RAM : 20 KB

G.711

G.711은 음성에 있어서의 ITU 표준 / H.323환경에서 음성전달 전송방식의 기본 오디오 코덱 표준안입니다. G.711은 64Kbps에서 3KHz의 전화급 오디오 품질을 제공하기 위하여 PCM 오디오 인코딩과 미국, 유럽에서 주로 이용하는 U-law 또는 A-law 방식을 사용한다. 펄스코드변조 (Pulse Code Modulation, PCM) 방식은 샘플들을 미국 방식인U-law 또는 유럽 방식인 A-law 양자화 방식을 이용하여 한정된 재구성 세트 중의 하나로 양자화를 시켜주는 파형 코딩 방식입니다. G.711 표준은 전화 대화 코딩을 위한 표준 방식으로 8Bit PCM을 정의하고 있습니다.

나선(nahsun)의 G.711 코덱은 ITU-T의 G.711 표준안과 호환성을 가지고 있습니다. 전화, 멀티미디어 장치, 무선 전화 및 화상회의 제품과 같은 다양한 응용분야에 사용됩니다.


A-law


u-law

 

지원 비트스트림 특성

  • 호환성
    • ITU-T G.711 과 완전한 비트 일치 (bit-exact)
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 64 Kbps
  • 부호화 모드 : A-law/u-law
  • 채널 : 모노(1ch)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 0.7 MHz (인코더) 0.4 MHz (디코더)
  • Code ROM : 0.2 KB
  • Constant Data ROM : 0.025 KB
  • RAM : 0.01 KB

AMR-NB

AMR은 GSM, US-TDMA 및 PDC사이에 트랜스코더가 없이 연결성을 제공하기 위해 설계되었고 GSM과 진화된 GSM(WCDMA, GPRS 및 EDGE) 망들에서 협대역 음성과 멀티미디어 메시지 서비스를 위한 3GPP 필수 표준 코덱입니다.

AMR는 4.75에서 12.2 Kbps의 범위에서 8종류의 비트율에서 동작하며 연결의 강건성을 개선하기 위해 설계되었습니다. AMR은 망 상황에 따라서 망이 혼잡할 동안에는 낮은 비트율을 사용하거나 음질을 보존하면서 열화를 사용함으로써 동적으로 적응할 수 있습니다.음성 비트율과 채널 코딩을 타협함으로써, AMR는 수신단에서 신호를 수신할 가능을 최대로 만듭니다. 이런 채널 보호 기능의 추가하는 것이 프레임 손실을 허락하는 것보다 더 성공적이라는 증명되었습니다.

AMR narrowband codec은 ACELP(Algebraic code excited linear prediction) 모델을 기반으로 합니다. 이 코덱은 7.4 Kbps정도부터 톨 품질(toll quality)를 제공하고, 좀 더 비트율에서는 더 나은 강건성과 톨 품질에 근접한 음질을, 그리고 좀 더 높은 비트율에서는 음성이 아닌 소리를 좀 더 잘 재생할 수 있습니다.

나선(nahsun)의 AMR-NB GSM 음성 코덱은 ETSI GSM 06.90 표준에 완전한 호환성을 가지면 ARM 프로세서군에 최적화되어 구현되었습니다.

지원 비트스트림 특성

  • 호환성
    • ETSI GSM 06.90
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 4.75/5.15/5.9/6.7/7.4/7.95/10.2/12.2 Kbps
  • 시간지연 :
    • 프레임 길이 : 20 ms
    • Lookahead : 5 ms
  • 채널 : 모노(1ch)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 32 MHz (인코더) 6 MHz (디코더)
  • Code ROM : 85 KB
  • Constant Data ROM : 40 KB
  • RAM : 8.1 KB

G.726

나선(nahsun)의 G.726은 ADPCM(적응 차분 PCM, Adaptive Differential Pulse Code Modulation)을 기반으로 G.721과 G.723을 포함해서 16, 24, 32 및 40 Kbps의 비트율에서 음성 압축 및 복원을 규정하는 ITU-T G.726 표준안과 호환성을 가지고 있습니다.

나선(nahsun)의 G.726은 음성 저장과 전화 응용 프로그램에서 오디오 및 음성 압축에 사용될 수 있습니다.


지원 비트스트림 특성

  • 호환성
    • ITU-T G.726 과 완전한 비트 일치 (bit-exact)
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 16, 24, 32, 40 Kbps
  • 시간지연 :
    • 프레임 길이 : 0.125 ms
    • Lookahead : 0 ms
  • 채널 : 모노(1ch)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 3.0
    • WinCE (Embedded Visual C)
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 5.5 MHz (인코더) 5.3 MHz (디코더)
  • Code ROM : 1.2 KB (인코더) 1.5 KB(디코더)
  • Constant Data ROM : 0.5 KB
  • RAM : 0.1 KB