Speech Codecs

AMR-WB

AMR-WB(Adaptive Multi-Rate Wideand)는 무선과 유선 서비스 모두를 위해 개발된 첫번째 코덱입니다. 2001년 12월에 ETSI/3GPP에서 처음으로 표준화가 되었고 2002년 1월에 ITU-T에서 G.722.2로 표준으로 채택되었습니다. 6.6에서 23.85 Kbps까지 넓은 범위의 비트율을 지원하며, GSM과 WCDMA망에서 광대역 음성을 위한 표준 코덱입니다. AMR-WB 코덱은 ITU에서 원격회의와 패킷을 통한 음성 전송 응용분야를 위해 ITU에서 채택되었습니다.

나선(nahsun)의 AMR-NB GSM 음성 코덱은 ITU-T G.722.2 표준에 완전한 호환성을 가지며 ARM 프로세서군에 최적화되어 구현되었습니다.

지원 비트스트림 특성

  • 호환성
    • ITU-T G.722.2 (ITU-T/3GPP 2002/2001)
  • 비트율 : 23.85/23.05/19.85/18.25/15.85/14.25/12.65/8.85/6.6 Kbps
  • 시간지연 :
    • 프레임 길이 : 20 ms
    • Lookahead : 5 ms
  • 채널 : 모노(1ch)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 85 MHz (인코더) 20 MHz (디코더)
  • Code ROM : 85 KB
  • Constant Data ROM : 45 KB
  • RAM : 20 KB

G.711

G.711은 음성에 있어서의 ITU 표준 / H.323환경에서 음성전달 전송방식의 기본 오디오 코덱 표준안입니다. G.711은 64Kbps에서 3KHz의 전화급 오디오 품질을 제공하기 위하여 PCM 오디오 인코딩과 미국, 유럽에서 주로 이용하는 U-law 또는 A-law 방식을 사용한다. 펄스코드변조 (Pulse Code Modulation, PCM) 방식은 샘플들을 미국 방식인U-law 또는 유럽 방식인 A-law 양자화 방식을 이용하여 한정된 재구성 세트 중의 하나로 양자화를 시켜주는 파형 코딩 방식입니다. G.711 표준은 전화 대화 코딩을 위한 표준 방식으로 8Bit PCM을 정의하고 있습니다.

나선(nahsun)의 G.711 코덱은 ITU-T의 G.711 표준안과 호환성을 가지고 있습니다. 전화, 멀티미디어 장치, 무선 전화 및 화상회의 제품과 같은 다양한 응용분야에 사용됩니다.


A-law


u-law

 

지원 비트스트림 특성

  • 호환성
    • ITU-T G.711 과 완전한 비트 일치 (bit-exact)
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 64 Kbps
  • 부호화 모드 : A-law/u-law
  • 채널 : 모노(1ch)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 0.7 MHz (인코더) 0.4 MHz (디코더)
  • Code ROM : 0.2 KB
  • Constant Data ROM : 0.025 KB
  • RAM : 0.01 KB

G.722

나선(nahsun)의 G.722는 SB-ADPCM(부대역 적응 차분 PCM, Subband Adaptive Differential Pulse Code Modulation)을 기반으로 48, 56 또는 64 Kbps의 비트율에서 음성 압축 및 복원을 규정하는 ITU-T G.722 표준안과 호환성을 가지고 있습니다. G.722 SB-ADPCM 인코더는 16 kHz 샘플링으로 균일 PCM의 비트율을 64 kbps( 또는 56 kbps 또는 48 kbps)으로 줄여 줍니다. G.722 디코더는 인코더에 대한 역동작을 수행합니다.

나선(nahsun)의 G.722 엔진은 음성 저장과 전화 응용 프로그램에서 오디오 및 음성 압축에 사용될 수 있습니다.


지원 비트스트림 특성

  • 호환성
    • ITU-T G.722 과 완전한 비트 일치 (bit-exact)
  • 샘플링 주파수 : 16 KHz
  • 비트율 : 48, 56, 64 Kbps
  • 시간지연 :
    • 프레임 길이 : 0.125 ms
    • Lookahead : 1.5 ms
  • 채널 : 모노(1ch)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 3.6 MHz (인코더) 3.1 MHz (디코더)
  • Code ROM : 5.1 KB
  • Constant Data ROM : 2.1 KB
  • RAM : 0.5 KB

G.726

나선(nahsun)의 G.726은 ADPCM(적응 차분 PCM, Adaptive Differential Pulse Code Modulation)을 기반으로 G.721과 G.723을 포함해서 16, 24, 32 및 40 Kbps의 비트율에서 음성 압축 및 복원을 규정하는 ITU-T G.726 표준안과 호환성을 가지고 있습니다.

나선(nahsun)의 G.726은 음성 저장과 전화 응용 프로그램에서 오디오 및 음성 압축에 사용될 수 있습니다.


지원 비트스트림 특성

  • 호환성
    • ITU-T G.726 과 완전한 비트 일치 (bit-exact)
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 16, 24, 32, 40 Kbps
  • 시간지연 :
    • 프레임 길이 : 0.125 ms
    • Lookahead : 0 ms
  • 채널 : 모노(1ch)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 3.0
    • WinCE (Embedded Visual C)
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 5.5 MHz (인코더) 5.3 MHz (디코더)
  • Code ROM : 1.2 KB (인코더) 1.5 KB(디코더)
  • Constant Data ROM : 0.5 KB
  • RAM : 0.1 KB

More Articles ...