Speech Codecs

AMR-NB

AMR은 GSM, US-TDMA 및 PDC사이에 트랜스코더가 없이 연결성을 제공하기 위해 설계되었고 GSM과 진화된 GSM(WCDMA, GPRS 및 EDGE) 망들에서 협대역 음성과 멀티미디어 메시지 서비스를 위한 3GPP 필수 표준 코덱입니다.

AMR는 4.75에서 12.2 Kbps의 범위에서 8종류의 비트율에서 동작하며 연결의 강건성을 개선하기 위해 설계되었습니다. AMR은 망 상황에 따라서 망이 혼잡할 동안에는 낮은 비트율을 사용하거나 음질을 보존하면서 열화를 사용함으로써 동적으로 적응할 수 있습니다.음성 비트율과 채널 코딩을 타협함으로써, AMR는 수신단에서 신호를 수신할 가능을 최대로 만듭니다. 이런 채널 보호 기능의 추가하는 것이 프레임 손실을 허락하는 것보다 더 성공적이라는 증명되었습니다.

AMR narrowband codec은 ACELP(Algebraic code excited linear prediction) 모델을 기반으로 합니다. 이 코덱은 7.4 Kbps정도부터 톨 품질(toll quality)를 제공하고, 좀 더 비트율에서는 더 나은 강건성과 톨 품질에 근접한 음질을, 그리고 좀 더 높은 비트율에서는 음성이 아닌 소리를 좀 더 잘 재생할 수 있습니다.

나선(nahsun)의 AMR-NB GSM 음성 코덱은 ETSI GSM 06.90 표준에 완전한 호환성을 가지면 ARM 프로세서군에 최적화되어 구현되었습니다.

지원 비트스트림 특성

  • 호환성
    • ETSI GSM 06.90
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 4.75/5.15/5.9/6.7/7.4/7.95/10.2/12.2 Kbps
  • 시간지연 :
    • 프레임 길이 : 20 ms
    • Lookahead : 5 ms
  • 채널 : 모노(1ch)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 32 MHz (인코더) 6 MHz (디코더)
  • Code ROM : 85 KB
  • Constant Data ROM : 40 KB
  • RAM : 8.1 KB

G.729

나선(nahsun)의 G.729 엔진은 ITU-T G.729 Annex A 와 Annex B 표준안과 호환성을 가지고 있습니다.

나선(nahsun)의 G.729 엔진은 음성과 데어터의 동시 전송, 특히 패킷망을 통한 전화와 같은 다양한 응용 분야에 사용될 수 있습니다.


지원 비트스트림 특성

  • 호환성
    • ITU-T G.729 Annex A 및 Annex B와 완전한 비트 일치 (bit-exact)
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 8 Kbps
  • 시간지연 :
    • 프레임 길이 : 10 ms
    • Lookahead : 5 ms
  • 채널 : 모노(1ch)
  • 지원 툴 : VAD(Voice Activity Detection), CNG(Comfort Noise Generation), DTX(Discontinuous Transmission Support)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 22.5 MHz (인코더) 6.8 MHz (디코더)
  • Code ROM : 60 KB
  • Constant Data ROM : 25 KB
  • RAM : 15 KB

QCELP

QCELP(Qualcomm Code Excited Linear Prediction)은 4개의 비트율에서 동작하며 입력 신호에 따라서 비트율을 동적으로 조절하는 가변비트율 코덱입니다. 전형적인 대화형 음성에서는 평균 비트율은 6.6 Kbps 정도이고 약간의 음질 저하를 위해 평균 비트율을 줄일 수도 있습니다.

나선(nahsun)의 QCELP-13 엔진은 광대역 CDMA 시스템용 TIA-EIA-IS-733 기술 요구사항과 호환성을 가지고 있으며 ARM 프로세서군에서 고정소수점 연산에 기반을 두고 최적화되어 구현되었습니다.

지원 비트스트림 특성

  • 호환성
    • TIA-EIA-IS-733 기술 요구사항
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 13.3/6.2/2.7/1.0 Kbps
  • 시간지연 :
    • 프레임 길이 : 20 ms
    • Lookahead : 5 ms
  • 채널 : 모노(1ch)
  • 지원 툴 : VAD(Voice Activity Detection), CNG(Comfort Noise Generation), DTX(Discontinuous Transmission Support)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 37.3 MHz (인코더) 10.6 MHz (디코더)
  • Code ROM : 60 KB
  • Constant Data ROM : 25 KB
  • RAM : 15 KB

G.723.1

G.723.1은 원래 일반적인 전화선(PSTN)을 통해 비디오와 음성을 전달하는 화상전화를 위해 표준이 재정되었고 ITU-T H.323과 H.324 오디오 및 화상회의/화상전화용 음성 코덱 표준입니다.

나선(nahsun)의 G.723.1 엔진은 ITU-T G.723.1 표준안과 호환성을 가지고 있습니다. 나선 랩스의 G.723.1 엔진은 멀티미디어 장치, 화상 전화, 무선 전화 및 화상회의 제품과 같은 다양한 응용 분야에 사용될 수 있습니다.


지원 비트스트림 특성

  • 호환성
    • ITU-T G.723.1 및 G.723.1A 과 완전한 비트 일치 (bit-exact)
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 5.3, 6.3 Kbps
  • 시간지연 :
    • 프레임 길이 : 30 ms
    • Lookahead : 7.5 ms
  • 채널 : 모노(1ch)
  • 지원 툴 : VAD(Voice Activity Detection), CNG(Comfort Noise Generation), DTX(Discontinuous Transmission Support)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 31.5 MHz (인코더) 4.1 MHz (디코더)
  • Code ROM : 55 KB
  • Constant Data ROM : 30 KB
  • RAM : 8.2 KB

More Articles ...