Speech Codecs

G.726

나선(nahsun)의 G.726은 ADPCM(적응 차분 PCM, Adaptive Differential Pulse Code Modulation)을 기반으로 G.721과 G.723을 포함해서 16, 24, 32 및 40 Kbps의 비트율에서 음성 압축 및 복원을 규정하는 ITU-T G.726 표준안과 호환성을 가지고 있습니다.

나선(nahsun)의 G.726은 음성 저장과 전화 응용 프로그램에서 오디오 및 음성 압축에 사용될 수 있습니다.


지원 비트스트림 특성

  • 호환성
    • ITU-T G.726 과 완전한 비트 일치 (bit-exact)
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 16, 24, 32, 40 Kbps
  • 시간지연 :
    • 프레임 길이 : 0.125 ms
    • Lookahead : 0 ms
  • 채널 : 모노(1ch)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 3.0
    • WinCE (Embedded Visual C)
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 5.5 MHz (인코더) 5.3 MHz (디코더)
  • Code ROM : 1.2 KB (인코더) 1.5 KB(디코더)
  • Constant Data ROM : 0.5 KB
  • RAM : 0.1 KB

G.729

나선(nahsun)의 G.729 엔진은 ITU-T G.729 Annex A 와 Annex B 표준안과 호환성을 가지고 있습니다.

나선(nahsun)의 G.729 엔진은 음성과 데어터의 동시 전송, 특히 패킷망을 통한 전화와 같은 다양한 응용 분야에 사용될 수 있습니다.


지원 비트스트림 특성

  • 호환성
    • ITU-T G.729 Annex A 및 Annex B와 완전한 비트 일치 (bit-exact)
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 8 Kbps
  • 시간지연 :
    • 프레임 길이 : 10 ms
    • Lookahead : 5 ms
  • 채널 : 모노(1ch)
  • 지원 툴 : VAD(Voice Activity Detection), CNG(Comfort Noise Generation), DTX(Discontinuous Transmission Support)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 22.5 MHz (인코더) 6.8 MHz (디코더)
  • Code ROM : 60 KB
  • Constant Data ROM : 25 KB
  • RAM : 15 KB

QCELP

QCELP(Qualcomm Code Excited Linear Prediction)은 4개의 비트율에서 동작하며 입력 신호에 따라서 비트율을 동적으로 조절하는 가변비트율 코덱입니다. 전형적인 대화형 음성에서는 평균 비트율은 6.6 Kbps 정도이고 약간의 음질 저하를 위해 평균 비트율을 줄일 수도 있습니다.

나선(nahsun)의 QCELP-13 엔진은 광대역 CDMA 시스템용 TIA-EIA-IS-733 기술 요구사항과 호환성을 가지고 있으며 ARM 프로세서군에서 고정소수점 연산에 기반을 두고 최적화되어 구현되었습니다.

지원 비트스트림 특성

  • 호환성
    • TIA-EIA-IS-733 기술 요구사항
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 13.3/6.2/2.7/1.0 Kbps
  • 시간지연 :
    • 프레임 길이 : 20 ms
    • Lookahead : 5 ms
  • 채널 : 모노(1ch)
  • 지원 툴 : VAD(Voice Activity Detection), CNG(Comfort Noise Generation), DTX(Discontinuous Transmission Support)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 37.3 MHz (인코더) 10.6 MHz (디코더)
  • Code ROM : 60 KB
  • Constant Data ROM : 25 KB
  • RAM : 15 KB

G.723.1

G.723.1은 원래 일반적인 전화선(PSTN)을 통해 비디오와 음성을 전달하는 화상전화를 위해 표준이 재정되었고 ITU-T H.323과 H.324 오디오 및 화상회의/화상전화용 음성 코덱 표준입니다.

나선(nahsun)의 G.723.1 엔진은 ITU-T G.723.1 표준안과 호환성을 가지고 있습니다. 나선 랩스의 G.723.1 엔진은 멀티미디어 장치, 화상 전화, 무선 전화 및 화상회의 제품과 같은 다양한 응용 분야에 사용될 수 있습니다.


지원 비트스트림 특성

  • 호환성
    • ITU-T G.723.1 및 G.723.1A 과 완전한 비트 일치 (bit-exact)
  • 샘플링 주파수 : 8 KHz
  • 비트율 : 5.3, 6.3 Kbps
  • 시간지연 :
    • 프레임 길이 : 30 ms
    • Lookahead : 7.5 ms
  • 채널 : 모노(1ch)
  • 지원 툴 : VAD(Voice Activity Detection), CNG(Comfort Noise Generation), DTX(Discontinuous Transmission Support)

지원 소프트웨어 특성

  • 재진입이 가능한(reentrant) 코드. 다중스레드(multithread)와 동적인 메모리 할당.
  • 지원되는 라이브러리 포맷
    • ADS 1.2
    • RealView 4.0
    • WinCE (Embedded Visual C)
    • Android
    • iOS
  • Data 메모리 : 실시간으로 할당 가능
  • API : C에서 호출이 가능한 API

코덱 성능 및 메모리 사양 (ARM9E 기준)

  • 복잡도 : 31.5 MHz (인코더) 4.1 MHz (디코더)
  • Code ROM : 55 KB
  • Constant Data ROM : 30 KB
  • RAM : 8.2 KB

More Articles ...