데이터 베이스 MySQL 튜토리얼 常用的ITU Speech Codec大全(G.711,G.722.1,G.722.2,G.723.1,G.

常用的ITU Speech Codec大全(G.711,G.722.1,G.722.2,G.723.1,G.

Jun 07, 2016 pm 03:42 PM
itu speech 백과 사전 용적

总结了常用的ITU Speech Codec,谨供大家学习参考: 1、 G.711: Pulse code modulation (PCM) of voice frequencies 编码类型:压扩PCM 编码速率:64Kbps 理论延时:处理一个样点的时间(1/8000秒=0.125毫秒); 音质:长途质量; 优点:算法复杂度低,压缩

总结了常用的ITU Speech Codec,谨供大家学习参考:

1、G.711: Pulse code modulation (PCM) of voice frequencies

 

编码类型:压扩PCM
编码速率:64Kbps

理论延时:处理一个样点的时间(1/8000秒=0.125毫秒);

音质:长途质量;
优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)
缺点:占用的带宽较高
应用领域:voip,PSTN 电话网络
版税方式:Free
备注:

     70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。

     G.711是最基本的一种编码方法,俗称PCM,采用μ-law(主要北美地区使用)和A-law(其它地区)两种非线性量化方法进行压缩。说它“基本”是因为一方面PCM算法非常简单,很多ADC硬件的输入输出就直接支持PCM格式;另一方面PCM格式在通信系统中往往需要进一步压缩,因此它是其它语音编码算法的输入源。

 

 

2、G.722.1: Low-complexity coding at 24 and 32 kbit/s for hands-free operation in systems with low frame loss

编码类型:变换域Audio coding
编码速率:24Kbps、32Kbps;(其实可以实现更多码率,以8kbps递增码率,另外还有32kHz采样的更高码率版本);

理论延时:40ms(20ms frame size + 20ms lookhead)

音质:低码率时优于MP3、WMA等音频算法,详细可参考Polycom网站;
优点:算法复杂度低,小于 5.5wMOPS,相对于MP3,WMA等算法在低码率时音质要好;

缺点:对于speech而言,音质没有CELP模型编码器响亮;另外,48kbps以上音质变化不大;
应用领域:电视会议、电话会议和互联网流应用;
版税方式:Free
备注:   

      G.722.1是由Polycom提出的一套低码率低复杂度的宽带语音编码算法,主要采用了变换域编码方法,因此可以对语音(300~4000Hz)和7kHz以内的音乐进行编码,采样率为16kHz,其32kbps码率的重建语音质量相当于64 kbps G.722 SB-ADPCM。在实际的应用中,本算法在低码率时其音质要高于MP3等音频算法,再加上算法低复杂度非常适合嵌入式平台通信、存储应用。最后,它的附录C中提供了32kHz采样的14k带宽的音频编码方案,进一步提高了音质。

 

 

3、G.722.2: Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)

编码类型:ACELP
编码速率:6.6Kbps~23.85Kbps;

理论延时:25ms(20ms frame size + 1/4 subframe size)

音质:高质量相对于窄带语音;
优点:高质量、多码率处理和自适应特性;

缺点:复杂度太高;
应用领域:3GPP 无线通信;
版税方式:单一授权
备注: 

      AMR Wideband (AMR-WB) 是迄今为止唯一的针对无线 (3GPP) 和有线 (ITU-T Recommendation G.722.2) 应用而标准化的语音编解码器。因此,它也是宽频语音应用的理想编解码器,因为它可以确保聚合有线/无线网络的兼容性。AMR-WB 是被 3GPP 采用的唯一宽频语音标准,并且,在具备宽频语音(采样频率 16 kHz)支持的情况下,它还是 GSM 和 WCDMA 网络中用于宽频语音和多媒体服务的指定编解码器,这些服务包括多媒体信息服务 (MMS)、IMS 信息和呈现服务、分组交换流媒体业务 (PSS)、多媒体广播/组播业务 (MBMS) 以及无线一键通业务 (PoC)。 其他应用包括 VoIP、会议、Wi-Fi 电话、卫星电话、视频电话、互联网流式音频,等等。

4、G.723.1: Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s

编码类型:ACELP、MP-MLQ
编码速率:5.3Kbps、6.3Kbps;

理论延时:37.5ms(30ms frame size + 1/4 subframe size)

音质:小于长途质量,MOS 3.7;
优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定,避免了载波信号的时通时断。

缺点:声音质量一般;
应用领域:VOIP;
版税方式:Free
备注:

 G.723.1是一个双速率的语音编码器,是 ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法;
其目标应用系统包括H.323、H.324等多媒体通信系统,目前该算法已成为IP电话系统中的必选算法之一;编码器首先对语音信号进行传统电话带宽的滤波(基于G.712),再对语音信号用传统8000-Hz速率进行抽样(基于G.711),并变换成16 bit线性PCM码作为该编码器的输入;在解码器中对输出进行逆操作来重构语音信号;高速率编码器使用多脉冲最大似然量化(MP-MLQ),低速率编码器使用代数码激励线性预测(ACELP)方法,编码器和解码器都必须支持此两种速率,并能够在帧间对两种速率进行转换;
此系统同样能够对音乐和其他音频信号进行压缩和解压缩,但它对语音信号来说是最优的;采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外,这种技术使发信机的调制解调器保持连续工作,并且避免了载波信号的时通时断。

 

5、G.726: 40, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM)

编码类型:ADPCM
编码速率:40Kbps、32Kbps、24Kbps、16Kbps;

理论延时:0.125ms(8kHz sample rate)

音质:32kbps,长途质量;
优点:计算简单,带宽是G.711的一半而音质接近;

缺点:占有带宽相对还是较高;
应用领域:VOIP,电话通信网络;
版税方式:free
备注:

     G.726是G.721和G.723的联合,同时增加了16kbps ADPCM,但最为常用的方式是 32 kbit/s。G.726是G.711带宽的一半,所以可将网络的可利用空间增加了一倍。G.726具体规定了一个 64 kbpsA-law 或 μ-law PCM 信号是如何被转化为40, 32, 24或16 kbps 的 ADPCM 通道的。在这些通道中,24和16 kbps 的通道被用于数字电路倍增设备(DCME)中的语音传输,而40 kbps 通道则被用于 DCME 中的数据解调信号(尤其是4800 kbps 或更高的调制解调器)。

 

6、G.728: Coding of speech at 16 kbit/s using low-delay code excited linear prediction

编码类型:CELP
编码速率:16Kbps;

理论延时:0.625ms(8kHz sample rate)

音质:长途质量;
优点:低延时、抗误码能力非常强;

缺点:比其他的编码器都复杂;
应用领域:IP电话,数字移动通信、卫星通信;
版税方式:free
备注:

    G.728 低延时码激励线性预测编码(LD-CELP)是世界上第一个标准化参数语音CODEC,以CELP算法为基础,采用后向自适应线性预测、50阶合成滤波和短激励矢量等改进方法,达到了低延时的目的。 

 

7、G.729: Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)

编码类型:CS-CELP
编码速率:8Kbps;

理论延时:15ms(10ms frame size + 1/2 subframe lookhead)

音质:长途质量;
优点:低码率,高音质,应用广泛;

缺点:算法复杂度较高;
应用领域:VOIP;
版税方式:free
备注:

      国际电信联盟(ITU-T)于1995年11月正式通过了G.729。 ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP),它是当前较新的一种语音压缩标准。G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法。这种算法综合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术。G.729编码器是为低时延应用设计的,它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得G.729产生的点到点的时延为25ms,比特率为8 kbps。
96年ITU-T又制定了G.729的简化方案G.729A,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是G.729A。

 

8、G.729.1: G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729.

编码类型:CELP、TDBWE
编码速率:8Kbps~32kbps,12个码率;

理论延时:48.9375ms;

音质:未知;
优点:多码率,可与G.729、G.729A和G.729B实现完全操作;

缺点:应用未成熟;
应用领域:VOIP;
版税方式:有专利
备注: 

G.729.1是一个可与G.729,G.729A 和G.729B 互操作的8-32 kbit/s 可分级宽带语音和音频编解码算法。G.729EV 编解码器输出信号在 8 kbit/s 和12 kbit/s 采样频率上带宽为50-4000 Hz,在14-32 kbit/s 采样频率上带宽为50-7000 Hz。在8 kbit/s,G.729EV 可以与G.729、G.729 附件A 和G.729 附件B 实现完全互操作。因此可预见在现有基于G.729 的VoIP 基础设施中将得到有效的部署。编解码器工作于20 ms 帧,算法时延为48.9375 ms。默认情况下,编码器输入和解码器输出信号采样频率为16 kHz。编码器生成一个嵌入式码流,它分为12 层结构,分别对应于 8-32 kbit/s 内12 个可用比特率。在解码器端或通信系统任一组成部分都可以将码流截断,从而无需带外信令便可以将比特速率“实时”调整至理想值。
基本算法基于三阶段编码结构:低频带(50-4000 Hz)嵌入式码激励线性估计(CELP)编解码,高频带(4000-7000 Hz)时域带宽扩展(TDBWE)参量编解码,以及通过被称为时域混叠消除(TDAC)的估计变换编解码技术实现的全频带增强功能。

 

 

参考资料:

1、http://wz.csdn.net/foobarren/

2、http://www.cnblogs.com/huaping-audio/archive/2008/06/19/1224287.html

3、http://kware.blogbus.com/tag/Codec/

4、http://www.cppblog.com/gtwdaizi/archive/2008/04/19/41884.html#47591

5、http://www.ctiforum.com/news/2009news/07/news07242.htm

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

지리정보학 전공자는 어떤 컴퓨터를 선택해야 할까요? 지리정보학 전공자는 어떤 컴퓨터를 선택해야 할까요? Jan 13, 2024 am 08:00 AM

지리정보학을 전공하는 학생들에게 적합한 컴퓨터 추천 1. 권장사항 2. 지리정보학을 전공하는 학생들은 대용량의 지리 데이터를 처리하고 복잡한 지리정보 분석을 수행해야 하므로 강력한 성능을 갖춘 컴퓨터가 필요합니다. 높은 구성을 갖춘 컴퓨터는 더 빠른 처리 속도와 더 큰 저장 공간을 제공할 수 있으며 전문적인 요구 사항을 더 잘 충족할 수 있습니다. 3. 데이터 처리 및 분석의 효율성을 향상시킬 수 있는 고성능 프로세서와 대용량 메모리가 장착된 컴퓨터를 선택하는 것이 좋습니다. 또한 더 큰 저장 공간과 고해상도 디스플레이를 갖춘 컴퓨터를 선택하면 지리 데이터와 결과를 더 잘 표시할 수 있습니다. 또한, 지리정보학을 전공하는 학생들은 지리정보시스템(GIS) 소프트웨어를 개발하고 프로그래밍해야 할 수도 있다는 점을 고려하여 그래픽 처리 지원이 더 나은 컴퓨터를 선택하세요.

i5-13490F 프로세서 사양 및 성능에 대한 종합적인 검토 i5-13490F 프로세서 사양 및 성능에 대한 종합적인 검토 Jan 02, 2024 pm 06:12 PM

i5-13490F는 최근 출시된 CPU로, 13400F에 비해 성능이 약간 향상되었으며, 전력 소모가 적고 성능도 뛰어납니다. i5-13490F 프로세서 매개변수에 대한 종합 평가: 1. i5-13490F 프로세서의 성능은 i5-13400F에 비해 0.2GHz 향상되었으며 레벨 3 캐시는 24MB로 증가했습니다. 2. 싱글 코어 성능과 레벨 3 캐시의 향상은 게이머들에게 성능 면에서 도움이 될 것입니다. 3. 2K 해상도에서는 i5-13490F가 i5-13400F보다 게임 성능이 약간 더 좋습니다. i7-13490F 매개변수 평가 전체 성능 벤치마크: CPU-z의 벤치마크 점수가 단일에 도달했습니다.

Windows 명령 프롬프트에 대한 전체 가이드 Windows 명령 프롬프트에 대한 전체 가이드 Feb 20, 2024 pm 02:09 PM

WindowsCMD(Windows 명령 프롬프트)는 Windows 운영 체제의 명령줄 도구입니다. 명령줄을 통해 작동하며 많은 시스템 관리, 파일 관리, 네트워크 관리 및 기타 작업을 완료할 수 있습니다. 이 기사에서는 일반적으로 사용되는 명령과 해당 기능을 포함하여 Windows CMD 명령의 전체 목록을 독자에게 소개합니다. 1. 일반적으로 사용되는 명령 cd 명령: 현재 디렉터리를 전환하는 데 사용됩니다. dir 명령: 현재 디렉터리의 파일과 하위 디렉터리를 표시합니다. mkdir 명령: 새 디렉터리를 만듭니다. rmd

Python 타사 라이브러리 gTTs/pyttsx3/speech를 사용하는 방법 Python 타사 라이브러리 gTTs/pyttsx3/speech를 사용하는 방법 May 12, 2023 pm 06:43 PM

Python text-to-speech (연구 및 완성된 기능) 프로젝트 요구로 인해 텍스트를 음성으로 변환해야 하는데 첫 번째 단계는 음성 합성 기술이 무엇인지 연구하는 것입니다. TTS로. 텍스트를 음성으로 변환하는 기술로, 컴퓨터가 인간의 입을 흉내내어 표현하고 싶은 내용을 다양한 음색으로 표현할 수 있게 해줍니다. TTS는 신경망 설계를 통해 텍스트를 자연스러운 음성 스트림으로 지능적으로 변환할 수 있습니다. 시각 장애가 있는 환자의 사용을 크게 촉진하고 텍스트의 가독성도 향상시킵니다. TTS 애플리케이션에는 음성 기반 하드웨어와 소리 감지 시스템이 포함되며 음성 인식 프로그램과 함께 사용되는 경우가 많습니다. 이제 많은 제조업체가 자신의 목소리를 냈습니다.

완전한 가이드: Django 버전 찾기 완전한 가이드: Django 버전 찾기 Jan 04, 2024 am 10:14 AM

특정 코드 예제가 필요한 Django 버전 쿼리 방법의 전체 목록 개요: Django는 웹 개발에 널리 사용되는 오픈 소스 웹 애플리케이션 프레임워크입니다. 간단하고 유연하며 효율적이며 개발자가 강력한 웹 애플리케이션을 신속하게 구축하는 데 도움이 될 수 있습니다. 개발자에게는 현재 사용되는 Django 버전과 관련 쿼리 방법을 이해하는 것이 매우 중요합니다. 이 기사에서는 Django 버전 쿼리 방법을 자세히 소개하고 독자가 이를 더 잘 적용할 수 있도록 구체적인 코드 예제를 제공합니다.

완전한 PHP 함수 라이브러리 완전한 PHP 함수 라이브러리 Jun 23, 2023 am 10:40 AM

PHP는 개발자가 웹 애플리케이션을 쉽게 작성할 수 있도록 하는 많은 내장 기능과 확장 기능을 갖춘 인기 있는 웹 프로그래밍 언어입니다. 이 기사에서는 내장 함수와 타사 확장 기능이 모두 포함된 일부 PHP 함수 라이브러리를 소개합니다. 1. 내장 함수 라이브러리 문자열 연산 함수 라이브러리 PHP의 문자열 함수 라이브러리에는 문자열 가로채기, 대체, 일치, 비교 등 일반적으로 사용되는 연산 함수가 포함되어 있습니다. 일반적으로 사용되는 함수: strlen($str): 문자열의 길이를 반환합니다. 하위 문자열($str,

2024년 가장 인기 있는 벨소리 모음(인기있는 벨소리 트랙이 당신을 개성있게 만들어줍니다) 2024년 가장 인기 있는 벨소리 모음(인기있는 벨소리 트랙이 당신을 개성있게 만들어줍니다) May 31, 2024 pm 10:34 PM

수신 전화 벨소리는 일상 생활에서 중요한 역할을 하며 휴대폰의 필수 기능 중 하나입니다. 우리에게 더 재미 있고 개인화된 선택을 제공하는 새로운 벨소리 트랙이 2023년에 휴대폰에 추가될 예정이며, 음악은 지속적으로 업데이트되고 변경됩니다. 귀하의 전화 벨소리를 독특하게 만드십시오. 이 기사에서는 2023년에 가장 인기 있는 전화 벨소리를 선택합니다. 오프닝 톤 - 즉시 열광적인 상태로 만드는 것은 전화를 받을 때 긍정적인 마음을 갖도록 상기시키는 데 적합합니다. 이 유형의 벨소리는 활력, 열정 및 독특한 리듬이 특징입니다. 행복하고 낙관적인 - 삶의 아름다움을 느끼고 긍정적인 마음을 갖게 해줍니다. 이 벨소리는 주로 명랑하고 활력이 넘치며 활발합니다. 로맨틱한 분위기 - 당신을 위한 달콤한 전화 알림

한 박사의 시스템 종합 가이드 한 박사의 시스템 종합 가이드 Dec 31, 2023 pm 07:29 PM

Dr. Han의 시스템 컬렉션에는 사용자가 선택할 수 있는 다양한 버전이 있습니다. win10 또는 win11을 작동하려는 경우 해당 버전을 다운로드할 수 있으며 일부 내장 소프트웨어 및 드라이버와 같은 많은 기능이 최적화되었습니다. 등은 초보자에게 더 적합합니다. 한 박사의 전체 시스템 다운로드는 시스템 이미지 win11 버전 win10 버전 win7 버전의 원클릭 설치를 권장합니다. 1. 시스템 구성 요구 사항 목록 1. 프로세서: 최소 기본 주파수 요구 사항은 233MHz이며, 300MHz 이상 권장 2. 메모리: 최소 64MB. 128MB 이상 권장 3. 그래픽 카드: SuperVGA(800x600) 최소 요구 사항 4. 하드 드라이브 남은 공간: 1.5GB 최소 요구 사항, 1.5G 권장

See all articles