首页 数据库 mysql教程 常用的ITU Speech Codec大全(G.711,G.722.1,G.722.2,G.723.1,G.

常用的ITU Speech Codec大全(G.711,G.722.1,G.722.2,G.723.1,G.

Jun 07, 2016 pm 03:42 PM
itu speech 大全 实际的

总结了常用的ITU Speech Codec,谨供大家学习参考: 1、 G.711: Pulse code modulation (PCM) of voice frequencies 编码类型:压扩PCM 编码速率:64Kbps 理论延时:处理一个样点的时间(1/8000秒=0.125毫秒); 音质:长途质量; 优点:算法复杂度低,压缩

总结了常用的ITU Speech Codec,谨供大家学习参考:

1、G.711: Pulse code modulation (PCM) of voice frequencies

 

编码类型:压扩PCM
编码速率:64Kbps

理论延时:处理一个样点的时间(1/8000秒=0.125毫秒);

音质:长途质量;
优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)
缺点:占用的带宽较高
应用领域:voip,PSTN 电话网络
版税方式:Free
备注:

     70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。

     G.711是最基本的一种编码方法,俗称PCM,采用μ-law(主要北美地区使用)和A-law(其它地区)两种非线性量化方法进行压缩。说它“基本”是因为一方面PCM算法非常简单,很多ADC硬件的输入输出就直接支持PCM格式;另一方面PCM格式在通信系统中往往需要进一步压缩,因此它是其它语音编码算法的输入源。

 

 

2、G.722.1: Low-complexity coding at 24 and 32 kbit/s for hands-free operation in systems with low frame loss

编码类型:变换域Audio coding
编码速率:24Kbps、32Kbps;(其实可以实现更多码率,以8kbps递增码率,另外还有32kHz采样的更高码率版本);

理论延时:40ms(20ms frame size + 20ms lookhead)

音质:低码率时优于MP3、WMA等音频算法,详细可参考Polycom网站;
优点:算法复杂度低,小于 5.5wMOPS,相对于MP3,WMA等算法在低码率时音质要好;

缺点:对于speech而言,音质没有CELP模型编码器响亮;另外,48kbps以上音质变化不大;
应用领域:电视会议、电话会议和互联网流应用;
版税方式:Free
备注:   

      G.722.1是由Polycom提出的一套低码率低复杂度的宽带语音编码算法,主要采用了变换域编码方法,因此可以对语音(300~4000Hz)和7kHz以内的音乐进行编码,采样率为16kHz,其32kbps码率的重建语音质量相当于64 kbps G.722 SB-ADPCM。在实际的应用中,本算法在低码率时其音质要高于MP3等音频算法,再加上算法低复杂度非常适合嵌入式平台通信、存储应用。最后,它的附录C中提供了32kHz采样的14k带宽的音频编码方案,进一步提高了音质。

 

 

3、G.722.2: Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)

编码类型:ACELP
编码速率:6.6Kbps~23.85Kbps;

理论延时:25ms(20ms frame size + 1/4 subframe size)

音质:高质量相对于窄带语音;
优点:高质量、多码率处理和自适应特性;

缺点:复杂度太高;
应用领域:3GPP 无线通信;
版税方式:单一授权
备注: 

      AMR Wideband (AMR-WB) 是迄今为止唯一的针对无线 (3GPP) 和有线 (ITU-T Recommendation G.722.2) 应用而标准化的语音编解码器。因此,它也是宽频语音应用的理想编解码器,因为它可以确保聚合有线/无线网络的兼容性。AMR-WB 是被 3GPP 采用的唯一宽频语音标准,并且,在具备宽频语音(采样频率 16 kHz)支持的情况下,它还是 GSM 和 WCDMA 网络中用于宽频语音和多媒体服务的指定编解码器,这些服务包括多媒体信息服务 (MMS)、IMS 信息和呈现服务、分组交换流媒体业务 (PSS)、多媒体广播/组播业务 (MBMS) 以及无线一键通业务 (PoC)。 其他应用包括 VoIP、会议、Wi-Fi 电话、卫星电话、视频电话、互联网流式音频,等等。

4、G.723.1: Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s

编码类型:ACELP、MP-MLQ
编码速率:5.3Kbps、6.3Kbps;

理论延时:37.5ms(30ms frame size + 1/4 subframe size)

音质:小于长途质量,MOS 3.7;
优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定,避免了载波信号的时通时断。

缺点:声音质量一般;
应用领域:VOIP;
版税方式:Free
备注:

 G.723.1是一个双速率的语音编码器,是 ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法;
其目标应用系统包括H.323、H.324等多媒体通信系统,目前该算法已成为IP电话系统中的必选算法之一;编码器首先对语音信号进行传统电话带宽的滤波(基于G.712),再对语音信号用传统8000-Hz速率进行抽样(基于G.711),并变换成16 bit线性PCM码作为该编码器的输入;在解码器中对输出进行逆操作来重构语音信号;高速率编码器使用多脉冲最大似然量化(MP-MLQ),低速率编码器使用代数码激励线性预测(ACELP)方法,编码器和解码器都必须支持此两种速率,并能够在帧间对两种速率进行转换;
此系统同样能够对音乐和其他音频信号进行压缩和解压缩,但它对语音信号来说是最优的;采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外,这种技术使发信机的调制解调器保持连续工作,并且避免了载波信号的时通时断。

 

5、G.726: 40, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM)

编码类型:ADPCM
编码速率:40Kbps、32Kbps、24Kbps、16Kbps;

理论延时:0.125ms(8kHz sample rate)

音质:32kbps,长途质量;
优点:计算简单,带宽是G.711的一半而音质接近;

缺点:占有带宽相对还是较高;
应用领域:VOIP,电话通信网络;
版税方式:free
备注:

     G.726是G.721和G.723的联合,同时增加了16kbps ADPCM,但最为常用的方式是 32 kbit/s。G.726是G.711带宽的一半,所以可将网络的可利用空间增加了一倍。G.726具体规定了一个 64 kbpsA-law 或 μ-law PCM 信号是如何被转化为40, 32, 24或16 kbps 的 ADPCM 通道的。在这些通道中,24和16 kbps 的通道被用于数字电路倍增设备(DCME)中的语音传输,而40 kbps 通道则被用于 DCME 中的数据解调信号(尤其是4800 kbps 或更高的调制解调器)。

 

6、G.728: Coding of speech at 16 kbit/s using low-delay code excited linear prediction

编码类型:CELP
编码速率:16Kbps;

理论延时:0.625ms(8kHz sample rate)

音质:长途质量;
优点:低延时、抗误码能力非常强;

缺点:比其他的编码器都复杂;
应用领域:IP电话,数字移动通信、卫星通信;
版税方式:free
备注:

    G.728 低延时码激励线性预测编码(LD-CELP)是世界上第一个标准化参数语音CODEC,以CELP算法为基础,采用后向自适应线性预测、50阶合成滤波和短激励矢量等改进方法,达到了低延时的目的。 

 

7、G.729: Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)

编码类型:CS-CELP
编码速率:8Kbps;

理论延时:15ms(10ms frame size + 1/2 subframe lookhead)

音质:长途质量;
优点:低码率,高音质,应用广泛;

缺点:算法复杂度较高;
应用领域:VOIP;
版税方式:free
备注:

      国际电信联盟(ITU-T)于1995年11月正式通过了G.729。 ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP),它是当前较新的一种语音压缩标准。G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法。这种算法综合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术。G.729编码器是为低时延应用设计的,它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得G.729产生的点到点的时延为25ms,比特率为8 kbps。
96年ITU-T又制定了G.729的简化方案G.729A,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是G.729A。

 

8、G.729.1: G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729.

编码类型:CELP、TDBWE
编码速率:8Kbps~32kbps,12个码率;

理论延时:48.9375ms;

音质:未知;
优点:多码率,可与G.729、G.729A和G.729B实现完全操作;

缺点:应用未成熟;
应用领域:VOIP;
版税方式:有专利
备注: 

G.729.1是一个可与G.729,G.729A 和G.729B 互操作的8-32 kbit/s 可分级宽带语音和音频编解码算法。G.729EV 编解码器输出信号在 8 kbit/s 和12 kbit/s 采样频率上带宽为50-4000 Hz,在14-32 kbit/s 采样频率上带宽为50-7000 Hz。在8 kbit/s,G.729EV 可以与G.729、G.729 附件A 和G.729 附件B 实现完全互操作。因此可预见在现有基于G.729 的VoIP 基础设施中将得到有效的部署。编解码器工作于20 ms 帧,算法时延为48.9375 ms。默认情况下,编码器输入和解码器输出信号采样频率为16 kHz。编码器生成一个嵌入式码流,它分为12 层结构,分别对应于 8-32 kbit/s 内12 个可用比特率。在解码器端或通信系统任一组成部分都可以将码流截断,从而无需带外信令便可以将比特速率“实时”调整至理想值。
基本算法基于三阶段编码结构:低频带(50-4000 Hz)嵌入式码激励线性估计(CELP)编解码,高频带(4000-7000 Hz)时域带宽扩展(TDBWE)参量编解码,以及通过被称为时域混叠消除(TDAC)的估计变换编解码技术实现的全频带增强功能。

 

 

参考资料:

1、http://wz.csdn.net/foobarren/

2、http://www.cnblogs.com/huaping-audio/archive/2008/06/19/1224287.html

3、http://kware.blogbus.com/tag/Codec/

4、http://www.cppblog.com/gtwdaizi/archive/2008/04/19/41884.html#47591

5、http://www.ctiforum.com/news/2009news/07/news07242.htm

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

地理信息科学专业学生应选择哪种电脑 地理信息科学专业学生应选择哪种电脑 Jan 13, 2024 am 08:00 AM

推荐适合地理信息科学专业学生用的电脑1.推荐2.地理信息科学专业学生需要处理大量的地理数据和进行复杂的地理信息分析,因此需要一台性能较强的电脑。一台配置高的电脑可以提供更快的处理速度和更大的存储空间,能够更好地满足专业需求。3.推荐选择一台配备高性能处理器和大容量内存的电脑,这样可以提高数据处理和分析的效率。此外,选择一台具备较大存储空间和高分辨率显示屏的电脑也能更好地展示地理数据和结果。另外,考虑到地理信息科学专业学生可能需要进行地理信息系统(GIS)软件的开发和编程,选择一台支持较好的图形处

全面评测i5-13490F处理器的规格和性能 全面评测i5-13490F处理器的规格和性能 Jan 02, 2024 pm 06:12 PM

i5-13490F是仅供中国大陆销售的一款CPU,最近刚刚上线其性能与13400F略有提升,在游戏上的表现非常不错,为我们带来了低功耗高性能。i5-13490F处理器参数评测大全:1、i5-13490F处理器比对i5-13400F性能提高了0.2GHz;在三级缓存上提高至24MB。2、单核性能以及三级缓存的提升,对游戏玩家来说是有性能上的帮助的。3、在2K分辨率下,i5-13490F对比i5-13400F在游戏上的表现略强一些。i7-13490F参数评测大全性能跑分:CPU-z的跑分成绩达到了单

完整的Windows命令提示符指南 完整的Windows命令提示符指南 Feb 20, 2024 pm 02:09 PM

WindowsCMD(即Windows命令提示符)是Windows操作系统中的一种命令行工具。它通过命令行的方式进行操作,可以完成许多系统管理、文件管理、网络管理等任务。本文将为读者介绍WindowsCMD命令的大全,包括常用命令和其功能。一、常用命令cd命令:用于切换当前目录。dir命令:显示当前目录下的文件和子目录。mkdir命令:创建一个新目录。rmd

Python第三方库gTTs/pyttsx3/speech怎么使用 Python第三方库gTTs/pyttsx3/speech怎么使用 May 12, 2023 pm 06:43 PM

Python文字转语音(调研&成品函数)由于项目需要,我需要将文字转换为语音,那么第一步就要进行调研什么是语音合成技术?语音合成(texttospeech),简称TTS。是将文字转化为语音的一种技术,是让计算机模拟人类的嘴巴,通过不同的音色说出想表达的内容,是人机对话的一部分。TTS可以通过神经网络的设计,把文字智能地转化为自然语音流。极大的方便了视障患者的使用,也提升了文本的可读性。TTS应用包括语音驱动的硬件以及声音敏感系统,并常与声音识别程序一起使用。现在许多厂家都推出了自己的语音

完整指南:查找Django的版本 完整指南:查找Django的版本 Jan 04, 2024 am 10:14 AM

Django版本查询方法大全,需要具体代码示例概述:Django是一个开放源代码的Web应用程序框架,被广泛应用于Web开发。它具有简单、灵活、高效的特点,能够帮助开发者快速构建功能强大的Web应用。而对于开发者来说,了解当前使用的Django版本以及相关的查询方法是非常重要的。本文将详细介绍Django版本查询的方法和给出具体的代码示例,帮助读者更好地应用

PHP函数库大全 PHP函数库大全 Jun 23, 2023 am 10:40 AM

PHP是一种流行的Web编程语言,它有许多内置函数和扩展可以让开发人员轻松地编写Web应用程序。在本文中,我们将介绍一些PHP函数库,这些函数库既有内置的函数,也有第三方扩展。一、内置函数库字符串操作函数库PHP中的字符串函数库包括常用操作函数,例如字符串截取、替换、匹配、比较等等。常用函数:strlen($str):返回字符串长度。substr($str,

2024最火来电铃声歌曲大全(炙手可热的铃声曲目让你个性十足) 2024最火来电铃声歌曲大全(炙手可热的铃声曲目让你个性十足) May 31, 2024 pm 10:34 PM

来电铃声在我们日常生活中扮演着重要的角色,作为手机的必备功能之一。给我们带来更多的乐趣和个性选择,2023年将会有一批新的来电铃声曲目走进我们的手机,随着音乐的不断更新和变化。让你的来电铃声与众不同,本文将为大家精选出2023年最火的来电铃声曲目大全。开场白——让你瞬间进入热情状态适合用于提醒自己接听电话时进入积极,这类来电铃声以活力四溢,热情的状态、节奏鲜明为特点。快乐向上——让你感受到生活的美好带给你积极向上、这类来电铃声以欢快,充满活力的心情,轻快的节奏为主。浪漫情调——给你甜蜜的电话提醒

韩博士系统综合指南 韩博士系统综合指南 Dec 31, 2023 pm 07:29 PM

韩博士系统大全里面有着非常多的版本可以给用户进行选择,不管是想要操作win10还是win11,都有对应的可以选择下载,而且还优化了不少的功能,比如说一些自带的软件和驱动等等,会更加地适合新手。韩博士系统大全下载推荐一键装机系统镜像win11版本win10版本win7版本一、系统配置要求一览1、处理器:主频最低要求是233MHz,推荐300MHz或更高2、内存:最低要64MB。推荐128MB或更高3、显卡:最低要求SuperVGA(800x600)4、硬盘剩余空间:最低要求1.5GB,推荐1.5G

See all articles