常用的ITU Speech Codec大全(G.711,G.722.1,G.722.2,G.723.1,G.
总结了常用的ITU Speech Codec,谨供大家学习参考: 1、 G.711: Pulse code modulation (PCM) of voice frequencies 编码类型:压扩PCM 编码速率:64Kbps 理论延时:处理一个样点的时间(1/8000秒=0.125毫秒); 音质:长途质量; 优点:算法复杂度低,压缩
总结了常用的ITU Speech Codec,谨供大家学习参考:
1、G.711: Pulse code modulation (PCM) of voice frequencies
编码类型:压扩PCM
编码速率:64Kbps
理论延时:处理一个样点的时间(1/8000秒=0.125毫秒);
音质:长途质量;
优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)
缺点:占用的带宽较高
应用领域:voip,PSTN 电话网络
版税方式:Free
备注:
70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。
G.711是最基本的一种编码方法,俗称PCM,采用μ-law(主要北美地区使用)和A-law(其它地区)两种非线性量化方法进行压缩。说它“基本”是因为一方面PCM算法非常简单,很多ADC硬件的输入输出就直接支持PCM格式;另一方面PCM格式在通信系统中往往需要进一步压缩,因此它是其它语音编码算法的输入源。
2、G.722.1: Low-complexity coding at 24 and 32 kbit/s for hands-free operation in systems with low frame loss
编码类型:变换域Audio coding
编码速率:24Kbps、32Kbps;(其实可以实现更多码率,以8kbps递增码率,另外还有32kHz采样的更高码率版本);
理论延时:40ms(20ms frame size + 20ms lookhead)
音质:低码率时优于MP3、WMA等音频算法,详细可参考Polycom网站;
优点:算法复杂度低,小于 5.5wMOPS,相对于MP3,WMA等算法在低码率时音质要好;
缺点:对于speech而言,音质没有CELP模型编码器响亮;另外,48kbps以上音质变化不大;
应用领域:电视会议、电话会议和互联网流应用;
版税方式:Free
备注:
G.722.1是由Polycom提出的一套低码率低复杂度的宽带语音编码算法,主要采用了变换域编码方法,因此可以对语音(300~4000Hz)和7kHz以内的音乐进行编码,采样率为16kHz,其32kbps码率的重建语音质量相当于64 kbps G.722 SB-ADPCM。在实际的应用中,本算法在低码率时其音质要高于MP3等音频算法,再加上算法低复杂度非常适合嵌入式平台通信、存储应用。最后,它的附录C中提供了32kHz采样的14k带宽的音频编码方案,进一步提高了音质。
3、G.722.2: Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)
编码类型:ACELP
编码速率:6.6Kbps~23.85Kbps;
理论延时:25ms(20ms frame size + 1/4 subframe size)
音质:高质量相对于窄带语音;
优点:高质量、多码率处理和自适应特性;
缺点:复杂度太高;
应用领域:3GPP 无线通信;
版税方式:单一授权
备注:
AMR Wideband (AMR-WB) 是迄今为止唯一的针对无线 (3GPP) 和有线 (ITU-T Recommendation G.722.2) 应用而标准化的语音编解码器。因此,它也是宽频语音应用的理想编解码器,因为它可以确保聚合有线/无线网络的兼容性。AMR-WB 是被 3GPP 采用的唯一宽频语音标准,并且,在具备宽频语音(采样频率 16 kHz)支持的情况下,它还是 GSM 和 WCDMA 网络中用于宽频语音和多媒体服务的指定编解码器,这些服务包括多媒体信息服务 (MMS)、IMS 信息和呈现服务、分组交换流媒体业务 (PSS)、多媒体广播/组播业务 (MBMS) 以及无线一键通业务 (PoC)。 其他应用包括 VoIP、会议、Wi-Fi 电话、卫星电话、视频电话、互联网流式音频,等等。
4、G.723.1: Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s
编码类型:ACELP、MP-MLQ
编码速率:5.3Kbps、6.3Kbps;
理论延时:37.5ms(30ms frame size + 1/4 subframe size)
音质:小于长途质量,MOS 3.7;
优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定,避免了载波信号的时通时断。
缺点:声音质量一般;
应用领域:VOIP;
版税方式:Free
备注:
G.723.1是一个双速率的语音编码器,是 ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法;
其目标应用系统包括H.323、H.324等多媒体通信系统,目前该算法已成为IP电话系统中的必选算法之一;编码器首先对语音信号进行传统电话带宽的滤波(基于G.712),再对语音信号用传统8000-Hz速率进行抽样(基于G.711),并变换成16 bit线性PCM码作为该编码器的输入;在解码器中对输出进行逆操作来重构语音信号;高速率编码器使用多脉冲最大似然量化(MP-MLQ),低速率编码器使用代数码激励线性预测(ACELP)方法,编码器和解码器都必须支持此两种速率,并能够在帧间对两种速率进行转换;
此系统同样能够对音乐和其他音频信号进行压缩和解压缩,但它对语音信号来说是最优的;采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外,这种技术使发信机的调制解调器保持连续工作,并且避免了载波信号的时通时断。
5、G.726: 40, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM)
编码类型:ADPCM
编码速率:40Kbps、32Kbps、24Kbps、16Kbps;
理论延时:0.125ms(8kHz sample rate)
音质:32kbps,长途质量;
优点:计算简单,带宽是G.711的一半而音质接近;
缺点:占有带宽相对还是较高;
应用领域:VOIP,电话通信网络;
版税方式:free
备注:
G.726是G.721和G.723的联合,同时增加了16kbps ADPCM,但最为常用的方式是 32 kbit/s。G.726是G.711带宽的一半,所以可将网络的可利用空间增加了一倍。G.726具体规定了一个 64 kbpsA-law 或 μ-law PCM 信号是如何被转化为40, 32, 24或16 kbps 的 ADPCM 通道的。在这些通道中,24和16 kbps 的通道被用于数字电路倍增设备(DCME)中的语音传输,而40 kbps 通道则被用于 DCME 中的数据解调信号(尤其是4800 kbps 或更高的调制解调器)。
6、G.728: Coding of speech at 16 kbit/s using low-delay code excited linear prediction
编码类型:CELP
编码速率:16Kbps;
理论延时:0.625ms(8kHz sample rate)
音质:长途质量;
优点:低延时、抗误码能力非常强;
缺点:比其他的编码器都复杂;
应用领域:IP电话,数字移动通信、卫星通信;
版税方式:free
备注:
G.728 低延时码激励线性预测编码(LD-CELP)是世界上第一个标准化参数语音CODEC,以CELP算法为基础,采用后向自适应线性预测、50阶合成滤波和短激励矢量等改进方法,达到了低延时的目的。
7、G.729: Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)
编码类型:CS-CELP
编码速率:8Kbps;
理论延时:15ms(10ms frame size + 1/2 subframe lookhead)
音质:长途质量;
优点:低码率,高音质,应用广泛;
缺点:算法复杂度较高;
应用领域:VOIP;
版税方式:free
备注:
国际电信联盟(ITU-T)于1995年11月正式通过了G.729。 ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP),它是当前较新的一种语音压缩标准。G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法。这种算法综合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术。G.729编码器是为低时延应用设计的,它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得G.729产生的点到点的时延为25ms,比特率为8
kbps。
96年ITU-T又制定了G.729的简化方案G.729A,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是G.729A。
8、G.729.1: G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729.
编码类型:CELP、TDBWE
编码速率:8Kbps~32kbps,12个码率;
理论延时:48.9375ms;
音质:未知;
优点:多码率,可与G.729、G.729A和G.729B实现完全操作;
缺点:应用未成熟;
应用领域:VOIP;
版税方式:有专利
备注:
G.729.1是一个可与G.729,G.729A 和G.729B 互操作的8-32 kbit/s 可分级宽带语音和音频编解码算法。G.729EV 编解码器输出信号在 8 kbit/s 和12 kbit/s 采样频率上带宽为50-4000 Hz,在14-32 kbit/s 采样频率上带宽为50-7000 Hz。在8 kbit/s,G.729EV 可以与G.729、G.729 附件A 和G.729 附件B 实现完全互操作。因此可预见在现有基于G.729 的VoIP 基础设施中将得到有效的部署。编解码器工作于20
ms 帧,算法时延为48.9375 ms。默认情况下,编码器输入和解码器输出信号采样频率为16 kHz。编码器生成一个嵌入式码流,它分为12 层结构,分别对应于 8-32 kbit/s 内12 个可用比特率。在解码器端或通信系统任一组成部分都可以将码流截断,从而无需带外信令便可以将比特速率“实时”调整至理想值。
基本算法基于三阶段编码结构:低频带(50-4000 Hz)嵌入式码激励线性估计(CELP)编解码,高频带(4000-7000 Hz)时域带宽扩展(TDBWE)参量编解码,以及通过被称为时域混叠消除(TDAC)的估计变换编解码技术实现的全频带增强功能。
参考资料:
1、http://wz.csdn.net/foobarren/
2、http://www.cnblogs.com/huaping-audio/archive/2008/06/19/1224287.html
3、http://kware.blogbus.com/tag/Codec/
4、http://www.cppblog.com/gtwdaizi/archive/2008/04/19/41884.html#47591
5、http://www.ctiforum.com/news/2009news/07/news07242.htm

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Ordinateurs recommandés adaptés aux étudiants se spécialisant en sciences de l'information géographique 1. Recommandation 2. Les étudiants se spécialisant en sciences de l'information géographique doivent traiter de grandes quantités de données géographiques et effectuer des analyses complexes d'informations géographiques, ils ont donc besoin d'un ordinateur très performant. Un ordinateur avec une configuration élevée peut offrir une vitesse de traitement plus rapide et un espace de stockage plus grand, et peut mieux répondre aux besoins professionnels. 3. Il est recommandé de choisir un ordinateur équipé d'un processeur haute performance et d'une mémoire de grande capacité, ce qui peut améliorer l'efficacité du traitement et de l'analyse des données. De plus, choisir un ordinateur doté d’un plus grand espace de stockage et d’un écran haute résolution permet de mieux afficher les données et les résultats géographiques. De plus, étant donné que les étudiants se spécialisant en sciences de l'information géographique peuvent avoir besoin de développer et de programmer un logiciel de système d'information géographique (SIG), choisissez un ordinateur offrant une meilleure prise en charge du traitement graphique.

Le i5-13490F est un processeur vendu uniquement en Chine continentale. Il vient d'être lancé récemment. Ses performances sont légèrement améliorées par rapport au 13400F. Il fonctionne très bien dans les jeux et nous apporte une faible consommation d'énergie et des performances élevées. Évaluation complète des paramètres du processeur i5-13490F : 1. Les performances du processeur i5-13490F sont améliorées de 0,2 GHz par rapport au i5-13400F ; le cache de niveau 3 est augmenté à 24 Mo ; 2. L'amélioration des performances monocœur et du cache de niveau 3 aidera les joueurs en termes de performances. 3. En résolution 2K, le i5-13490F est légèrement plus performant dans les jeux que le i5-13400F. Évaluation des paramètres du i7-13490F Benchmarks de performances complets : les scores de référence du CPU-z ont atteint un niveau unique

WindowsCMD (Windows Command Prompt) est un outil de ligne de commande du système d'exploitation Windows. Il fonctionne via la ligne de commande et peut effectuer de nombreuses tâches de gestion du système, de fichiers, de réseau et autres. Cet article présentera aux lecteurs la liste complète des commandes Windows CMD, y compris les commandes couramment utilisées et leurs fonctions. 1. Commandes couramment utilisées Commande cd : utilisée pour changer de répertoire courant. Commande dir : affiche les fichiers et sous-répertoires dans le répertoire courant. Commande mkdir : créez un nouveau répertoire. mdr

Synthèse vocale Python (recherche et fonction terminée) En raison des besoins du projet, je dois convertir du texte en parole, la première étape consiste donc à mener des recherches sur ce qu'est la technologie de synthèse vocale (texttospeech), mentionnée ? comme TTS. C'est une technologie qui convertit le texte en parole. Elle permet à l'ordinateur de simuler la bouche humaine et d'exprimer ce qu'il veut exprimer à travers différents timbres. Elle fait partie du dialogue homme-machine. TTS peut convertir intelligemment du texte en flux vocaux naturels grâce à la conception de réseaux neuronaux. Il facilite grandement l'utilisation des patients malvoyants et améliore également la lisibilité du texte. Les applications TTS incluent du matériel piloté par la parole et des systèmes sensibles au son, et sont souvent utilisées avec des programmes de reconnaissance vocale. Aujourd'hui, de nombreux fabricants ont lancé leur propre voix

Une liste complète des méthodes de requête de version de Django, nécessitant des exemples de code spécifiques Présentation : Django est un framework d'application Web open source largement utilisé dans le développement Web. Il est simple, flexible et efficace et peut aider les développeurs à créer rapidement des applications Web puissantes. Pour les développeurs, il est très important de comprendre la version de Django actuellement utilisée et les méthodes de requête associées. Cet article présentera en détail la méthode de requête de version de Django et donnera des exemples de code spécifiques pour aider les lecteurs à mieux l'appliquer.

PHP est un langage de programmation Web populaire doté de nombreuses fonctions et extensions intégrées qui permettent aux développeurs d'écrire facilement des applications Web. Dans cet article, nous présenterons quelques bibliothèques de fonctions PHP, qui possèdent à la fois des fonctions intégrées et des extensions tierces. 1. Bibliothèque de fonctions intégrée Bibliothèque de fonctions d'opération de chaîne La bibliothèque de fonctions de chaîne en PHP comprend des fonctions d'opération couramment utilisées, telles que l'interception de chaîne, le remplacement, la correspondance, la comparaison, etc. Fonctions couramment utilisées : strlen($str) : renvoie la longueur de la chaîne. sous-str($str,

Les sonneries d’appels entrants jouent un rôle important dans notre quotidien et constituent l’une des fonctions essentielles des téléphones portables. Nous apportant des choix plus amusants et personnalisés, un lot de nouvelles sonneries arriveront sur nos téléphones mobiles en 2023, avec une musique constamment mise à jour et changeante. Rendez vos sonneries d'appel uniques. Cet article sélectionnera les sonneries d'appel les plus populaires en 2023. Tonalité d'ouverture - Vous mettre instantanément dans un état d'enthousiasme est idéal pour vous rappeler d'être positif lorsque vous répondez au téléphone. Ce type de sonnerie se caractérise par la vitalité, l'enthousiasme et le rythme distinctif. Heureuse et optimiste - Laissez-vous ressentir la beauté de la vie et vous apportez de la positivité. Ces sonneries sont principalement joyeuses, énergiques et vives. Ambiance romantique - doux rappel téléphonique pour vous

Il existe de nombreuses versions dans la collection de systèmes du Dr Han parmi lesquelles les utilisateurs peuvent choisir. Qu'ils souhaitent utiliser Win10 ou Win11, certaines versions correspondantes peuvent être téléchargées et de nombreuses fonctions ont été optimisées, telles que certains logiciels et pilotes intégrés. , etc. seront plus adaptés aux novices. Le téléchargement complet du système du Dr Han recommande l'installation en un clic de l'image système version win11 version win10 version win7 1. Liste des exigences de configuration du système 1. Processeur : la fréquence principale minimale requise est de 233 MHz, 300 MHz ou plus est recommandé 2. Mémoire : minimum 64 Mo. . 128 Mo ou plus sont recommandés 3. Carte graphique : SuperVGA (800 x 600) est la configuration minimale requise 4. Espace restant sur le disque dur : 1,5 Go est la configuration minimale requise, 1,5 Go est recommandé
