Heim Datenbank MySQL-Tutorial 常用的ITU Speech Codec大全(G.711,G.722.1,G.722.2,G.723.1,G.

常用的ITU Speech Codec大全(G.711,G.722.1,G.722.2,G.723.1,G.

Jun 07, 2016 pm 03:42 PM
itu speech 大全 Gebraucht

总结了常用的ITU Speech Codec,谨供大家学习参考: 1、 G.711: Pulse code modulation (PCM) of voice frequencies 编码类型:压扩PCM 编码速率:64Kbps 理论延时:处理一个样点的时间(1/8000秒=0.125毫秒); 音质:长途质量; 优点:算法复杂度低,压缩

总结了常用的ITU Speech Codec,谨供大家学习参考:

1、G.711: Pulse code modulation (PCM) of voice frequencies

 

编码类型:压扩PCM
编码速率:64Kbps

理论延时:处理一个样点的时间(1/8000秒=0.125毫秒);

音质:长途质量;
优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)
缺点:占用的带宽较高
应用领域:voip,PSTN 电话网络
版税方式:Free
备注:

     70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。

     G.711是最基本的一种编码方法,俗称PCM,采用μ-law(主要北美地区使用)和A-law(其它地区)两种非线性量化方法进行压缩。说它“基本”是因为一方面PCM算法非常简单,很多ADC硬件的输入输出就直接支持PCM格式;另一方面PCM格式在通信系统中往往需要进一步压缩,因此它是其它语音编码算法的输入源。

 

 

2、G.722.1: Low-complexity coding at 24 and 32 kbit/s for hands-free operation in systems with low frame loss

编码类型:变换域Audio coding
编码速率:24Kbps、32Kbps;(其实可以实现更多码率,以8kbps递增码率,另外还有32kHz采样的更高码率版本);

理论延时:40ms(20ms frame size + 20ms lookhead)

音质:低码率时优于MP3、WMA等音频算法,详细可参考Polycom网站;
优点:算法复杂度低,小于 5.5wMOPS,相对于MP3,WMA等算法在低码率时音质要好;

缺点:对于speech而言,音质没有CELP模型编码器响亮;另外,48kbps以上音质变化不大;
应用领域:电视会议、电话会议和互联网流应用;
版税方式:Free
备注:   

      G.722.1是由Polycom提出的一套低码率低复杂度的宽带语音编码算法,主要采用了变换域编码方法,因此可以对语音(300~4000Hz)和7kHz以内的音乐进行编码,采样率为16kHz,其32kbps码率的重建语音质量相当于64 kbps G.722 SB-ADPCM。在实际的应用中,本算法在低码率时其音质要高于MP3等音频算法,再加上算法低复杂度非常适合嵌入式平台通信、存储应用。最后,它的附录C中提供了32kHz采样的14k带宽的音频编码方案,进一步提高了音质。

 

 

3、G.722.2: Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)

编码类型:ACELP
编码速率:6.6Kbps~23.85Kbps;

理论延时:25ms(20ms frame size + 1/4 subframe size)

音质:高质量相对于窄带语音;
优点:高质量、多码率处理和自适应特性;

缺点:复杂度太高;
应用领域:3GPP 无线通信;
版税方式:单一授权
备注: 

      AMR Wideband (AMR-WB) 是迄今为止唯一的针对无线 (3GPP) 和有线 (ITU-T Recommendation G.722.2) 应用而标准化的语音编解码器。因此,它也是宽频语音应用的理想编解码器,因为它可以确保聚合有线/无线网络的兼容性。AMR-WB 是被 3GPP 采用的唯一宽频语音标准,并且,在具备宽频语音(采样频率 16 kHz)支持的情况下,它还是 GSM 和 WCDMA 网络中用于宽频语音和多媒体服务的指定编解码器,这些服务包括多媒体信息服务 (MMS)、IMS 信息和呈现服务、分组交换流媒体业务 (PSS)、多媒体广播/组播业务 (MBMS) 以及无线一键通业务 (PoC)。 其他应用包括 VoIP、会议、Wi-Fi 电话、卫星电话、视频电话、互联网流式音频,等等。

4、G.723.1: Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s

编码类型:ACELP、MP-MLQ
编码速率:5.3Kbps、6.3Kbps;

理论延时:37.5ms(30ms frame size + 1/4 subframe size)

音质:小于长途质量,MOS 3.7;
优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定,避免了载波信号的时通时断。

缺点:声音质量一般;
应用领域:VOIP;
版税方式:Free
备注:

 G.723.1是一个双速率的语音编码器,是 ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法;
其目标应用系统包括H.323、H.324等多媒体通信系统,目前该算法已成为IP电话系统中的必选算法之一;编码器首先对语音信号进行传统电话带宽的滤波(基于G.712),再对语音信号用传统8000-Hz速率进行抽样(基于G.711),并变换成16 bit线性PCM码作为该编码器的输入;在解码器中对输出进行逆操作来重构语音信号;高速率编码器使用多脉冲最大似然量化(MP-MLQ),低速率编码器使用代数码激励线性预测(ACELP)方法,编码器和解码器都必须支持此两种速率,并能够在帧间对两种速率进行转换;
此系统同样能够对音乐和其他音频信号进行压缩和解压缩,但它对语音信号来说是最优的;采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外,这种技术使发信机的调制解调器保持连续工作,并且避免了载波信号的时通时断。

 

5、G.726: 40, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM)

编码类型:ADPCM
编码速率:40Kbps、32Kbps、24Kbps、16Kbps;

理论延时:0.125ms(8kHz sample rate)

音质:32kbps,长途质量;
优点:计算简单,带宽是G.711的一半而音质接近;

缺点:占有带宽相对还是较高;
应用领域:VOIP,电话通信网络;
版税方式:free
备注:

     G.726是G.721和G.723的联合,同时增加了16kbps ADPCM,但最为常用的方式是 32 kbit/s。G.726是G.711带宽的一半,所以可将网络的可利用空间增加了一倍。G.726具体规定了一个 64 kbpsA-law 或 μ-law PCM 信号是如何被转化为40, 32, 24或16 kbps 的 ADPCM 通道的。在这些通道中,24和16 kbps 的通道被用于数字电路倍增设备(DCME)中的语音传输,而40 kbps 通道则被用于 DCME 中的数据解调信号(尤其是4800 kbps 或更高的调制解调器)。

 

6、G.728: Coding of speech at 16 kbit/s using low-delay code excited linear prediction

编码类型:CELP
编码速率:16Kbps;

理论延时:0.625ms(8kHz sample rate)

音质:长途质量;
优点:低延时、抗误码能力非常强;

缺点:比其他的编码器都复杂;
应用领域:IP电话,数字移动通信、卫星通信;
版税方式:free
备注:

    G.728 低延时码激励线性预测编码(LD-CELP)是世界上第一个标准化参数语音CODEC,以CELP算法为基础,采用后向自适应线性预测、50阶合成滤波和短激励矢量等改进方法,达到了低延时的目的。 

 

7、G.729: Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)

编码类型:CS-CELP
编码速率:8Kbps;

理论延时:15ms(10ms frame size + 1/2 subframe lookhead)

音质:长途质量;
优点:低码率,高音质,应用广泛;

缺点:算法复杂度较高;
应用领域:VOIP;
版税方式:free
备注:

      国际电信联盟(ITU-T)于1995年11月正式通过了G.729。 ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP),它是当前较新的一种语音压缩标准。G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法。这种算法综合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术。G.729编码器是为低时延应用设计的,它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得G.729产生的点到点的时延为25ms,比特率为8 kbps。
96年ITU-T又制定了G.729的简化方案G.729A,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是G.729A。

 

8、G.729.1: G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729.

编码类型:CELP、TDBWE
编码速率:8Kbps~32kbps,12个码率;

理论延时:48.9375ms;

音质:未知;
优点:多码率,可与G.729、G.729A和G.729B实现完全操作;

缺点:应用未成熟;
应用领域:VOIP;
版税方式:有专利
备注: 

G.729.1是一个可与G.729,G.729A 和G.729B 互操作的8-32 kbit/s 可分级宽带语音和音频编解码算法。G.729EV 编解码器输出信号在 8 kbit/s 和12 kbit/s 采样频率上带宽为50-4000 Hz,在14-32 kbit/s 采样频率上带宽为50-7000 Hz。在8 kbit/s,G.729EV 可以与G.729、G.729 附件A 和G.729 附件B 实现完全互操作。因此可预见在现有基于G.729 的VoIP 基础设施中将得到有效的部署。编解码器工作于20 ms 帧,算法时延为48.9375 ms。默认情况下,编码器输入和解码器输出信号采样频率为16 kHz。编码器生成一个嵌入式码流,它分为12 层结构,分别对应于 8-32 kbit/s 内12 个可用比特率。在解码器端或通信系统任一组成部分都可以将码流截断,从而无需带外信令便可以将比特速率“实时”调整至理想值。
基本算法基于三阶段编码结构:低频带(50-4000 Hz)嵌入式码激励线性估计(CELP)编解码,高频带(4000-7000 Hz)时域带宽扩展(TDBWE)参量编解码,以及通过被称为时域混叠消除(TDAC)的估计变换编解码技术实现的全频带增强功能。

 

 

参考资料:

1、http://wz.csdn.net/foobarren/

2、http://www.cnblogs.com/huaping-audio/archive/2008/06/19/1224287.html

3、http://kware.blogbus.com/tag/Codec/

4、http://www.cppblog.com/gtwdaizi/archive/2008/04/19/41884.html#47591

5、http://www.ctiforum.com/news/2009news/07/news07242.htm

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Welchen Computer sollten Absolventen der Geoinformatik wählen? Welchen Computer sollten Absolventen der Geoinformatik wählen? Jan 13, 2024 am 08:00 AM

Empfohlene Computer für Studierende mit Schwerpunkt Geoinformationswissenschaft 1. Empfehlung 2. Studierende mit Schwerpunkt Geoinformationswissenschaft müssen große Mengen geografischer Daten verarbeiten und komplexe Geoinformationsanalysen durchführen und benötigen daher einen Computer mit hoher Leistung. Ein Computer mit hoher Konfiguration kann eine schnellere Verarbeitungsgeschwindigkeit und mehr Speicherplatz bieten und professionelle Anforderungen besser erfüllen. 3. Es wird empfohlen, einen Computer zu wählen, der mit einem Hochleistungsprozessor und einem Speicher mit großer Kapazität ausgestattet ist, der die Effizienz der Datenverarbeitung und -analyse verbessern kann. Darüber hinaus können geografische Daten und Ergebnisse besser angezeigt werden, wenn Sie sich für einen Computer mit größerem Speicherplatz und einem hochauflösenden Display entscheiden. Da Studierende im Hauptfach Geoinformatik möglicherweise Software für geografische Informationssysteme (GIS) entwickeln und programmieren müssen, sollten Sie sich außerdem für einen Computer mit besserer Grafikverarbeitungsunterstützung entscheiden.

Umfassender Überblick über die Spezifikationen und die Leistung des i5-13490F-Prozessors Umfassender Überblick über die Spezifikationen und die Leistung des i5-13490F-Prozessors Jan 02, 2024 pm 06:12 PM

Der i5-13490F ist eine CPU, die erst kürzlich auf dem chinesischen Festland verkauft wurde. Ihre Leistung ist im Vergleich zum 13400F leicht verbessert und sie bringt uns einen geringen Stromverbrauch und eine hohe Leistung. Umfassende Bewertung der i5-13490F-Prozessorparameter: 1. Die Leistung des i5-13490F-Prozessors wurde im Vergleich zum i5-13400F um 0,2 GHz verbessert; der Level-3-Cache wurde auf 24 MB erhöht. 2. Die Verbesserung der Single-Core-Leistung und des Level-3-Cache wird Gamern hinsichtlich der Leistung helfen. 3. Bei 2K-Auflösung schneidet der i5-13490F in Spielen etwas besser ab als der i5-13400F. i7-13490F Parameterbewertung Vollständige Leistungsbenchmarks: Die Benchmark-Ergebnisse von CPU-z erreichten eins

Vollständige Anleitung zur Windows-Eingabeaufforderung Vollständige Anleitung zur Windows-Eingabeaufforderung Feb 20, 2024 pm 02:09 PM

WindowsCMD (Windows Command Prompt) ist ein Befehlszeilentool im Windows-Betriebssystem. Es funktioniert über die Befehlszeile und kann viele Systemverwaltungs-, Dateiverwaltungs-, Netzwerkverwaltungs- und andere Aufgaben erledigen. In diesem Artikel wird den Lesern die vollständige Liste der Windows CMD-Befehle vorgestellt, einschließlich häufig verwendeter Befehle und ihrer Funktionen. 1. Häufig verwendete Befehle cd-Befehl: Wird zum Wechseln des aktuellen Verzeichnisses verwendet. dir-Befehl: Zeigt Dateien und Unterverzeichnisse im aktuellen Verzeichnis an. mkdir-Befehl: Erstellen Sie ein neues Verzeichnis. rmd

So verwenden Sie die Python-Drittanbieterbibliothek gTTs/pyttsx3/speech So verwenden Sie die Python-Drittanbieterbibliothek gTTs/pyttsx3/speech May 12, 2023 pm 06:43 PM

Python-Text-to-Speech (Recherche und fertige Funktion) Aufgrund von Projektanforderungen muss ich Text in Sprache umwandeln. Der erste Schritt besteht darin, zu recherchieren, was die Sprachsynthese-Technologie (Text-to-Speech) ist als TTS. Es handelt sich um eine Technologie, die Text in Sprache umwandelt. Sie ermöglicht es dem Computer, den menschlichen Mund zu simulieren und das auszudrücken, was er durch verschiedene Klangfarben ausdrücken möchte. TTS kann durch den Entwurf neuronaler Netze Text intelligent in natürliche Sprachströme umwandeln. Es erleichtert den Einsatz für sehbehinderte Patienten erheblich und verbessert zudem die Lesbarkeit von Texten. TTS-Anwendungen umfassen sprachgesteuerte Hardware und geräuschempfindliche Systeme und werden häufig mit Spracherkennungsprogrammen verwendet. Mittlerweile haben viele Hersteller ihre eigene Stimme ins Leben gerufen

Vollständiger Leitfaden: Djangos Version finden Vollständiger Leitfaden: Djangos Version finden Jan 04, 2024 am 10:14 AM

Vollständige Liste der Django-Versionsabfragemethoden, die spezifische Codebeispiele erfordern. Übersicht: Django ist ein Open-Source-Webanwendungs-Framework, das in der Webentwicklung weit verbreitet ist. Es ist einfach, flexibel und effizient und kann Entwicklern dabei helfen, schnell leistungsstarke Webanwendungen zu erstellen. Für Entwickler ist es sehr wichtig, die aktuell verwendete Django-Version und die zugehörigen Abfragemethoden zu verstehen. In diesem Artikel wird die Methode der Django-Versionsabfrage ausführlich vorgestellt und spezifische Codebeispiele gegeben, um den Lesern zu helfen, sie besser anzuwenden.

Vollständige PHP-Funktionsbibliothek Vollständige PHP-Funktionsbibliothek Jun 23, 2023 am 10:40 AM

PHP ist eine beliebte Web-Programmiersprache mit vielen integrierten Funktionen und Erweiterungen, die es Entwicklern ermöglichen, Webanwendungen einfach zu schreiben. In diesem Artikel stellen wir einige PHP-Funktionsbibliotheken vor, die sowohl über integrierte Funktionen als auch über Erweiterungen von Drittanbietern verfügen. 1. Integrierte Funktionsbibliothek String-Operations-Funktionsbibliothek Die String-Funktionsbibliothek in PHP enthält häufig verwendete Operationsfunktionen wie das Abfangen, Ersetzen, Abgleichen, Vergleichen von Strings usw. Häufig verwendete Funktionen: strlen($str): gibt die Länge der Zeichenfolge zurück. substr($str,

Eine Sammlung der beliebtesten Klingelton-Songs im Jahr 2024 (heiße Klingelton-Titel verleihen Ihnen Persönlichkeit) Eine Sammlung der beliebtesten Klingelton-Songs im Jahr 2024 (heiße Klingelton-Titel verleihen Ihnen Persönlichkeit) May 31, 2024 pm 10:34 PM

Klingeltöne für eingehende Anrufe spielen eine wichtige Rolle in unserem täglichen Leben und sind eine der wesentlichen Funktionen von Mobiltelefonen. Im Jahr 2023 werden eine Reihe neuer Klingeltontitel auf unsere Mobiltelefone kommen, um uns mehr Spaß und personalisierte Auswahlmöglichkeiten zu bieten, wobei die Musik ständig aktualisiert und verändert wird. Machen Sie Ihre Anrufklingeltöne einzigartig. In diesem Artikel werden die beliebtesten Anrufklingeltöne im Jahr 2023 ausgewählt. Eröffnungston – Sie werden sofort in einen begeisterten Zustand versetzt, um sich daran zu erinnern, positiv zu sein, wenn Sie ans Telefon gehen. Diese Art von Klingelton zeichnet sich durch Vitalität, Begeisterung und einen unverwechselbaren Rhythmus aus. Fröhlich und fröhlich – Lassen Sie die Schönheit des Lebens spüren und bringen Sie Positivität. Diese Klingeltöne sind hauptsächlich fröhlich, energisch und lebhaft. Romantische Stimmung – süße Telefonerinnerung für Sie

Dr. Hans umfassender Leitfaden zum System Dr. Hans umfassender Leitfaden zum System Dec 31, 2023 pm 07:29 PM

Es gibt viele Versionen in der Systemsammlung von Dr. Han, aus denen Benutzer wählen können. Unabhängig davon, ob sie Win10 oder Win11 betreiben möchten, gibt es entsprechende Versionen, die heruntergeladen werden können, und viele Funktionen wurden optimiert, wie z. B. einige integrierte Software und Treiber usw. sind eher für Anfänger geeignet. Dr. Hans vollständiger System-Download empfiehlt die Ein-Klick-Installation des Systemabbilds Win11-Version Win10-Version Win7-Version 1. Liste der Systemkonfigurationsanforderungen 1. Prozessor: Die Mindestanforderung an die Hauptfrequenz beträgt 233 MHz, 300 MHz oder höher werden empfohlen 2. Speicher: mindestens 64 MB. 128 MB oder mehr werden empfohlen. 3. Grafikkarte: SuperVGA (800 x 600) ist die Mindestanforderung. 4. Verbleibender Festplattenspeicher: 1,5 GB ist die Mindestanforderung. 1,5 GB werden empfohlen

See all articles