Anrufe in Aufzügen und Kellern erfolgen reibungslos. Tencent führt die neue Generation des Echtzeit-Sprachcodierungs-Industriestandards AVS3P10 an, der bald veröffentlicht wird.

王林
Freigeben: 2024-06-27 17:45:06
Original
1111 Leute haben es durchsucht

Laut Nachrichten dieser Website vom 27. Juni gab Tencent heute bekannt, dass die neue Generation des vom Unternehmen geleiteten Echtzeit-Sprachcodierungs-Industriestandards AVS3P10 fertiggestellt wurde und bald offiziell veröffentlicht wird. Diesmal übernimmt der AVS-Audiogruppenstandard AVS3P10 die Lösung von Tencent und basiert auf Tencent Conferences erstem selbst entwickelten neuronalen Netzwerk-Sprachcodec Penguins AI Voice Engine, der die Anrufqualität in schwachen Netzwerkumgebungen verbessern kann.

电梯、地库里通话不卡顿,腾讯主导新一代实时语音编码行业标准 AVS3P10 即将发布

Tencent sagte, dass dies das weltweit erste System sei, das künstliche Intelligenz einführt und hochwertige Sprachcodierungsstandards bei niedrigen Bitraten erreicht, und dass seine Leistung Weltklassestandards erreicht habe. Mit nur 1/3 der Codierungsbitrate kann die gleiche klare Klangqualität wie bei bestehenden Mainstream-Standards erreicht werden. „Selbst wenn die Netzwerkkarte 2G ist, kann das Meeting reibungslos abgehalten werden.“

Dieser Standard wurde von Tencent mit gemeinsamen Beiträgen mehrerer Mitglieder der AVS-Audiogruppe initiiert, gefördert und gepflegt. „Zukünftig wird der Bandbreitenbedarf für Echtzeit-Audioszenarien wie Online-Meetings und Sprachanrufe erheblich reduziert. Selbst in Umgebungen mit schlechter Netzwerkversorgung wie Aufzügen, Kellern und Tunneln können klare und reibungslose Sprachanrufe erreicht werden.“

电梯、地库里通话不卡顿,腾讯主导新一代实时语音编码行业标准 AVS3P10 即将发布

Berichten zufolge ist unter Bedingungen begrenzter Bandbreite die Sprachcodierungstechnologie, die die Originaldaten komprimiert und redundante Informationen entfernt, der Schlüssel, wenn Sie dem Empfänger hochwertigen Ton liefern möchten. Basierend auf bestehenden Mainstream-Audio-Codec-Standards wie EVS und OPUS nimmt die Sprachqualität jedoch erheblich ab, wenn die Bitrate auf unter 10 kbps reduziert wird, was sich negativ auf das Benutzererlebnis auswirkt.

Um dieser Herausforderung zu begegnen, haben Tencent Conference Tianlai Lab und Tencent AI Lab unabhängig voneinander Tencents ersten neuronalen Netzwerk-Sprachcodec entwickelt – Penguins.

Konkret integriert Penguins KI mit traditionellen Technologien, durchbricht die Leistungsgrenzen des traditionellen Shannon-Gesetzes, führt Big Data ein und bietet eine neue Leistungsobergrenze unter kontrollierbaren Rechenleistungssteigerungen, was insbesondere Kommunikationssystemen der nächsten Generation zugute kommt Es ist der Quellencoder Teil, der neue technische Grundlagen und Methoden bietet. Durch KI-Sprachsignalmodellierung wird die Kodierung der Kernmerkmalsparameter extrahiert und dann mit Hilfe eines Deep-Learning-Netzwerks die subtile Struktur in der Sprache vorhergesagt und rekonstruiert und schließlich eine realistische Audiowellenform generiert.

Mehrere Tests zeigen, dass der von Tencent vorgelegte AVS3P10-Standard eine qualitativ hochwertige Sprachkommunikation mit 6 Kbit/s erreicht. Er kann auch im „2G“-Netzwerk klare Anrufe erzielen und die subjektive Qualität kommt dem ursprünglichen Referenzsignal sehr nahe, vergleichbar mit dem Internationaler Mainstream-OPUS-Standard in 20-kbit/s-Qualität. Gleichzeitig wird beim Vergleich der subjektiven Qualität mit der herkömmlichen Kodierung bei mittleren und hohen Bitraten die Kodierungseffizienz um 200–300 % gesteigert.

Ab 2021 werden die Audio-Encoder von Penguins in groß angelegten Anwendungen im Tencent-Konferenzfahrmodus, im schwachen Netzwerkmodus und bei QQ-Sprachanrufen eingesetzt.

Im März 2023 schlug das Tencent-Team in der AVS-Audiogruppe einen Standard vor und beteiligte sich an dessen Formulierung, nämlich den Echtzeit-Sprachcodierungsstandard AVS3P10. Anschließend reichte Tencent eine auf Penguins basierende Kandidatentechnologie ein; diese wurde nach einer Kreuzvalidierung durch die AVS-Audiogruppe übernommen. Im Juni 2024 schloss der Echtzeit-Sprachcodierungsstandard AVS3P10 die Standardisierungsarbeiten offiziell ab und trat in die öffentliche Ankündigungsphase ein.

Hinweis von dieser Website: Seit der Gründung der AVS-Arbeitsgruppe in meinem Land im Juni 2002 ist nach mehr als zehn Jahren der Teamarbeit von Tausenden von Menschen AVS mit unabhängigen Rechten an geistigem Eigentum in meinem Land entstanden. AVS3 ist der weltweit erste eingeführte Videokodierungsstandard für industrielle 8K- und 5G-Anwendungen.

AVS hat mit der Standardformulierung von AVS4 begonnen und fordert die AVS-Mitgliedseinheiten auf, die Entwicklung der AVS-Standards der nächsten Generation weiterhin zu unterstützen. Verschiedene Hersteller werden ihre Kräfte bündeln, um gemeinsam technische Standards umzusetzen und den globalen Einsatz zu fördern.

Das obige ist der detaillierte Inhalt vonAnrufe in Aufzügen und Kellern erfolgen reibungslos. Tencent führt die neue Generation des Echtzeit-Sprachcodierungs-Industriestandards AVS3P10 an, der bald veröffentlicht wird.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:ithome.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!