Les appels dans les ascenseurs et les sous-sols sont fluides. Tencent est à la tête de la nouvelle génération de norme industrielle de codage vocal en temps réel AVS3P10, qui sera bientôt publiée.-Industrie informatique-php.cn

Les appels dans les ascenseurs et les sous-sols sont fluides. Tencent est à la tête de la nouvelle génération de norme industrielle de codage vocal en temps réel AVS3P10, qui sera bientôt publiée.

王林

Libérer： 2024-06-27 17:45:06

original

1194 Les gens l'ont consulté

Selon les informations de ce site du 27 juin, Tencent a annoncé aujourd'hui que la nouvelle génération de norme industrielle de codage vocal en temps réel AVS3P10 dirigée par la société a été finalisée et sera officiellement publiée prochainement. Cette fois, la norme AVS3P10 du groupe audio AVS adopte la solution de Tencent et est basée sur le premier codec vocal de réseau neuronal auto-développé par Tencent Conference, le moteur vocal Penguins AI, qui peut améliorer la qualité des appels dans des environnements réseau faibles.

电梯、地库里通话不卡顿，腾讯主导新一代实时语音编码行业标准 AVS3P10 即将发布

Tencent a déclaré qu'il s'agit du premier système au monde à introduire l'intelligence artificielle et à atteindre des normes de codage vocal de haute qualité à de faibles débits binaires, et que ses performances ont atteint les normes de classe mondiale. Avec seulement 1/3 du débit binaire d'encodage, il peut obtenir la même qualité sonore claire que les normes grand public existantes. "Même si la carte réseau est 2G, la réunion peut se dérouler sans problème."

Cette norme a été initiée, promue et maintenue par Tencent, avec les contributions conjointes de plusieurs membres du groupe audio AVS. « À l'avenir, les besoins en bande passante pour les scénarios audio en temps réel tels que les réunions en ligne et les appels vocaux seront considérablement réduits. Même dans des environnements dotés de réseaux médiocres tels que les ascenseurs, les sous-sols et les tunnels, des appels vocaux clairs et fluides pourront être obtenus.

电梯、地库里通话不卡顿，腾讯主导新一代实时语音编码行业标准 AVS3P10 即将发布

Selon les rapports, dans des conditions de bande passante limitée, si vous souhaitez fournir un son de haute qualité au récepteur, la technologie de codage vocal qui compresse les données d'origine et supprime les informations redondantes est la clé. Cependant, sur la base des normes de codec audio grand public existantes telles qu'EVS et OPUS, lorsque le débit binaire est réduit en dessous de 10 kbps, la qualité de la voix chute considérablement, affectant l'expérience utilisateur.

Pour relever ce défi, Tencent Conference Tianlai Lab et Tencent AI Lab ont développé indépendamment le premier codec vocal de réseau neuronal de Tencent : Penguins.

Plus précisément, Penguins intègre l'IA aux technologies traditionnelles, brise les limites de performances de la loi de Shannon traditionnelle, introduit le Big Data et fournit une nouvelle limite supérieure de performances sous des incréments de puissance de calcul contrôlables, bénéficiant ainsi aux systèmes de communication de nouvelle génération, en particulier l'encodeur source. partie, qui fournit une nouvelle base technique et une nouvelle méthodologie. Grâce à la modélisation du signal vocal par l'IA, le codage des paramètres de la fonctionnalité principale est extrait, puis, à l'aide d'un réseau d'apprentissage profond, la structure subtile de la parole est prédite et reconstruite, et enfin une forme d'onde audio réaliste est générée.

Plusieurs tests montrent que la norme AVS3P10 soumise par Tencent permet d'obtenir une communication vocale de haute qualité à 6 kbps. Elle peut réaliser des appels clairs même sous le réseau « 2G », et la qualité subjective est très proche du signal de référence d'origine, comparable au signal de référence d'origine. norme OPUS grand public internationale en qualité 20 kbps. Dans le même temps, lorsque la qualité subjective est comparée au codage traditionnel à des débits binaires moyens et élevés, l'efficacité du codage est augmentée de 200 à 300 %.

À partir de 2021, les encodeurs audio Penguins ont été intégrés à des applications à grande échelle en mode de conduite de conférence Tencent, en mode réseau faible et en appels vocaux QQ.

En mars 2023, l'équipe Tencent a proposé et participé à la formulation du standard au sein du groupe audio AVS, à savoir le standard de codage vocal en temps réel AVS3P10. Par la suite, Tencent a soumis une technologie candidate basée sur Penguins ; elle a été adoptée après validation croisée par le groupe audio AVS. En juin 2024, la norme de codage vocal en temps réel AVS3P10 a officiellement achevé les travaux de normalisation et est entrée dans la phase d'annonce publique.

Note de ce site : Depuis la création du groupe de travail AVS dans mon pays en juin 2002, après plus de dix ans d'efforts d'équipe de milliers de personnes, AVS avec des droits de propriété intellectuelle indépendants dans mon pays a vu le jour. AVS3 est la première norme d'encodage vidéo lancée au monde pour les applications industrielles 8K et 5G.

AVS a commencé la formulation standard de l'AVS4 et appelle les unités membres de l'AVS à continuer de soutenir le développement des normes de nouvelle génération d'AVS. Divers fabricants uniront leurs forces pour mettre en œuvre conjointement les normes techniques et promouvoir le déploiement mondial.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!