Maison > Périphériques technologiques > IA > He Zhongjiang, directeur général de China Telecom Artificial Intelligence : Supernatural Voice 2.0 sortira en 2024

He Zhongjiang, directeur général de China Telecom Artificial Intelligence : Supernatural Voice 2.0 sortira en 2024

WBOY
Libérer: 2023-11-10 20:21:30
avant
599 Les gens l'ont consulté

Dans l'après-midi du 10 novembre, He Zhongjiang, directeur général de China Telecom Artificial Intelligence, a expliqué les produits et les idées de General Large Model lors du Forum de coopération pour le développement de l'intelligence artificielle et de l'industrie des données

He Zhongjiang, directeur général de China Telecom Artificial Intelligence : Supernatural Voice 2.0 sortira en 2024

He Zhongjiang a d'abord partagé son point de vue sur l'intelligence artificielle générale. Il pensait que l'intelligence artificielle générale faisait référence à la capacité de voir, d'écouter et de penser comme les humains. Être capable de voir nécessite une technologie visuelle, et être capable d'écouter nécessite une technologie vocale. informations et Une fois les informations vocales collectées dans le cerveau, le cerveau les traite, les juge et fournit des idées de prise de décision. Le grand modèle général joue le rôle du cerveau. Les données massives d'aujourd'hui, les algorithmes avancés et la solide puissance de calcul favoriseront également le développement à grande échelle de grands modèles.

Après avoir expliqué les points de vue de base, He Zhongjiang a donné une explication détaillée du modèle sémantique China Telecom Star et du modèle multimodal China Telecom Star. Le grand modèle sémantique China Telecom Star est au cœur de l'intelligence artificielle générale. Il a de meilleures capacités et peut atténuer plusieurs séries d'hallucinations, réduisant ainsi le « taux d'hallucinations » de 40 %. À l'avenir, le grand modèle sémantique vedette de China Telecom pourra renforcer les services 2B2G en externe, améliorer la qualité et l'efficacité et optimiser l'expérience ; il pourra être pleinement appliqué en interne, améliorer l'efficacité de la collaboration en production et disposer d'applications plus riches. He Zhongjiang a également révélé que l'équipe d'IA de China Telecom participerait également au processus open source et open source. Elle ouvrira le modèle des dizaines de milliards avant la fin de cette année et le modèle des centaines de milliards en avril de l'année prochaine. sera open source.

Lorsque He Zhongjiang a présenté le grand modèle multimodal Xingchen de China Telecom, il a déclaré que China Telecom avait actuellement formé plus de 1,2 milliard de paires d'images et de textes, en utilisant une stratégie de précision mixte pour améliorer considérablement l'efficacité du GPU et accélérer l'inférence de 4,5 fois. Le grand modèle multimodal sera utilisé comme prochaine base de capacités de base d'une génération de personnes numériques.

En comparant la voix du service client intelligent de Wanhao avec Supernatural TTS 1.0, He Zhongjiang a déclaré que le modèle vocal Xingchen 1.0 de China Telecom peut atteindre un naturel comparable à celui de personnes réelles, la diffusion en temps réel dans une voix bien formée, le temps de réponse du premier paquet est inférieur à ; 50 millisecondes ; et prend en charge des données extrêmement petites. Conversion quantitative et personnalisation du son pour une flexibilité meilleure, plus rapide et plus grande. Il a également révélé que Supernatural Speech Synthesis 2.0 sortira mi-2024.

China Telecom HR est basé sur le grand modèle multimodal de China Telecom Star et utilise des avatars numériques de base pour afficher des fonctions telles que la correspondance arbitraire d'accessoires de maquillage, la génération et la personnalisation personnalisées. He Zhongjiang a déclaré qu'avec l'amélioration continue de la technologie des modèles à grande échelle et l'enrichissement continu des connaissances, les personnes numériques dans l'espace virtuel et les robots dans le monde réel auront un impact croissant sur la production, le fonctionnement et la vie des personnes, et l'ère de l’intelligence artificielle est sur le point d’arriver véritablement !

Operator Finance (compte public officiel WeChat yyscjrd) - un site Web financier grand public, un site Web qui couvre de manière exhaustive la technologie, la finance, les valeurs mobilières, l'automobile, l'immobilier, l'alimentation, les médicaments, les produits chimiques quotidiens, le vin et d'autres produits de consommation.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:sohu.com
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal