Maison > Périphériques technologiques > IA > le corps du texte

La base de données de synthèse de scènes de diffusion en direct de Biaobei Technology aide à créer des « ancres IA » de haute qualité

WBOY
Libérer: 2023-06-08 10:49:32
avant
1021 Les gens l'ont consulté

"Bonjour, bienvenue bébé dans la salle de diffusion en direct, cliquez pour suivre et ne vous perdez pas, il y a des avantages de diffusion en direct tous les soirs~"

"618 avantages sont là, fans dans la salle de diffusion en direct, nous serons les premiers à tirer des commandes gratuites à 12h~"

Lorsque vous entrez dans la salle de diffusion en direct et voyez le « présentateur virtuel » vous saluer, ne soyez pas surpris. Cette année, la plateforme 618 se concentre sur le lancement du « nouveau point culminant » de la piste de diffusion en direct, qui est le résultat d'un nombre croissant de personnels virtuels sur les principales plateformes servant de points d'ancrage dans la salle de diffusion en direct.

标贝科技直播带货场景合成数据库 助力打造优质“AI主播”

En fait, si vous n’observez pas attentivement, il sera difficile de constater que ces ancres sont des ancres virtuelles d’IA. Non seulement ils ressemblent à de vraies personnes, mais leurs voix, leurs émotions et leurs mouvements sont très réalistes et, dans certains cas, ils ont même de multiples talents comme la danse et le chant.

L'IA permet aux utilisateurs numériques de briser le mur dimensionnel du streaming en direct

À partir de l'exploration préliminaire de la diffusion en direct d'adresses IP virtuelles représentées par "Yi Zen Little Monk", "I Don't Eat for Free", "Momojiang", etc., la diffusion en direct numérique humaine par l'IA change progressivement le commerce de détail traditionnel et secteurs du commerce électronique. De plus en plus de marques connues ont commencé à essayer d'utiliser les diffusions en direct d'humains virtuels par l'IA pour promouvoir leurs produits, comme « Stella » de Perfect Diary, « Tang Xiaomei » de Nature Hall, « Hua Xiaoxi » de Hua Xizi et d'autres présentateurs virtuels.

Par rapport aux coûts d'exploitation élevés des véritables présentateurs en direct, les présentateurs virtuels ne sont pas limités par le temps, le lieu ou l'environnement. Ils peuvent commencer à diffuser en un seul clic et sont en ligne 24 heures sur 24, ce qui réduit considérablement le coût de la diffusion en direct pour les commerçants. . Pour la plateforme, les ancres virtuelles sont un maillon incontournable dans l'aménagement écologique des plateformes de commerce électronique. En abaissant continuellement le seuil de diffusion en direct, la plateforme est plus attractive pour les petits et moyens commerçants.

Des ensembles de données synthétiques de haute qualité pour créer des ancres de haute qualité et « éloquentes »

Le streaming humain numérique en direct par IA est devenu une tendance générale. Cependant, parvenir à une commercialisation à grande échelle se heurte également à des défis considérables. Surtout pour les versions haut de gamme des humains virtuels, plus l'effet est réaliste, plus le coût est élevé.

Dans la salle de diffusion en direct, le présentateur présente principalement des informations sur le produit à travers le son et les images. Parmi eux, le son est le « premier média » incontournable. Tout d'abord, le présentateur doit avoir un timbre naturel, doux et émotionnel pour offrir aux utilisateurs une expérience d'écoute confortable. Au contraire, si la voix du présentateur est trop mécanique et indifférente, cela affectera le désir de regarder, deuxièmement, l'expérience interactive. , comme la commande vocale du présentateur L'envoi d'enveloppes rouges et les fans communiquant avec les présentateurs via le chat vocal augmenteront la proximité avec les utilisateurs dans la salle de diffusion en direct.

Par conséquent, afin d'obtenir de meilleurs effets de diffusion en direct et une meilleure expérience utilisateur, les commerçants doivent déboguer en permanence les capacités d'interaction vocale des présentateurs virtuels, perfectionner leurs compétences de diffusion en direct et améliorer la fonction d'interaction avec les utilisateurs.

Quel que soit le type de capacités d'apprentissage automatique, cela nécessite l'accumulation d'algorithmes et de données pour prendre en charge leur niveau technique. Pour améliorer les capacités d'interaction vocale dans les scénarios de diffusion en direct, une grande quantité de données de scénarios de diffusion en direct de haute qualité est nécessaire pour prendre en charge la formation des modèles.

Biaobei Technology est profondément impliquée dans le domaine des services de données d'IA depuis de nombreuses années et possède une riche expérience pratique dans la collecte et l'annotation de données. Pour le scénario de diffusion en direct, Biaobei Technology a soigneusement établi une base de données de synthèse vocale de haute qualité basée sur des studios d'enregistrement de qualité professionnelle et des ressources d'acteurs vocaux de haute qualité, et a complété l'annotation des caractères phonétiques, l'annotation des rimes, l'annotation des limites du phonème, l'étiquette familière. annotation, etc. de la base de données, qui peut être utilisée directement pour l'optimisation de l'algorithme afin de garantir que le timbre synthétisé est plus stable et naturel.

Base de données synthétique basée sur des scénarios de diffusion en direct

Langue : chinois mandarin, chinois mixte et anglais

Environnement de collection : studio d'enregistrement professionnel, rapport signal/bruit d'au moins 35 dB

Durée des données : 5 heures en chinois, 1 heure en chinois et en anglais

Corpus d'enregistrement : les compétences de livraison en direct d'Anchor

Format d'échantillonnage : format PCM WAV non compressé

Taux d'échantillonnage : 48 KHz 24 bits

Contenu de l'annotation : annotation de caractères phonétiques, annotation de rimes, annotation de limites de phonèmes, accentuation, traînée, rire et autres annotations d'étiquettes

Champs applicables : diffusion en direct

Les partenaires industriels intéressés par les ensembles de données ci-dessus sont invités à nous contacter~

Si les données ci-dessus ne peuvent pas répondre à vos besoins actuels, Biaobei Technology peut également fournir des services de personnalisation de données correspondants pour des groupes de personnes spécifiques, des scénarios spécifiques et des langues spécifiques, et aider pleinement les entreprises clientes à obtenir des services de données satisfaisants.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:sohu.com
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal