Maison

[Original] Utilisez de grands modèles pour prendre automatiquement des notes, extraire des PPT et organiser des entretiens. Le nouveau produit d'IA d'Alibaba Cloud « Tongyi Listening » est ouvert aux tests publics.

[Original] Utilisez de grands modèles pour prendre automatiquement des notes, extraire des PPT et organiser des entretiens. Le nouveau produit d'IA d'Alibaba Cloud « Tongyi Listening » est ouvert aux tests publics.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 02, 2023 pm 07:37 PM

Lire Chen Shu, journaliste du Chuang/Shenzhen Business Daily

Le 1er juin, Alibaba Cloud a annoncé les progrès du modèle à grande échelle Tongyi. Le nouveau produit d'IA « Tongyi Listening » axé sur le contenu audio et vidéo a été officiellement lancé, devenant ainsi le premier produit d'application de modèle à grande échelle en Chine ouvert au public. essai.

【原创】用大模型自动做笔记、提取PPT、整理访谈阿里云AI新产品“通义听悟”开放公测

Tongyi Tingwu est connecté aux capacités de compréhension et de synthèse du grand modèle Tongyi Qianwen et peut devenir un puissant assistant d'IA pour les utilisateurs travaillant et étudiant, aidant à compléter efficacement la transcription, la récupération, la synthèse et l'organisation du contenu audio et vidéo à tout moment. et n'importe où. Par exemple, utilisez de grands modèles pour prendre automatiquement des notes, organiser des entretiens, extraire des PPT, etc. Pendant la période bêta publique, les utilisateurs peuvent bénéficier d'un temps de transcription gratuit pour plus de 100 heures de compréhension orale.

"D'une manière différente, l'audio et la vidéo peuvent être facilement lus, organisés et partagés." Zhou Jingren, directeur technique d'Alibaba Cloud, a présenté que Tingwu est un assistant IA travail-études qui cible des scénarios de contenu audio et vidéo à forte valeur ajoutée de connaissances, tels que Comme les réunions, les cours, les entretiens, les formations, les entretiens, les diffusions en direct, le visionnage de vidéos, l'écoute de podcasts, etc. peuvent rapidement affiner et accumuler des connaissances grâce aux dernières technologies d'IA telles que les grands modèles.

[caption id="attachment_3846381" align="alignnone" width="1000"]

【原创】用大模型自动做笔记、提取PPT、整理访谈阿里云AI新产品“通义听悟”开放公测

Tongyi Listening peut générer automatiquement des résumés en texte intégral, des résumés de chapitre et des résumés de discours pour l'audio et la vidéo[/caption]

Tingwu a présenté une démonstration en direct, qui comprenait plus de dix fonctions d'intelligence artificielle, qui peuvent améliorer considérablement l'efficacité du transfert de connaissances de l'audio et de la vidéo aux graphiques et au texte. En plus d'une « bonne audition », il peut générer des enregistrements de réunion avec une grande précision et distinguer les différents intervenants. Cet assistant IA est également « extrêmement perspicace ». Le grand modèle peut diviser l'audio et la vidéo en chapitres en une seconde et former des résumés, des résumés et des résumés. texte intégral de chaque intervenant. Points de vue, organisation du focus et liste de choses à faire. Un grand modèle sera lancé dans un avenir proche, comprenant des fonctions telles que l'extraction en un clic de PPT, l'interrogation par l'IA de plusieurs contenus audio et vidéo et la synthèse de paragraphes spécifiques.

[caption id="attachment_3846394" align="alignnone" width="736"]

【原创】用大模型自动做笔记、提取PPT、整理访谈阿里云AI新产品“通义听悟”开放公测

Le plug-in Tongyi Tingwu Chrome sera disponible en téléchargement pour tous les utilisateurs dans un avenir proche[/caption]

Pour certains scénarios de niche, Tingwu a également mis en place de nombreuses « fonctions trésor » : ouvrez le plug-in Chrome, les apprenants de langues étrangères et les malentendants peuvent utiliser des sous-titres flottants bilingues pour regarder des vidéos sans sous-titres à tout moment et n'importe où. conflit, Tingwu peut toujours Il peut devenir un « remplaçant de réunion » pour les professionnels Lorsque vous rejoignez une réunion en mode muet, l'IA peut enregistrer la réunion et organiser les points clés en votre nom ; des fichiers pour faciliter la post-production vidéo par les praticiens des nouveaux médias ; l'examen questions-réponses de la compréhension orale peut permettre aux journalistes, analystes, avocats, RH et autres groupes d'organiser les entretiens plus efficacement.

Tingwu est connecté à Alibaba Cloud Disk, et le contenu audio et vidéo sur le disque cloud peut être transcrit en un seul clic. Les utilisateurs de Tingwu qui se sont inscrits pendant la période bêta publique recevront également un espace de stockage Alibaba Cloud Disk plus important et pourront lire des vidéos en ligne dans le cloud. Les sous-titres peuvent également être automatiquement produits lors de la lecture.

Zhou Jingren a présenté que Tingwu intègre la technologie vocale et linguistique la plus avancée d'Alibaba. Il intègre le modèle de reconnaissance vocale de nouvelle génération de qualité industrielle d'Alibaba, et la précision de la reconnaissance se classe au premier rang dans plusieurs ensembles de données chinois faisant autorité ; il intègre l'algorithme de haut-parleur multimodal de sémantique vocale auto-développé et peut distinguer les rôles dans les scènes où plus plus de 10 personnes parlent ; Après avoir accédé au grand modèle Tongyi Qianwen, il peut résumer des dizaines de milliers de mots de contenu audio et vidéo, leader du pays en termes d'exactitude factuelle et d'exhaustivité des points clés, et prend en charge une compréhension précise des questions et réponses à travers plusieurs contenus audio et vidéo.

Critique : Tan Lugang

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Combien de temps faut-il pour battre Split Fiction?

1 Il y a quelques mois By DDD

R.E.P.O. Enregistrer l'emplacement du fichier: où est-il et comment le protéger?

1 Il y a quelques mois By DDD

R.E.P.O. Meilleurs paramètres graphiques

2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

1 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7400

Tutoriel Java

1630

Tutoriel CakePHP

1358

Tutoriel Laravel

1268

Tutoriel PHP

1217

Afficher plus

Related knowledge

J'ai essayé le codage d'ambiance avec Cursor Ai et c'est incroyable! Mar 20, 2025 pm 03:34 PM

Le codage des ambiances est de remodeler le monde du développement de logiciels en nous permettant de créer des applications en utilisant le langage naturel au lieu de lignes de code sans fin. Inspirée par des visionnaires comme Andrej Karpathy, cette approche innovante permet de dev

Comment utiliser Dall-E 3: Conseils, exemples et fonctionnalités Mar 09, 2025 pm 01:00 PM

Dall-E 3: Un outil de création d'images génératifs AI L'IA générative révolutionne la création de contenu, et Dall-E 3, le dernier modèle de génération d'images d'Openai, est à l'avant. Sorti en octobre 2023, il s'appuie sur ses prédécesseurs, Dall-E et Dall-E 2

Top 5 Genai Lunets de février 2025: GPT-4.5, Grok-3 et plus! Mar 22, 2025 am 10:58 AM

Février 2025 a été un autre mois qui change la donne pour une IA générative, nous apportant certaines des mises à niveau des modèles les plus attendues et de nouvelles fonctionnalités révolutionnaires. De Xai's Grok 3 et Anthropic's Claude 3.7 Sonnet, à Openai's G

Comment utiliser YOLO V12 pour la détection d'objets? Mar 22, 2025 am 11:07 AM

Yolo (vous ne regardez qu'une seule fois) a été un cadre de détection d'objets en temps réel de premier plan, chaque itération améliorant les versions précédentes. La dernière version Yolo V12 introduit des progrès qui améliorent considérablement la précision

Elon Musk et Sam Altman s'affrontent plus de 500 milliards de dollars Stargate Project Mar 08, 2025 am 11:15 AM

Le projet de 500 milliards de dollars Stargate IA, soutenu par des géants de la technologie comme Openai, Softbank, Oracle et Nvidia, et soutenu par le gouvernement américain, vise à consolider la direction de l'IA américaine. Cette entreprise ambitieuse promet un avenir façonné par AI Advanceme

Sora vs Veo 2: Laquelle crée des vidéos plus réalistes? Mar 10, 2025 pm 12:22 PM

Veo 2 de Google et Sora d'Openai: Quel générateur de vidéos AI règne en suprême? Les deux plates-formes génèrent des vidéos d'IA impressionnantes, mais leurs forces se trouvent dans différents domaines. Cette comparaison, en utilisant diverses invites, révèle quel outil répond le mieux à vos besoins. T

Google & # 039; s Gencast: Prévision météorologique avec Mini démo Gencast Mar 16, 2025 pm 01:46 PM

Gencast de Google Deepmind: une IA révolutionnaire pour les prévisions météorologiques Les prévisions météorologiques ont subi une transformation spectaculaire, passant des observations rudimentaires aux prédictions sophistiquées alimentées par l'IA. Gencast de Google Deepmind, un terreau

Quelle IA est la meilleure que Chatgpt? Mar 18, 2025 pm 06:05 PM

L'article traite des modèles d'IA dépassant Chatgpt, comme Lamda, Llama et Grok, mettant en évidence leurs avantages en matière de précision, de compréhension et d'impact de l'industrie. (159 caractères)

See all articles