Récemment, Huang Xuedong, le magnat de l'IA et actuel CTO de Zoom, a publié un blog sur son site officiel.
Dans lequel il a présenté avec brio ses réalisations innovantes six mois après avoir rejoint Zoom - Zoom AI Companion, et l'approche fédérée Zoom IA qui anime Zoom AI Companion.
Avant Zoom, Huang Xuedong était directeur de la technologie de Microsoft Azure AI. Il est non seulement le premier académicien technique chinois mondial de Microsoft, mais également le scientifique chinois de plus haut niveau de Microsoft.
Huang Xuedong travaille chez Microsoft depuis plus de 30 ans. Avec son aide, Microsoft a créé son premier institut de recherche asiatique à Pékin en 1998.
Huang Xuedong a été élu membre de l'ACM et de l'IEEE en 2017 et 2020 respectivement, et a été élu académicien de la National Academy of Engineering et de l'American Academy of Arts and Sciences en même temps en 2023
Huang Xuedong a déclaré que le développement de l'intelligence artificielle Le processus d'évolution et de mise en œuvre est comme une route sinueuse, pleine de perturbations, d'adaptations et d'innovations constantes
Je voyage sur cette route depuis 30 ans, s'intéresser à la reconnaissance vocale, à la compréhension du langage naturel et à la vision informatique et à d'autres domaines. Au cours des six mois qui ont suivi mon arrivée chez Zoom, la vitesse de l'innovation a été particulièrement surprenante
Zoom espère utiliser l'IA pour améliorer la façon dont les humains collaborent et augmenter continuellement la productivité.
Zoom fournit depuis de nombreuses années des services d'intelligence artificielle tels que la reconnaissance vocale, la vision par ordinateur, la traduction automatique et les grands modèles linguistiques (LLM) pour améliorer la compétitivité de ses logiciels.
Zoom AI Companion est leur dernier produit, son objectif est d'aider les utilisateurs à améliorer l'efficacité du travail, à promouvoir une collaboration transparente et à obtenir une communication et des informations plus approfondies. L'IA fédérée de Zoom permet aux utilisateurs d'en profiter sans dépenser d'argent supplémentaire sur la base des fonctions de services précédemment payantes d'AI Companion.
De cette façon, l'expérience utilisateur sera considérablement améliorée, et en même temps, la participation des nouvelles technologies parmi les utilisateurs pourra être rapidement augmentée
Pour les logiciels Zoom qui comptent un grand nombre d'utilisateurs et nécessitent une Utilisation des fonctions d'IA, comment partager le surcoût de l'inférence LLM ?
Selon les rumeurs, le Copilot de GitHub coûterait 10 $ par mois, et chaque utilisateur devra payer une subvention supplémentaire de 20 $ par mois
Le modèle de langage actuellement utilisé par Zoom (LLM), y compris ses propres modèles et des modèles tiers, tels que OpenAI GPT-3.5, GPT-4 et Anthropic Claude 2
Zoom Federated AI intègre la dernière technologie LLM de partenaires (comme le nouveau GPT- 4 Turbo), pour améliorer l'expérience de bout en bout des clients Zoom
Zoom adopte une stratégie plus rentable :
Tout d'abord, utilisez un LLM moins coûteux pour terminer la tâche, puis évaluez l'initialisation de la tâche via Z-Scorer Qualité d'achèvement
Zoom adoptera un LLM plus avancé si nécessaire pour améliorer les résultats obtenus par le LLM initial
- Ceci est similaire à une équipe cohésive travaillant ensemble et être capable de faire mieux qu'une seule personne. Produire plus efficacement des produits de meilleure qualité.
Selon les tests internes de Zoom, par rapport à OpenAI GPT-3.5 Turbo ou à plusieurs autres LLM de pointe, Zoom utilise l'IA fédérée pour améliorer la qualité de sortie d'AI Companion et également contrôler efficacement les coûts.
Huang Xuedong a déclaré que sa norme en matière de mesure des performances est de réduire les coûts, d'améliorer la vitesse de réponse et de fournir un résultat de meilleure qualité
Dans la figure ci-dessous, nous pouvons voir la comparaison des performances et des coûts de Zoom AI Companion et de GPT-4 sur la tâche de requête de réunion en anglais
Dans cette figure, nous comparons deux mesures clés, à savoir le coût et la qualité du résultat
Zoom AI Companion atteint une qualité de sortie presque équivalente en utilisant moins de 6 % du coût de GPT-4
Par rapport au modèle GPT-4-32k utilisé par Microsoft Copilot, la fonction de questions de réunion de Zoom AI Companion peut réduire les coûts et accélérer la réponse tout en conservant une qualité de sortie considérable.
L'image ci-dessus est une comparaison entre Zoom AI Companion et GPT-4 sur la tâche récapitulative de la conférence multilingue.
De plus, les performances multilingues d'AI Companion prouvent une fois de plus la puissance de l'IA fédérée de Zoom, prenant en charge 32 languesen plus de l'anglais.
Étant donné que la plupart des LLM sont principalement pré-formés à l'aide de données en anglais, Zoom a ajouté un modèle de traduction pour étendre les capacités multilingues.
Dans la tâche récapitulative de la réunion multilingue, la figure ci-dessus compare les performances de Zoom AI Companion et de Microsoft Copilot. Tous deux utilisent GPT-4 comme proxy pour Microsoft Copilot à des fins de comparaison
Dans le résumé de réunion multilingue de Zoom AI Companion, le texte non anglais est traduit en anglais à l'aide du modèle de traduction de Zoom, qui prend en compte à la fois les données de traduction et les données d'origine. .
Comme le montre la figure, Zoom AI Companion a réalisé une sortie avec une qualité proche de GPT-4-32k (97 %) à un coût inférieur à 6 %.
Zoom estime que les avantages de l'intelligence artificielle devraient être largement accessibles au plus grand nombre, et l'IA fédérée de Zoom joue un rôle important dans la réalisation de cette vision en combinant de manière transparente les avantages de différents systèmes d'IA pour fournir des performances élevées. résultats. Contenu réécrit : Zoom estime que les avantages de l’intelligence artificielle devraient être largement accessibles au plus grand nombre. L'IA fédérée de Zoom peut combiner de manière transparente les avantages de différents systèmes d'intelligence artificielle pour fournir des résultats de haute performance, jouant un rôle important dans la réalisation de cette vision
Actuellement, presque tous les Les capacités d'intelligence artificielle ont été intégrées à Zoom AI Companion, qui a été lancé en septembre de l'année dernière. Le « service de recharge » fourni par Zoom utilise les capacités d'intelligence artificielle de Zoom pour annuler automatiquement la réunion après avoir rejoint la réunion à mi-chemin. manqué
Quand c'est votre tour de parler, vous pouvez combiner vos propres points de vue et le contenu des réunions précédentes pour générer un brouillon de discours, réalisant ainsi une véritable "réunion au nom des utilisateurs"
Après avoir rejoint le réunion à mi-chemin, l'IA peut vous indiquer les points clés de la réunion.
peut également vous aider à transcrire et traduire les discours des autres participants en temps réel, et à obtenir facilement le texte de la discussion de la réunion.
Le rôle de l'IA n'est pas seulement d'organiser des informations fragmentées, mais aussi de générer réunions pour l'équipe Résumé et enregistrement
Vous pouvez résumer les messages courts des clients obtenus à partir de la plateforme Zoom et générer des plans d'exécution spécifiques
Et pour les réunions auxquelles vous ne pouvez pas assister, vous pouvez également organiser directement l'IA sur le programmez un enregistrement intelligent, puis regardez en arrière par segments et points clés.
Derrière l'ensemble de ce compagnon IA, les idées techniques de Zoom et de Huang Xuedong Federal AI sont condensées, utilisant les ressources d'IA appropriées pour traiter les demandes appropriées.
Et Zoom promet qu'il n'utilisera aucun des fichiers audio, vidéo, chat, partage d'écran, pièces jointes ou autres données générées par les clients (telles que les résultats de vote, les tableaux blancs) de l'utilisateur pour entraîner Zoom ou l'IA tierce.
Combien cela coûtera-t-il pour utiliser ces fonctionnalités pratiques et cette IA responsable ?
Avec des prix allant de 150 yuans à 200 yuans, vous pouvez l'utiliser pendant une année entière, et les utilisateurs professionnels peuvent également choisir une version personnalisée
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!