


L'IA générative en vogue peut-elle redonner vie aux haut-parleurs intelligents ?
Les produits tels que les enceintes intelligentes, presque oubliés par un grand nombre de consommateurs, n'ont depuis longtemps plus été au centre de l'attention de la plupart des consommateurs après avoir connu la « folie » de 2017 et 2018. Juste au moment où tout le monde pensait que les haut-parleurs intelligents seraient un feu de paille, l’émergence de ChatGPT semble donner une seconde chance aux haut-parleurs intelligents, et a également donné à cette industrie en déclin une nouvelle opportunité. Alors, les haut-parleurs intelligents et la désormais populaire IA générative peuvent-ils créer des étincelles ?
L'IA générative pourrait être une bénédiction déguisée pour l'industrie des enceintes intelligentes. Selon les données pertinentes d'une étude de marché, au premier trimestre 2023, en raison des effets combinés de facteurs tels qu'une forte homogénéité des produits et une baisse de la demande des consommateurs, les ventes au détail en ligne d'enceintes intelligentes nationales se sont élevées à 1,57 million d'unités, soit une autre baisse de 40,6 %. , tandis qu'au cours de l'année 2022, les ventes nationales omnicanales d'enceintes intelligentes s'élevaient à 26,31 millions d'unités, soit une diminution d'une année sur l'autre de 28 %.
Pourquoi les enceintes intelligentes, autrefois très attendues par les grands géants et même considérées comme une possible entrée dans la maison intelligente, ont-elles glissé dans les abysses ces dernières années ? Il n’y a en fait qu’une seule raison, c’est que les haut-parleurs intelligents ne sont vraiment pas assez intelligents.
En 2017, lorsque le concept d'enceintes intelligentes était très populaire, il y a eu un débat dans l'industrie pour savoir si l'objectif des enceintes intelligentes devait être « l'intelligence » ou la « qualité sonore ». En fin de compte, une série de produits axés sur la qualité sonore, tels que Tencent Listening et Apple HomePod, ont utilisé leurs échecs tragiques pour prouver que l’argument de vente des enceintes intelligentes ne peut être que l’intelligence.
Malheureusement, cependant, le niveau d'intelligence de la plupart des haut-parleurs intelligents ne peut être décrit que comme « étendu », tandis que les grands fabricants accordent une attention limitée à l'intelligence artificielle telle que l'ASR (reconnaissance vocale), le traitement sémantique naturel PNL et le champ lointain. la prise de son. Les progrès de la technologie acoustique harmonieuse sont en effet un peu trop optimistes. En fait, le haut-parleur intelligent est très simple d'un point de vue technique. Son mode de fonctionnement consiste à collecter la voix de l'utilisateur, puis à envoyer l'audio au serveur, puis à calculer et produire les résultats, et enfin à envoyer les résultats au haut-parleur intelligent pour qu'il s'allume. dans des comportements spécifiques. Par exemple, ouvrir une application ou répondre à la question d'un utilisateur.
Oui, l'enceinte intelligente elle-même n'a rien à voir avec l'intelligence artificielle. Les vrais corps de Xiaoai, Xiaodu et Tmall Genie sont cachés sur les serveurs correspondants. Tout cela conduit également au fait que la clé pour déterminer l'expérience d'un haut-parleur intelligent est la technologie de capture du son en champ lointain, qui est la capacité de capturer avec précision les commandes vocales de l'utilisateur dans un environnement acoustique complexe. Après tout, l'utilisateur ne peut pas dire « dire ». une blague » et le haut-parleur intelligent écoute. Appelons cela « jouer une chanson ».
La solution pour les haut-parleurs intelligents consiste à utiliser un réseau de microphones à grande échelle pour collecter le son, mais il existe un problème qui n'a pas été résolu, à savoir le réveil vocal (repérage de mots clés). Lorsque vous utilisez des haut-parleurs intelligents, vous devez utiliser des mots de réveil tels que « Salut, Siri », « Xiao Ai Classmate » et « Xiaodu Xiaodu » pour faire savoir au haut-parleur intelligent que vous lui parlez, ce qui signifie que intelligent orateurs L'orateur n'a pas la capacité de servir activement. Plus important encore, en raison de limitations techniques, les haut-parleurs intelligents ont longtemps été capables de comprendre uniquement des instructions simples, telles que « augmenter/diminuer le volume », « jouer la chanson d'un tel », etc. Des instructions plus complexes La reconnaissance des phrases est souvent difficile.
L'importance de l'IA générative telle que ChatGPT et Wenxinyiyan pour les locuteurs intelligents est que la première peut aider les locuteurs intelligents à comprendre des phrases plus complexes et à fournir une communication plus naturelle. Je pense que les amis qui ont utilisé Microsoft Bing Chat, Baidu Wenxinyiyan ou ChatGPT devraient savoir que lorsque vous parlez à ce type d'IA générative, vous n'avez pas besoin d'utiliser une déclaration d'ouverture telle que "Bonjour, ChatGPT", vous pouvez commencer par taper directement le contenu.
L'IA générative étant basée sur un modèle de langage à grande échelle (LLM, Large Language Model), elle ajoute des données d'annotation manuelle et une technologie d'apprentissage par renforcement à partir des commentaires humains, et est complétée par une technologie de graphe de connaissances, c'est-à-dire un multi -diagramme relationnel qui écrit les connaissances en triplets structurés (comprenant des entités, des concepts et des relations), permettant à l'IA de comprendre la signification des instructions humaines et, finalement, de sélectionner le contenu d'une énorme base de données d'informations pour y répondre.
ChatGPT Le plus grand changement par rapport à des produits comme Siri et Xiaoai est la possibilité d'avoir plusieurs cycles de conversations. Comparé à Siri, qui ressemble presque à une « mémoire de poisson », ChatGPT peut toujours parler aux utilisateurs, associé à une perception plus claire des émotions, donnant aux utilisateurs le sentiment qu'ils parlent vraiment à une personne vivante. Pour un produit grand public, les utilisateurs ne se soucient évidemment pas de l'avancée des principes techniques qui le sous-tendent, mais se concentrent sur sa capacité à résoudre les problèmes ou à répondre aux besoins.
Le charme de l'IA générative réside dans sa limite supérieure élevée de capacités. Un exemple typique est Microsoft Copilot. En même temps, il peut également répondre dans une certaine mesure aux besoins sociaux des utilisateurs. ChatGPT a lancé un « compagnon virtuel » sur son modèle et a gagné plus de 1 000 utilisateurs. De manière générale, combiner l’IA générative avec des enceintes intelligentes peut presque compenser les défauts de ces dernières, en leur conférant un niveau d’intelligence exploitable sur le marché grand public.
En fait, certains fabricants d’enceintes intelligentes ont déjà pris des mesures. Par exemple, en février de cette année, alors que Baidu préparait Wen Xin Yi Yan, Xiaodu avait déjà annoncé qu'il intégrerait Wen Xin Yi Yan pour créer le modèle d'IA « Xiaodu Lingji » pour les scénarios d'appareils intelligents en avril, Tmall ; Génie a accédé à "Niaodu" Le "remplacement de la bouche AI" créé par le modèle "l'oiseau divise l'oiseau" a également annoncé son accès au Tongyi Qianwen d'Alibaba.
Mais il faut souligner que l’IA générative n’est pas une « panacée ». Pour l’instant, toute IA générative est confrontée à un problème inévitable : la rareté des ressources informatiques. La nouvelle récente selon laquelle le plafond d'IA génératif GPT-4 est devenu « stupide » a attiré beaucoup d'attention. Par rapport à l'état où il venait de sortir, il est devenu un consensus parmi les utilisateurs sur la qualité du code texte de GPT-4. décliné sous tous ses aspects.
Oui, en fait, non seulement GPT-4, mais aussi les produits destinés au public tels que ChatGPT et Wenxinyiyan ont connu des situations similaires. L'augmentation du nombre d'utilisateurs a entraîné une baisse des performances des grands modèles.
Le principal problème auquel est confronté le domaine de l'IA générative est que les ressources informatiques sont limitées et incapables de faire face à l'afflux d'utilisateurs. Afin de garantir l'expérience utilisateur, de tels produits ne peuvent que réduire les performances des grands modèles et réduire les performances. quantité de contenu généré. Il est temps de « réduire la charge » sur le serveur. En comparaison, la taille actuelle du marché des haut-parleurs intelligents est sans aucun doute plus grande, donc après avoir accédé à l’IA générative, il est presque inévitable de rencontrer des problèmes similaires.
Ce qui est susceptible d'arriver à l'avenir, c'est que le niveau d'intelligence des haut-parleurs intelligents affichera une parabole. L'expérience utilisateur initiale s'améliorera à pas de géant, mais à mesure que le nombre d'utilisateurs continue d'augmenter, les performances intelligentes pourraient augmenter. "dégrader" "Revenir au niveau d'il y a quelques années.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Le groupe de travail sur l'IA générative établi par le Conseil présidentiel des conseillers en science et technologie est conçu pour aider à évaluer les principales opportunités et risques dans le domaine de l'intelligence artificielle et fournir des conseils au président pour garantir que ces technologies sont développées et déployées de manière équitable et sûre. , et de la manière la plus responsable possible. Lisa Su, PDG d'AMD, et Phil Venables, responsable de la sécurité des informations de Google Cloud, sont également membres du groupe de travail. Terence Tao, mathématicien sino-américain et lauréat de la médaille Fields. Le 13 mai, heure locale, le mathématicien sino-américain et lauréat de la médaille Fields Terence Tao a annoncé que lui et la physicienne Laura Greene codirigeraient le groupe de travail sur l'intelligence artificielle générative du Conseil présidentiel américain des conseillers en science et technologie (PCAST).

Source de l'image@visualchinesewen|Wang Jiwei De « humain + RPA » à « humain + IA générative + RPA », comment le LLM affecte-t-il l'interaction homme-machine RPA ? D'un autre point de vue, comment le LLM affecte-t-il la RPA du point de vue de l'interaction homme-machine ? La RPA, qui affecte l'interaction homme-machine dans le développement de programmes et l'automatisation des processus, sera désormais également modifiée par le LLM ? Comment le LLM affecte-t-il l’interaction homme-machine ? Comment l’IA générative modifie-t-elle l’interaction homme-machine de la RPA ? Apprenez-en davantage dans un article : L'ère des grands modèles arrive, et l'IA générative basée sur LLM transforme rapidement l'interaction homme-machine RPA ; l'IA générative redéfinit l'interaction homme-machine, et LLM affecte les changements dans l'architecture logicielle RPA. Si vous demandez quelle est la contribution de la RPA au développement et à l’automatisation des programmes, l’une des réponses est qu’elle a modifié l’interaction homme-machine (HCI, h).

L'IA générative est un type de technologie d'intelligence artificielle humaine qui peut générer différents types de contenu, notamment du texte, des images, de l'audio et des données synthétiques. Alors, qu’est-ce que l’intelligence artificielle ? Quelle est la différence entre l’intelligence artificielle et l’apprentissage automatique ? L'intelligence artificielle est la discipline, une branche de l'informatique, qui étudie la création d'agents intelligents, c'est-à-dire des systèmes capables de raisonner, d'apprendre et d'effectuer des actions de manière autonome. À la base, l’intelligence artificielle concerne les théories et les méthodes de construction de machines qui pensent et agissent comme des humains. Au sein de cette discipline, le machine learning ML est un domaine de l'intelligence artificielle. Il s'agit d'un programme ou d'un système qui entraîne un modèle basé sur des données d'entrée. Le modèle entraîné peut faire des prédictions utiles à partir de données nouvelles ou invisibles dérivées des données unifiées sur lesquelles le modèle a été entraîné.

▲Cette image a été générée par AI. Kujiale, Sanweijia, Dongyi Risheng, etc. ont déjà pris des mesures. La chaîne industrielle de la décoration et de la décoration a introduit l'AIGC à grande échelle. Quelles sont les applications de l'IA générative dans le domaine de la décoration et de la décoration. ? Quel impact cela a-t-il sur les designers ? Un article pour comprendre et dire au revoir à divers logiciels de conception pour générer des rendus en une phrase. L'IA générative bouleverse le domaine de la décoration et de la décoration. L'utilisation de l'intelligence artificielle pour améliorer les capacités améliore l'efficacité de la conception. Quel est l'impact de l'IA générative sur l'industrie de la décoration et de la décoration ? Quelles sont les futures tendances de développement ? Un article pour comprendre comment LLM révolutionne la décoration et la décoration. Ces 28 outils populaires de conception de décoration par IA générative valent la peine d'être essayés Article/Wang Jiwei Dans le domaine de la décoration et de la décoration, il y a eu beaucoup de nouvelles liées à l'AIGC récemment. Collov lance l'outil de conception générative basé sur l'IA Col

L’intelligence artificielle générative (GenAI) devrait devenir une tendance technologique incontournable d’ici 2023, apportant des applications importantes aux entreprises et aux particuliers, notamment dans le domaine de l’éducation, selon un nouveau rapport du cabinet d’études de marché Omdia. Dans le domaine des télécommunications, les cas d'utilisation de GenAI se concentrent principalement sur la fourniture de contenu marketing personnalisé ou sur la prise en charge d'assistants virtuels plus sophistiqués pour améliorer l'expérience client. Bien que l'application de l'IA générative dans les opérations réseau ne soit pas évidente, EnterpriseWeb a développé un concept intéressant : la validation. démontrant le potentiel de l'IA générative sur le terrain, les capacités et les limites de l'IA générative dans l'automatisation des réseaux. L'une des premières applications de l'IA générative dans les opérations de réseau a été l'utilisation de conseils interactifs pour remplacer les manuels d'ingénierie pour aider à installer les éléments du réseau, de

Gu Fan, directeur général du département de développement commercial stratégique d'Amazon Cloud Technology Grande Chine En 2023, les grands modèles linguistiques et l'IA générative « augmenteront » sur le marché mondial, déclenchant non seulement un suivi « écrasant » dans l'IA et l'industrie du cloud computing, mais aussi attirer vigoureusement les géants de la fabrication à rejoindre l'industrie. Le Haier Innovation Design Center a créé la première solution de conception industrielle AIGC du pays, qui a considérablement raccourci le cycle de conception et réduit les coûts de conception conceptuelle. Elle a non seulement accéléré la conception conceptuelle globale de 83 %, mais a également augmenté l'efficacité du rendu intégré d'environ 90 %, de manière efficace. Les problèmes de résolution incluent des coûts de main-d'œuvre élevés et une faible production de concepts et une faible efficacité d'approbation au stade de la conception. La base de connaissances intelligente et le robot conversationnel intelligent « Xiaoyu » de Siemens Chine, basés sur son propre modèle, disposent d'un traitement du langage naturel, d'une récupération de la base de connaissances et d'une grande formation linguistique grâce aux données.

La mise en œuvre de grands modèles s'accélère et la « praticité industrielle » est devenue un consensus de développement. Le 17 mai 2024, le Tencent Cloud Generative AI Industry Application Summit s'est tenu à Pékin, annonçant une série de progrès dans le développement de grands modèles et de produits d'application. Les capacités des grands modèles Hunyuan de Tencent continuent d'être mises à niveau. Plusieurs versions des modèles hunyuan-pro, hunyuan-standard et hunyuan-lite sont ouvertes au monde extérieur via Tencent Cloud pour répondre aux besoins de modèles des entreprises clientes et des développeurs dans différents scénarios et les mettre en œuvre. la solution modèle optimale et rentable. Tencent Cloud propose trois outils majeurs : un moteur de connaissances pour les grands modèles, un moteur de création d'images et un moteur de création vidéo, créant une chaîne d'outils native pour l'ère des grands modèles, simplifiant l'accès aux données, le réglage fin des modèles et les processus de développement d'applications via les services PaaS. pour aider les entreprises

L’essor de l’intelligence artificielle entraîne le développement rapide du développement de logiciels. Cette technologie puissante a le potentiel de révolutionner la façon dont nous construisons des logiciels, avec des impacts considérables sur tous les aspects de la conception, du développement, des tests et du déploiement. Pour les entreprises qui tentent de se lancer dans le domaine du développement dynamique de logiciels, l’émergence de la technologie de l’intelligence artificielle générative leur offre des opportunités de développement sans précédent. En intégrant cette technologie de pointe dans leurs processus de développement, les entreprises peuvent augmenter considérablement l’efficacité de la production, réduire les délais de mise sur le marché des produits et lancer des produits logiciels de haute qualité qui se démarquent sur le marché numérique extrêmement concurrentiel. Selon un rapport de McKinsey, la taille du marché de l’intelligence artificielle générative devrait atteindre 4 400 milliards de dollars d’ici 2031. Ces prévisions reflètent non seulement une tendance, mais montrent également le paysage technologique et commercial.
