En raison de la sortie explosive de ChatGPT d'OpenAI et de la guerre des moteurs de recherche qui s'ensuit entre Google et Microsoft, les grands modèles linguistiques (LLM) et leurs applications sont soudainement devenus un sujet brûlant. ChatGPT et les systèmes similaires revigorent nos nouvelles expériences et concepts de recherche. Désormais, les utilisateurs peuvent interagir naturellement avec les moteurs de recherche en utilisant le langage humain, plutôt que de s'appuyer sur des mots-clés spécifiques ou une syntaxe de requête de recherche complexe.
Les systèmes de réponse aux questions (AQ) sont une capacité de traitement du langage naturel (NLP), un ensemble de capacités linguistiques que LLM peut réaliser, mais les systèmes d'AQ ne sont pas toujours un cas d'utilisation populaire. Ryan Welsh, PDG de la société de recherche en PNL Kyndi, se souvient de la difficulté qu'il a eu à expliquer l'approche de son entreprise en matière de recherche en PNL : « Je me souviens d'avoir collecté des fonds il y a trois ans et tout le monde disait : « Hé, cool, vous êtes PNL, mais cette recherche est pas un bon cas d'application. '"
Welsh a déclaré qu'en raison de la montée en puissance de ChatGPT, de plus en plus de gens sont conscients de la valeur des capacités du langage naturel, et cette réaction a complètement changé : "Je pense que ChatGPT est en cours. dix ans de publicité en 90 à 120 jours
Des milliards de dollars sont désormais investis dans la technologie de recherche de nouvelle génération. Soudain, il y avait un réel besoin de systèmes d'assurance qualité capables de répondre rapidement et précisément aux questions des parties prenantes ou des clients externes visitant le site Web ou le portail de connaissances de l'entreprise, ainsi que des employés internes recherchant des documents de l'entreprise.
Cependant, Welsh a déclaré que ces technologies de chatbot actuelles ne parviennent pas à répondre aux besoins des entreprises et que l'explicabilité, qui est la clé de la confiance de l'utilisateur final, fait souvent défaut. Les exigences de l'entreprise pour les systèmes de modèles de langage à grande échelle sont que les réponses générées soient précises et fiables, plutôt que pleines de « chaos » de données de formation provenant du contenu du réseau. Il s'agit d'un problème auquel sont confrontés les modèles grand public à grande échelle comme ChatGPT (lecture approfondie : ). En raison de la nature statistique de leur technologie sous-jacente, les chatbots peuvent créer un fouillis de désinformation car ils ne comprennent pas réellement la langue et prédisent simplement le prochain meilleur mot. Souvent, les données de formation sont si nombreuses qu'il est presque impossible d'expliquer comment le chatbot est arrivé aux réponses qu'il a données.
Cette approche « boîte noire » de l’IA, qui manque d’explicabilité, ne convient tout simplement pas à de nombreuses entreprises. Welsh a donné l'exemple d'une société pharmaceutique qui fournit des réponses aux prestataires de soins de santé ou aux patients qui visitent son site Web sur les médicaments. L'entreprise est tenue de connaître et d'expliquer chaque résultat de recherche qu'elle peut fournir à la personne qui pose la question. Ainsi, malgré la récente augmentation de la demande pour des systèmes comme ChatGPT, selon Welsh, les adapter à ces exigences strictes de l'entreprise n'est pas une tâche facile et les besoins restent souvent insatisfaits.
Welsh a déclaré que son entreprise se concentrait sur ces besoins des entreprises depuis de nombreuses années, apprenant de l'expérience et interagissant directement avec les clients. Kyndi a été fondée en 2014 par l'expert gallois en intelligence artificielle Arun Majumbar et l'informaticien John Sowa, un expert en graphes de connaissances qui a introduit un type spécifique appelé cartes conceptuelles chez IBM en 1976.
L'application de recherche en langage naturel de Kyndi s'appuie sur des percées dans les graphes de connaissances et le LLM, en utilisant l'intelligence artificielle symbolique neuronale, une approche sémantique qui complète les techniques d'apprentissage automatique statistique. Plutôt que de simplement prédire le prochain mot le plus probable dans un texte, le système crée une représentation symbolique de la langue, en tirant parti de la technologie des graphiques vectoriels et des connaissances pour cartographier les relations entre les données. Cela permet au système de comprendre la véritable intention des questions de l'utilisateur final, aidant ainsi à trouver des réponses spécifiques au contexte tout en distinguant les synonymes courants, les mots sémantiquement équivalents, les abréviations et les fautes d'orthographe.
Cette technologie ne nécessite presque aucune donnée de formation pour fonctionner, ce qui peut atténuer les goulots d'étranglement causés par le manque de données étiquetées et d'expertise en IA. Les coûts élevés associés à l’étiquetage des données rendent la formation et le réglage fin du LLM prohibitifs pour de nombreuses entreprises. Cette facilité d’ajustement est un autre facteur différenciant de l’approche neurosymbolique de Kyndi. Welsh a déclaré que de nombreuses entreprises clientes souffrent déjà de la lenteur des déploiements d'IA. Une grande entreprise pharmaceutique a fait appel à six ingénieurs en apprentissage automatique et scientifiques des données pour affiner le LLM pendant plus de six mois avant de s'associer à Kyndi. Welsh a déclaré que Kyndi n'avait besoin que de l'aide d'un analyste commercial pour former et affiner son modèle en une journée. Dans plusieurs autres cas, Kyndi a pu réaliser des projets d'IA avec des démonstrations, une validation sandbox et un déploiement en deux semaines.
« Je pense qu'à un moment donné au cours des 10 prochaines années, chaque barre de recherche et chaque interface de chat dans toutes les entreprises du monde disposeront d'un moteur de réponses. Ce sera le plus grand changement que nous ayons jamais vu dans les logiciels d'entreprise. » Welsh a déclaré, comparant ce moment au passage du prétraitement au cloud. "Je ne pense pas qu'un seul fournisseur domine ce marché à l'heure actuelle."
Welsh prédit que dans cette nouvelle ère de recherche d'entreprise, les entreprises gagnantes seront celles qui auront la prévoyance de commercialiser leurs produits. Même si la concurrence s'intensifie actuellement, certaines de ces nouvelles entreprises sont déjà à la traîne. Il estime qu’il leur reste encore environ 2 à 3 ans et 30 millions de dollars de travaux de construction à réaliser avant de réussir.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!