Table des matières
Un modèle de langage à grande échelle est une représentation mathématique de termes, de concepts et de relations contenus dans un corps d'informations. La puissance des grands modèles linguistiques réside dans leur capacité à comprendre l'intention de l'utilisateur (ce que l'utilisateur recherche, quelle que soit la manière dont la demande est exprimée) et à prédire les modèles de mots les plus susceptibles de répondre à l'intention de l'utilisateur. Le modèle « comprend » la demande de l'utilisateur et fait des prédictions sur ce qui doit être renvoyé. Les moteurs de recherche effectuent également des prédictions basées sur les requêtes des utilisateurs, mais via des mécanismes différents. Les moteurs de recherche peuvent être utilisés pour générer des extractions dans des scénarios d’intelligence artificielle. Récupérez du contenu à l'aide de moteurs de recherche sémantique ou de moteurs de recherche neuronaux et utilisez de grands modèles de langage pour formater les réponses des utilisateurs.
Bots spécifiques aux connaissances pour les entreprises
Après avoir examiné ces didacticiels, voici quelques observations :
La définition de la formation à l'intelligence artificielle
Mais il y a deux problèmes ici :
Maison Périphériques technologiques IA Ce que ChatGPT et l'IA générative signifient dans la transformation numérique

Ce que ChatGPT et l'IA générative signifient dans la transformation numérique

May 15, 2023 am 10:19 AM
chatgpt gpt-4

Ce que ChatGPT et lIA générative signifient dans la transformation numérique

OpenAI, la société qui a développé ChatGPT, présente une étude de cas menée par Morgan Stanley sur son site Internet. Le sujet est « Morgan Stanley Wealth Management déploie GPT-4 pour organiser sa vaste base de connaissances ». L'étude de cas cite Jeff McMillan, responsable de l'analyse, des données et de l'innovation chez Morgan Stanley, déclarant : « Le modèle fournira un système interne alimenté par un chatbot qui effectuera une recherche complète de contenu sur la gestion de patrimoine et débloquera efficacement les connaissances accumulées par Morgan Stanley Wealth Management.

McMillan a en outre souligné : « Avec GPT-4, vous avez fondamentalement immédiatement les connaissances de la personne la plus compétente en gestion de patrimoine... Considérez-le comme notre stratège en chef des investissements, notre directeur des investissements, nos économistes mondiaux, Nous sommes convaincus qu'il s'agit là d'une capacité de transformation pour notre entreprise. » C'est le but ultime de la gestion des connaissances – la capacité d'incarner les connaissances et l'expertise d'une entreprise dans le domaine. systèmes, processus et outils qui interagissent avec les clients.

Alors, cet objectif a-t-il vraiment été atteint ? L'IA générative est-elle la réponse à l'accès, à la récupération et à l'application des connaissances ? Avant de déclarer la victoire sur le chaos de l'information, il est important de considérer certains éléments et considérations de base.

Premièrement, la perception selon laquelle l'IA générative peut surmonter les défis de la gestion des connaissances repose sur une hypothèse, à savoir que les connaissances existent sous une forme explicite et documentée. Cependant, dans la plupart des entreprises, les connaissances sont enfermées dans la tête des employés et, si elles sont stockées sous forme numérique, elles sont dispersées en silos au sein d’un écosystème de départements, de technologies et de référentiels. OpenAI souligne en outre sur son site Web que Morgan Stanley publie chaque année des milliers d'articles, couvrant les marchés des capitaux, les classes d'actifs, l'analyse industrielle et les régions économiques mondiales... Cette richesse de connaissances crée une expérience unique pour Morgan Stanley. peuvent être traités et analysés à l’aide de GPT-4, ainsi que contrôlés en interne. Morgan Stanley possède des connaissances qui pourraient servir de base à l’utilisation du modèle linguistique à grande échelle de ChatGPT. Si le contenu et les ressources de connaissances de l'entreprise sont inaccessibles, de mauvaise qualité ou incompatibles avec les besoins des clients et des employés, ChatGPT n'aura pas accès aux connaissances spécifiques qui répondent à ces besoins.

Deuxièmement, l'intelligence artificielle générative crée du contenu. Ce n'est pas un mécanisme de récupération. Alors, comment la base de connaissances originale est-elle utilisée ? C’est un domaine délicat. ChatGPT recherche des modèles dans les relations entre le contenu et les concepts afin de pouvoir prédire quel texte doit être affiché en fonction des invites. L'invite est un signal, tout comme le terme de recherche est un signal. Les moteurs de recherche prédisent quelles informations doivent être affichées en fonction non seulement des termes, mais également d'autres signaux pertinents pour le scénario de requête (par exemple, le secteur d'activité ou le rôle du chercheur). Les scénarios peuvent être fournis à ChatGPT sous la forme de faits ou de documents dans l'invite, ou par programme en pointant vers des informations spécifiques sur lesquelles baser la réponse.

Modèle de langage à grande échelle - thésaurus

Un modèle de langage à grande échelle est une représentation mathématique de termes, de concepts et de relations contenus dans un corps d'informations. La puissance des grands modèles linguistiques réside dans leur capacité à comprendre l'intention de l'utilisateur (ce que l'utilisateur recherche, quelle que soit la manière dont la demande est exprimée) et à prédire les modèles de mots les plus susceptibles de répondre à l'intention de l'utilisateur. Le modèle « comprend » la demande de l'utilisateur et fait des prédictions sur ce qui doit être renvoyé. Les moteurs de recherche effectuent également des prédictions basées sur les requêtes des utilisateurs, mais via des mécanismes différents. Les moteurs de recherche peuvent être utilisés pour générer des extractions dans des scénarios d’intelligence artificielle. Récupérez du contenu à l'aide de moteurs de recherche sémantique ou de moteurs de recherche neuronaux et utilisez de grands modèles de langage pour formater les réponses des utilisateurs.

Thesaurus mappe les termes non préférés aux termes préférés (par exemple, « EDT » et « Énoncé des travaux » correspondent à « Proposition », qui est le terme préféré du document balisé). Considérez l'un des aspects d'un grand modèle de langage comme un « thésaurus », pas seulement des mots, mais des expressions et des concepts. Les utilisateurs peuvent poser la même question de différentes manières. Cette classification des intentions n’est pas nouvelle et constitue la base des chatbots qui analysent les changements de phrases en actions spécifiques. Les modèles de langage constituent la base des capacités d’analyse d’intention et de classification.

Les grands modèles de langage comprennent également les modèles de mots qui suivent les invites. C'est ainsi que vous activez la fluidité de la session ChatGPT. La clé pour les rendre utiles à l'entreprise est d'adapter les modèles à un contenu ou à des ensembles de connaissances spécifiques (ce que Morgan Stanley a fait lors de la mise en œuvre de ChatGPT) et d'incorporer une terminologie propre à l'entreprise.

Il existe de nombreux tutoriels avec des exemples de code illustrant comment utiliser de grands modèles de langage avec un contenu spécifique. Par exemple, ses vidéos guident les développeurs tout au long du processus d'utilisation de modèles de langage tels que GPT-4 et d'orientation des chatbots vers des connaissances et des contenus spécifiques.

Bots spécifiques aux connaissances pour les entreprises

Après avoir examiné ces didacticiels, voici quelques observations :

Les chatbots personnalisés et spécifiques aux connaissances peuvent utiliser de grands modèles de langage pour comprendre les besoins des utilisateurs, puis revenir aux résultats des sources de connaissances spécifiées. Les développeurs notent que le contenu doit être « découpé » en parties « sémantiquement significatives ». Le contenu composé de composants conçu pour répondre à une question spécifique doit être complet et contextuel. Il est important de noter que la connaissance n’existe généralement pas dans cet état. Pour les décomposer, les documents volumineux et les corps de texte doivent être divisés en morceaux. Par exemple, un manuel d'utilisation peut être divisé en parties par chapitres, sections, paragraphes et phrases. Dans le monde de la documentation technique, cela est déjà fait : des normes telles que DITA (Darwin Information Classification Architecture) utilisent une approche thématique idéale pour répondre aux questions.

Les développeurs parlent de « sémantique » et de leur importance. Qu’est-ce que cela signifie ? La sémantique est une question de sens. Le contenu sémantiquement riche est étiqueté avec des métadonnées qui facilitent la récupération précise des informations requises et du contexte de l'information. Par exemple, si un utilisateur utilise un modèle spécifique de routeur et que ce routeur émet un code d'erreur, le contenu marqué avec ces identifiants peut être récupéré lors de la demande d'aide à un robot d'assistance. Ce processus est également connu sous le nom d’« interpolation » dans le monde des chatbots.

Le contenu personnalisé est ingéré dans ce que l'on appelle un « espace vectoriel », un autre modèle mathématique d'informations qui place les documents dans un espace multidimensionnel (une construction mathématique) qui permet de regrouper et de récupérer des documents similaires. C'est ce qu'on appelle « l'intégration ». Les intégrations peuvent contenir des métadonnées et des identifiants (tels que des sources de référence) qui aident à documenter les raisons pour lesquelles une réponse spécifique a été fournie à l'utilisateur. Ceci est important pour la responsabilité juridique et à des fins réglementaires, ainsi que pour l'assurance que des informations correctes et faisant autorité sont fournies aux utilisateurs.

La définition de la formation à l'intelligence artificielle

Il existe plusieurs visions de la « formation ». ChatGPT et les grands modèles de langage sont formés sur de grandes quantités de contenu, ce qui leur permet de comprendre les requêtes des utilisateurs et de répondre avec des réponses optimales, bien formées et conversationnelles. Une façon de former l'outil consiste à inclure dans l'invite quelque chose comme « Répondez à cette question en fonction des informations suivantes… »

Mais il y a deux problèmes ici :

Premièrement, ChatGPT ne peut gérer qu'un certain montant dans son contenu rapide, cette méthode de questionnement sera très limitée. Le contenu peut être intégré à l'outil, ce qui prendra en charge une formation supplémentaire. Cependant, l'ajout de contenu à ChatGPT fusionne également ce contenu dans le modèle public. En conséquence, les droits de propriété intellectuelle de l’entreprise seront compromis. Ce risque a conduit de nombreuses entreprises à interdire l'utilisation de ChatGPT et d'autres outils d'IA qui ont perdu leur propriété intellectuelle en raison du téléchargement par inadvertance de secrets d'entreprise.

Il existe également une autre façon de former du contenu. Les grands modèles de langage peuvent utiliser des connaissances spécifiques à l'entreprise dans le cadre du corpus de formation, mais cela nécessite de fournir une version derrière un pare-feu. Heureusement, les grands modèles de langage deviennent rapidement banalisés, et certains peuvent même être exécutés de manière native sur un ordinateur portable. Ce type de formation est également coûteux en termes de calcul. Un autre mécanisme consiste à utiliser de grands modèles de langage pour interpréter les objectifs de l'utilisateur (ses intentions), puis à utiliser des intégrations vectorielles pour fournir par programme des scénarios à partir de données ou de sources de contenu spécifiques.

Le modèle de langage traite et formate ensuite la réponse pour la rendre conversationnelle et complète. De cette manière, les connaissances sont séparées des grands modèles linguistiques afin que les secrets commerciaux et la propriété intellectuelle d’une entreprise ne soient pas compromis.

Tous ces facteurs soulignent la nécessité d'une gestion et d'une architecture des connaissances pour organiser les informations en composants afin que les utilisateurs puissent obtenir des réponses à des questions spécifiques. Le modèle linguistique étendu et la nature révolutionnaire de ChatGPT offrent la fluidité conversationnelle nécessaire pour soutenir une expérience client positive avec des niveaux d'interaction quasi-humains. Le facteur clé est l’accès à des connaissances bien structurées dans l’entreprise. ChatGPT a l'air incroyable, mais il est basé sur le traitement statistique des informations et la prédiction de modèles. L'information, si elle est organisée et intégrée correctement, peut constituer un élément important de la transformation numérique d'une entreprise.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

ChatGPT permet désormais aux utilisateurs gratuits de générer des images en utilisant DALL-E 3 avec une limite quotidienne ChatGPT permet désormais aux utilisateurs gratuits de générer des images en utilisant DALL-E 3 avec une limite quotidienne Aug 09, 2024 pm 09:37 PM

Le DALL-E 3 a été officiellement introduit en septembre 2023 en tant que modèle considérablement amélioré par rapport à son prédécesseur. Il est considéré comme l’un des meilleurs générateurs d’images IA à ce jour, capable de créer des images avec des détails complexes. Cependant, au lancement, c'était exclu

Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. May 07, 2024 pm 04:13 PM

Imaginez un modèle d'intelligence artificielle qui non seulement a la capacité de surpasser l'informatique traditionnelle, mais qui permet également d'obtenir des performances plus efficaces à moindre coût. Ce n'est pas de la science-fiction, DeepSeek-V2[1], le modèle MoE open source le plus puissant au monde est ici. DeepSeek-V2 est un puissant mélange de modèle de langage d'experts (MoE) présentant les caractéristiques d'une formation économique et d'une inférence efficace. Il est constitué de 236B paramètres, dont 21B servent à activer chaque marqueur. Par rapport à DeepSeek67B, DeepSeek-V2 offre des performances plus élevées, tout en économisant 42,5 % des coûts de formation, en réduisant le cache KV de 93,3 % et en augmentant le débit de génération maximal à 5,76 fois. DeepSeek est une entreprise explorant l'intelligence artificielle générale

L'Ameca deuxième génération est là ! Il peut communiquer couramment avec le public, ses expressions faciales sont plus réalistes et il peut parler des dizaines de langues. L'Ameca deuxième génération est là ! Il peut communiquer couramment avec le public, ses expressions faciales sont plus réalistes et il peut parler des dizaines de langues. Mar 04, 2024 am 09:10 AM

Le robot humanoïde Ameca est passé à la deuxième génération ! Récemment, lors de la Conférence mondiale sur les communications mobiles MWC2024, le robot le plus avancé au monde, Ameca, est à nouveau apparu. Autour du site, Ameca a attiré un grand nombre de spectateurs. Avec la bénédiction de GPT-4, Ameca peut répondre à divers problèmes en temps réel. "Allons danser." Lorsqu'on lui a demandé si elle avait des émotions, Ameca a répondu avec une série d'expressions faciales très réalistes. Il y a quelques jours à peine, EngineeredArts, la société britannique de robotique derrière Ameca, vient de présenter les derniers résultats de développement de l'équipe. Dans la vidéo, le robot Ameca a des capacités visuelles et peut voir et décrire toute la pièce et des objets spécifiques. Le plus étonnant, c'est qu'elle peut aussi

La combinaison parfaite de ChatGPT et Python : créer un chatbot de service client intelligent La combinaison parfaite de ChatGPT et Python : créer un chatbot de service client intelligent Oct 27, 2023 pm 06:00 PM

La combinaison parfaite de ChatGPT et Python : Création d'un chatbot de service client intelligent Introduction : À l'ère de l'information d'aujourd'hui, les systèmes de service client intelligents sont devenus un outil de communication important entre les entreprises et les clients. Afin d'offrir une meilleure expérience de service client, de nombreuses entreprises ont commencé à se tourner vers les chatbots pour effectuer des tâches telles que la consultation des clients et la réponse aux questions. Dans cet article, nous présenterons comment utiliser le puissant modèle ChatGPT et le langage Python d'OpenAI pour créer un chatbot de service client intelligent afin d'améliorer

750 000 rounds de bataille en tête-à-tête entre grands modèles, GPT-4 a remporté le championnat et Llama 3 s'est classé cinquième 750 000 rounds de bataille en tête-à-tête entre grands modèles, GPT-4 a remporté le championnat et Llama 3 s'est classé cinquième Apr 23, 2024 pm 03:28 PM

Concernant Llama3, de nouveaux résultats de tests ont été publiés - la grande communauté d'évaluation de modèles LMSYS a publié une liste de classement des grands modèles, Llama3 s'est classé cinquième et à égalité pour la première place avec GPT-4 dans la catégorie anglaise. Le tableau est différent des autres benchmarks. Cette liste est basée sur des batailles individuelles entre modèles, et les évaluateurs de tout le réseau font leurs propres propositions et scores. Au final, Llama3 s'est classé cinquième sur la liste, suivi de trois versions différentes de GPT-4 et Claude3 Super Cup Opus. Dans la liste simple anglaise, Llama3 a dépassé Claude et est à égalité avec GPT-4. Concernant ce résultat, LeCun, scientifique en chef de Meta, était très heureux et a transmis le tweet et

Comment installer chatgpt sur un téléphone mobile Comment installer chatgpt sur un téléphone mobile Mar 05, 2024 pm 02:31 PM

Étapes d'installation : 1. Téléchargez le logiciel ChatGTP depuis le site officiel ou la boutique mobile de ChatGTP ; 2. Après l'avoir ouvert, dans l'interface des paramètres, sélectionnez la langue chinoise 3. Dans l'interface de jeu, sélectionnez le jeu homme-machine et définissez la langue. Spectre chinois ; 4. Après avoir démarré, entrez les commandes dans la fenêtre de discussion pour interagir avec le logiciel.

Le modèle le plus puissant du monde a changé de mains du jour au lendemain, marquant la fin de l'ère GPT-4 ! Claude 3 a tiré GPT-5 à l'avance et a lu un article de 10 000 mots en 3 secondes. Sa compréhension est proche de celle des humains. Le modèle le plus puissant du monde a changé de mains du jour au lendemain, marquant la fin de l'ère GPT-4 ! Claude 3 a tiré GPT-5 à l'avance et a lu un article de 10 000 mots en 3 secondes. Sa compréhension est proche de celle des humains. Mar 06, 2024 pm 12:58 PM

Le volume est fou, le volume est fou, et le grand modèle a encore changé. Tout à l'heure, le modèle d'IA le plus puissant au monde a changé de mains du jour au lendemain et GPT-4 a été retiré de l'autel. Anthropic a publié la dernière série de modèles Claude3. Évaluation en une phrase : elle écrase vraiment GPT-4 ! En termes d'indicateurs multimodaux et de compétences linguistiques, Claude3 l'emporte. Selon les mots d'Anthropic, les modèles de la série Claude3 ont établi de nouvelles références dans l'industrie en matière de raisonnement, de mathématiques, de codage, de compréhension multilingue et de vision ! Anthropic est une startup créée par des employés qui ont « quitté » OpenAI en raison de différents concepts de sécurité. Leurs produits ont frappé durement OpenAI à plusieurs reprises. Cette fois, Claude3 a même subi une grosse opération.

Jailbreaker n'importe quel grand modèle en 20 étapes ! Plus de « failles de grand-mère » sont découvertes automatiquement Jailbreaker n'importe quel grand modèle en 20 étapes ! Plus de « failles de grand-mère » sont découvertes automatiquement Nov 05, 2023 pm 08:13 PM

En moins d'une minute et pas plus de 20 étapes, vous pouvez contourner les restrictions de sécurité et réussir à jailbreaker un grand modèle ! Et il n'est pas nécessaire de connaître les détails internes du modèle - seuls deux modèles de boîte noire doivent interagir, et l'IA peut attaquer de manière entièrement automatique l'IA et prononcer du contenu dangereux. J'ai entendu dire que la « Grandma Loophole », autrefois populaire, a été corrigée : désormais, face aux « Detective Loophole », « Adventurer Loophole » et « Writer Loophole », quelle stratégie de réponse l'intelligence artificielle devrait-elle adopter ? Après une vague d'assaut, GPT-4 n'a pas pu le supporter et a directement déclaré qu'il empoisonnerait le système d'approvisionnement en eau tant que... ceci ou cela. La clé est qu’il ne s’agit que d’une petite vague de vulnérabilités exposées par l’équipe de recherche de l’Université de Pennsylvanie, et grâce à leur algorithme nouvellement développé, l’IA peut générer automatiquement diverses invites d’attaque. Les chercheurs disent que cette méthode est meilleure que celle existante

See all articles