Maison Périphériques technologiques IA Considérez LLM comme un système d'exploitation, il a un contexte « virtuel » illimité, le nouveau travail de Berkeley a reçu 1,7 000 étoiles

Considérez LLM comme un système d'exploitation, il a un contexte « virtuel » illimité, le nouveau travail de Berkeley a reçu 1,7 000 étoiles

Oct 19, 2023 pm 12:21 PM
理论 Grand modèle pré-entraîné

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

Ces dernières années, les grands modèles de langage (LLM) et leur architecture de transformateur sous-jacente sont devenus la pierre angulaire de l'IA conversationnelle et ont donné naissance à un large éventail d'applications grand public et d'entreprise. Malgré des progrès considérables, la fenêtre contextuelle de longueur fixe utilisée par LLM limite considérablement l'applicabilité aux longues conversations ou au raisonnement sur de longs documents. Même pour les LLM open source les plus largement utilisés, leur longueur d'entrée maximale ne permet que la prise en charge de quelques dizaines de réponses aux messages ou d'inférences de documents courts.

Dans le même temps, limité par le mécanisme d'auto-attention de l'architecture du transformateur, la simple extension de la longueur du contexte du transformateur entraînera également une augmentation exponentielle du temps de calcul et du coût de la mémoire, ce qui fait de la nouvelle architecture de contexte long une recherche urgente. sujet.

Cependant, même si nous pouvons surmonter les défis informatiques liés à la mise à l'échelle du contexte, des recherches récentes montrent que les modèles à contexte long ont du mal à utiliser efficacement le contexte supplémentaire.

Comment résoudre cela ? Compte tenu des ressources massives requises pour former SOTA LLM et des rendements apparemment décroissants de la mise à l'échelle du contexte, nous avons un besoin urgent de techniques alternatives prenant en charge les contextes longs. Des chercheurs de l’Université de Californie à Berkeley ont réalisé de nouveaux progrès à cet égard.

Dans cet article, les chercheurs explorent comment créer l'illusion d'un contexte infini tout en continuant à utiliser un modèle de contexte fixe. Leur approche emprunte des idées à la pagination de la mémoire virtuelle, permettant aux applications de traiter des ensembles de données dépassant largement la mémoire disponible.

Sur la base de cette idée, les chercheurs ont profité des dernières avancées en matière de capacités d'appel de fonctions d'agent LLM pour concevoir un système LLM inspiré du système d'exploitation pour la gestion du contexte virtuel - MemGPT.

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

Page d'accueil du papier : https://memgpt.ai/

Adresse arXiv : https://arxiv.org/pdf/2310.08560.pdf

Le projet est open source et a gagné 1,7k étoiles sur GitHub quantité.

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

Adresse GitHub : https://github.com/cpacker/MemGPT

Présentation de la méthode

Cette recherche s'inspire de la gestion hiérarchique de la mémoire des systèmes d'exploitation traditionnels, dans des fenêtres contextuelles (similaires aux systèmes d'exploitation) Informations de « page » entrant et sortant entre la « mémoire principale ») et le stockage externe. MemGPT est responsable de la gestion du flux de contrôle entre la mémoire, les modules de traitement LLM et les utilisateurs. Cette conception permet une modification itérative du contexte au cours d'une seule tâche, permettant à l'agent d'utiliser plus efficacement sa fenêtre contextuelle limitée.

MemGPT traite les fenêtres contextuelles comme des ressources de mémoire contraintes et conçoit une structure hiérarchique pour LLM similaire à la mémoire hiérarchique des systèmes d'exploitation traditionnels (Patterson et al., 1988). Afin de fournir une longueur de contexte plus longue, cette recherche permet à LLM de gérer le contenu placé dans sa fenêtre contextuelle via "LLM OS" - MemGPT. MemGPT permet à LLM de récupérer des données historiques pertinentes perdues dans leur contexte, à l'instar des défauts de page dans les systèmes d'exploitation. De plus, les agents peuvent modifier de manière itérative le contenu d’une fenêtre contextuelle de tâche unique, tout comme un processus peut accéder de manière répétée à la mémoire virtuelle.

MemGPT permet à LLM de gérer des contextes illimités lorsque la fenêtre de contexte est limitée. Les composants de MemGPT sont présentés dans la figure 1 ci-dessous.

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

MemGPT coordonne le mouvement des données entre le contexte principal (contenu dans la fenêtre contextuelle) et le contexte externe via des appels de fonction, des mises à jour et des récupérations de manière autonome en fonction du contexte actuel.

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star
把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

Il convient de noter que la fenêtre contextuelle doit utiliser un jeton d'avertissement pour marquer ses limites, comme le montre la figure 3 ci-dessous :

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

Expériences et résultats

Dans la partie expérimentale, les chercheurs ont évalué MemGPT dans deux domaines à contexte long, à savoir les agents conversationnels et le traitement de documents. Pour les agents conversationnels, ils ont étendu l'ensemble de données de discussion multisession existant (Xu et al. (2021)) et introduit deux nouvelles tâches de conversation pour évaluer la capacité de l'agent à conserver ses connaissances lors de longues conversations. Pour l'analyse des documents, ils comparent MemGPT sur les tâches proposées par Liu et al. (2023a), notamment la réponse aux questions et la récupération des valeurs-clés de documents longs.

MemGPT pour les agents conversationnels

Lorsqu'il parle à l'utilisateur, l'agent doit répondre aux deux critères clés suivants.

  • L'une est la cohérence, c'est-à-dire que l'agent doit maintenir la cohérence de la conversation, et les nouveaux faits, références et événements fournis doivent être cohérents avec les déclarations précédentes de l'utilisateur et de l'agent.

  • La seconde est la participation, c'est-à-dire que l'agent doit utiliser les connaissances à long terme de l'utilisateur pour personnaliser la réponse. Faire référence à des conversations précédentes peut rendre la conversation plus naturelle et engageante.

Par conséquent, les chercheurs ont évalué MemGPT sur la base de ces deux critères :

  • MemGPT peut-il exploiter sa mémoire pour améliorer la cohérence conversationnelle ? Pouvez-vous vous souvenir de faits, de citations et d’événements pertinents issus d’interactions passées pour maintenir la cohérence ?

  • MemGPT peut-il utiliser la mémoire pour générer des conversations plus engageantes ? Fusionner spontanément les informations des utilisateurs distants pour personnaliser les informations ?

Concernant l'ensemble de données utilisé, les chercheurs ont évalué MemGPT et des modèles de base à contexte fixe sur le chat multi-session (MSC) proposé par Xu et al.

Commençons par l’évaluation de la cohérence. Les chercheurs ont introduit une tâche de récupération de mémoire profonde (DMR) basée sur l'ensemble de données MSC pour tester la cohérence de l'agent conversationnel. Dans DMR, un utilisateur pose une question à un agent conversationnel, et la question fait explicitement référence à une conversation précédente, en espérant que la plage de réponses sera très étroite. Pour plus de détails, veuillez vous référer à l'exemple de la figure 5 ci-dessous.

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

MemGPT utilise la mémoire pour maintenir la cohérence. Le tableau 2 ci-dessous montre la comparaison des performances de MemGPT par rapport aux modèles de base de mémoire fixe, notamment GPT-3.5 et GPT-4.

On peut voir que MemGPT est nettement meilleur que GPT-3.5 et GPT-4 en termes de précision du jugement LLM et de score ROUGE-L. MemGPT peut utiliser la mémoire de rappel pour interroger l'historique des conversations passées afin de répondre aux questions DMR, plutôt que de s'appuyer sur un résumé récursif pour élargir le contexte.

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

Puis dans la tâche « Conversation Starter », les chercheurs ont évalué la capacité de l'agent à extraire des messages engageants à partir des connaissances accumulées lors des conversations précédentes et à les transmettre à l'utilisateur.

Les chercheurs présentent les scores CSIM des remarques liminaires de MemGPT dans le tableau 3 ci-dessous. Les résultats montrent que MemGPT est capable de produire des intros attrayantes qui fonctionnent aussi bien, voire mieux, que les intros manuscrites humaines. On observe également que MemGPT a tendance à produire des ouvertures plus longues et couvrant plus d’informations sur les caractères que la ligne de base humaine. La figure 6 ci-dessous est un exemple.

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

MemGPT pour l'analyse de documents

Pour évaluer la capacité de MemGPT à analyser des documents, les chercheurs ont effectué MemGPT et la fixation sur la tâche d'assurance qualité des documents de récupération et de lecture de Liu et al (2023a). Les modèles de base contextuels sont comparés.

Les résultats montrent que MemGPT est capable d'effectuer efficacement plusieurs appels au récupérateur en interrogeant le stockage d'archives, lui permettant ainsi de s'adapter à des longueurs de contexte efficaces plus grandes. MemGPT récupère activement les documents du magasin d'archives et peut parcourir les résultats de manière itérative afin que le nombre total de documents disponibles ne soit plus limité par le nombre de documents dans la fenêtre contextuelle du processeur LLM applicable.

En raison des limites de la recherche de similarité basée sur l'intégration, la tâche d'assurance qualité des documents pose un grand défi à toutes les méthodes. Les chercheurs ont observé que MemGPT arrête de paginer les résultats du robot avant que la base de données du robot ne soit épuisée.

De plus, il existe un compromis dans la capacité des documents récupérés créés par des opérations plus complexes de MemGPT, comme le montre la figure 7 ci-dessous. Sa précision moyenne est inférieure à GPT-4 (supérieure à GPT-3.5), mais. il peut être facilement adapté à des documents plus volumineux.

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

Les chercheurs ont également introduit une nouvelle tâche basée sur la récupération synthétique de valeurs-clés, à savoir la récupération de valeurs-clés imbriquées, pour démontrer comment MemGPT organise les informations provenant de plusieurs sources de données.

D'après les résultats, bien que GPT-3.5 et GPT-4 aient montré de bonnes performances sur la tâche de valeur-clé d'origine, ils ont donné de mauvais résultats sur la tâche de récupération de valeur-clé imbriquée. MemGPT n'est pas affecté par le nombre de niveaux d'imbrication et peut effectuer des recherches imbriquées en accédant de manière répétée aux paires clé-valeur stockées dans la mémoire principale via des requêtes de fonction.

Les performances de MemGPT sur les tâches de récupération de valeurs-clés imbriquées démontrent sa capacité à effectuer plusieurs recherches en utilisant une combinaison de plusieurs requêtes.

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

Veuillez vous référer à l'article original pour plus de détails techniques et de résultats expérimentaux.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Commandes de chat et comment les utiliser
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Repoussant les limites de la détection de défauts traditionnelle, « Defect Spectrum » permet pour la première fois une détection de défauts industriels d'une ultra haute précision et d'une sémantique riche. Repoussant les limites de la détection de défauts traditionnelle, « Defect Spectrum » permet pour la première fois une détection de défauts industriels d'une ultra haute précision et d'une sémantique riche. Jul 26, 2024 pm 05:38 PM

Dans la fabrication moderne, une détection précise des défauts est non seulement la clé pour garantir la qualité des produits, mais également la clé de l’amélioration de l’efficacité de la production. Cependant, les ensembles de données de détection de défauts existants manquent souvent de précision et de richesse sémantique requises pour les applications pratiques, ce qui rend les modèles incapables d'identifier des catégories ou des emplacements de défauts spécifiques. Afin de résoudre ce problème, une équipe de recherche de premier plan composée de l'Université des sciences et technologies de Hong Kong, Guangzhou et de Simou Technology a développé de manière innovante l'ensemble de données « DefectSpectrum », qui fournit une annotation à grande échelle détaillée et sémantiquement riche des défauts industriels. Comme le montre le tableau 1, par rapport à d'autres ensembles de données industrielles, l'ensemble de données « DefectSpectrum » fournit le plus grand nombre d'annotations de défauts (5 438 échantillons de défauts) et la classification de défauts la plus détaillée (125 catégories de défauts).

Le modèle de dialogue NVIDIA ChatQA a évolué vers la version 2.0, avec la longueur du contexte mentionnée à 128 Ko Le modèle de dialogue NVIDIA ChatQA a évolué vers la version 2.0, avec la longueur du contexte mentionnée à 128 Ko Jul 26, 2024 am 08:40 AM

La communauté ouverte LLM est une époque où une centaine de fleurs fleurissent et s'affrontent. Vous pouvez voir Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 et bien d'autres. excellents interprètes. Cependant, par rapport aux grands modèles propriétaires représentés par le GPT-4-Turbo, les modèles ouverts présentent encore des lacunes importantes dans de nombreux domaines. En plus des modèles généraux, certains modèles ouverts spécialisés dans des domaines clés ont été développés, tels que DeepSeek-Coder-V2 pour la programmation et les mathématiques, et InternVL pour les tâches de langage visuel.

Google AI a remporté la médaille d'argent de l'Olympiade mathématique de l'OMI, le modèle de raisonnement mathématique AlphaProof a été lancé et l'apprentissage par renforcement est de retour. Google AI a remporté la médaille d'argent de l'Olympiade mathématique de l'OMI, le modèle de raisonnement mathématique AlphaProof a été lancé et l'apprentissage par renforcement est de retour. Jul 26, 2024 pm 02:40 PM

Pour l’IA, l’Olympiade mathématique n’est plus un problème. Jeudi, l'intelligence artificielle de Google DeepMind a réalisé un exploit : utiliser l'IA pour résoudre la vraie question de l'Olympiade mathématique internationale de cette année, l'OMI, et elle n'était qu'à un pas de remporter la médaille d'or. Le concours de l'OMI qui vient de se terminer la semaine dernière comportait six questions portant sur l'algèbre, la combinatoire, la géométrie et la théorie des nombres. Le système d'IA hybride proposé par Google a répondu correctement à quatre questions et a marqué 28 points, atteignant le niveau de la médaille d'argent. Plus tôt ce mois-ci, le professeur titulaire de l'UCLA, Terence Tao, venait de promouvoir l'Olympiade mathématique de l'IA (AIMO Progress Award) avec un prix d'un million de dollars. De manière inattendue, le niveau de résolution de problèmes d'IA s'était amélioré à ce niveau avant juillet. Posez les questions simultanément sur l'OMI. La chose la plus difficile à faire correctement est l'OMI, qui a la plus longue histoire, la plus grande échelle et la plus négative.

Formation avec des millions de données cristallines pour résoudre le problème de la phase cristallographique, la méthode d'apprentissage profond PhAI est publiée dans Science Formation avec des millions de données cristallines pour résoudre le problème de la phase cristallographique, la méthode d'apprentissage profond PhAI est publiée dans Science Aug 08, 2024 pm 09:22 PM

Editeur | KX À ce jour, les détails structurels et la précision déterminés par cristallographie, des métaux simples aux grandes protéines membranaires, sont inégalés par aucune autre méthode. Cependant, le plus grand défi, appelé problème de phase, reste la récupération des informations de phase à partir d'amplitudes déterminées expérimentalement. Des chercheurs de l'Université de Copenhague au Danemark ont ​​développé une méthode d'apprentissage en profondeur appelée PhAI pour résoudre les problèmes de phase cristalline. Un réseau neuronal d'apprentissage en profondeur formé à l'aide de millions de structures cristallines artificielles et de leurs données de diffraction synthétique correspondantes peut générer des cartes précises de densité électronique. L'étude montre que cette méthode de solution structurelle ab initio basée sur l'apprentissage profond peut résoudre le problème de phase avec une résolution de seulement 2 Angströms, ce qui équivaut à seulement 10 à 20 % des données disponibles à la résolution atomique, alors que le calcul ab initio traditionnel

Le point de vue de la nature : les tests de l'intelligence artificielle en médecine sont dans le chaos. Que faut-il faire ? Le point de vue de la nature : les tests de l'intelligence artificielle en médecine sont dans le chaos. Que faut-il faire ? Aug 22, 2024 pm 04:37 PM

Editeur | ScienceAI Sur la base de données cliniques limitées, des centaines d'algorithmes médicaux ont été approuvés. Les scientifiques se demandent qui devrait tester les outils et comment le faire au mieux. Devin Singh a vu un patient pédiatrique aux urgences subir un arrêt cardiaque alors qu'il attendait un traitement pendant une longue période, ce qui l'a incité à explorer l'application de l'IA pour réduire les temps d'attente. À l’aide des données de triage des salles d’urgence de SickKids, Singh et ses collègues ont construit une série de modèles d’IA pour fournir des diagnostics potentiels et recommander des tests. Une étude a montré que ces modèles peuvent accélérer les visites chez le médecin de 22,3 %, accélérant ainsi le traitement des résultats de près de 3 heures par patient nécessitant un examen médical. Cependant, le succès des algorithmes d’intelligence artificielle dans la recherche ne fait que le vérifier.

Afin de fournir un nouveau système de référence et d'évaluation de questions-réponses scientifiques et complexes pour les grands modèles, l'UNSW, Argonne, l'Université de Chicago et d'autres institutions ont lancé conjointement le cadre SciQAG. Afin de fournir un nouveau système de référence et d'évaluation de questions-réponses scientifiques et complexes pour les grands modèles, l'UNSW, Argonne, l'Université de Chicago et d'autres institutions ont lancé conjointement le cadre SciQAG. Jul 25, 2024 am 06:42 AM

L'ensemble de données ScienceAI Question Answering (QA) joue un rôle essentiel dans la promotion de la recherche sur le traitement du langage naturel (NLP). Des ensembles de données d'assurance qualité de haute qualité peuvent non seulement être utilisés pour affiner les modèles, mais également évaluer efficacement les capacités des grands modèles linguistiques (LLM), en particulier la capacité à comprendre et à raisonner sur les connaissances scientifiques. Bien qu’il existe actuellement de nombreux ensembles de données scientifiques d’assurance qualité couvrant la médecine, la chimie, la biologie et d’autres domaines, ces ensembles de données présentent encore certaines lacunes. Premièrement, le formulaire de données est relativement simple, et la plupart sont des questions à choix multiples. Elles sont faciles à évaluer, mais limitent la plage de sélection des réponses du modèle et ne peuvent pas tester pleinement la capacité du modèle à répondre aux questions scientifiques. En revanche, les questions et réponses ouvertes

PRO | Pourquoi les grands modèles basés sur le MoE méritent-ils davantage d'attention ? PRO | Pourquoi les grands modèles basés sur le MoE méritent-ils davantage d'attention ? Aug 07, 2024 pm 07:08 PM

En 2023, presque tous les domaines de l’IA évoluent à une vitesse sans précédent. Dans le même temps, l’IA repousse constamment les limites technologiques de domaines clés tels que l’intelligence embarquée et la conduite autonome. Sous la tendance multimodale, le statut de Transformer en tant qu'architecture dominante des grands modèles d'IA sera-t-il ébranlé ? Pourquoi l'exploration de grands modèles basés sur l'architecture MoE (Mixture of Experts) est-elle devenue une nouvelle tendance dans l'industrie ? Les modèles de grande vision (LVM) peuvent-ils constituer une nouvelle avancée dans la vision générale ? ...Dans la newsletter des membres PRO 2023 de ce site publiée au cours des six derniers mois, nous avons sélectionné 10 interprétations spéciales qui fournissent une analyse approfondie des tendances technologiques et des changements industriels dans les domaines ci-dessus pour vous aider à atteindre vos objectifs dans le nouveau année. Cette interprétation provient de la Week50 2023

Identifiez automatiquement les meilleures molécules et réduisez les coûts de synthèse. Le MIT développe un cadre d'algorithme de prise de décision en matière de conception moléculaire. Identifiez automatiquement les meilleures molécules et réduisez les coûts de synthèse. Le MIT développe un cadre d'algorithme de prise de décision en matière de conception moléculaire. Jun 22, 2024 am 06:43 AM

Éditeur | L’utilisation de Ziluo AI pour rationaliser la découverte de médicaments explose. Ciblez des milliards de molécules candidates pour détecter celles qui pourraient posséder les propriétés nécessaires au développement de nouveaux médicaments. Il y a tellement de variables à prendre en compte, depuis le prix des matériaux jusqu’au risque d’erreur, qu’évaluer les coûts de synthèse des meilleures molécules candidates n’est pas une tâche facile, même si les scientifiques utilisent l’IA. Ici, les chercheurs du MIT ont développé SPARROW, un cadre d'algorithme de prise de décision quantitative, pour identifier automatiquement les meilleurs candidats moléculaires, minimisant ainsi les coûts de synthèse tout en maximisant la probabilité que les candidats possèdent les propriétés souhaitées. L’algorithme a également identifié les matériaux et les étapes expérimentales nécessaires à la synthèse de ces molécules. SPARROW prend en compte le coût de synthèse d'un lot de molécules à la fois, puisque plusieurs molécules candidates sont souvent disponibles

See all articles