Table des matières

Cadre général de reprogrammation de grands modèles de langage

Maison

Les grands modèles sont également très puissants pour la prédiction de séries chronologiques ! L'équipe chinoise active les nouvelles capacités de LLM et surpasse les modèles traditionnels pour atteindre SOTA

Les grands modèles sont également très puissants pour la prédiction de séries chronologiques ! L'équipe chinoise active les nouvelles capacités de LLM et surpasse les modèles traditionnels pour atteindre SOTA

PHPz

Apr 11, 2024 am 09:43 AM

人工智能 ai 大语言模型

Le potentiel des grands modèles de langage est stimulé -

Une prédiction de séries chronologiques de haute précision peut être obtenue sans entraîner de grands modèles de langage, surpassant ainsi tous les modèles de séries chronologiques traditionnels.

L'Université Monash, Ant et IBM Research ont développé conjointement un cadre général qui a réussi à promouvoir la capacité des grands modèles de langage à traiter les données de séquence selon différentes modalités. Le cadre est devenu une innovation technologique importante.

Les grands modèles sont également très puissants pour la prédiction de séries chronologiques ! Léquipe chinoise active les nouvelles capacités de LLM et surpasse les modèles traditionnels pour atteindre SOTA

La prédiction de séries chronologiques est bénéfique à la prise de décision dans des systèmes complexes typiques tels que les villes, l'énergie, les transports, la télédétection, etc.

Depuis, les grands modèles devraient révolutionner les méthodes d’exploration de données spatiotemporelles et de séries temporelles.

Cadre général de reprogrammation de grands modèles de langage

L'équipe de recherche a proposé un cadre général pour utiliser facilement de grands modèles de langage pour la prédiction générale de séries chronologiques sans aucune formation.

Propose principalement deux technologies clés : la reprogrammation des entrées de synchronisation ;

Time-LLM utilise d'abord des prototypes de texte (Text Prototypes) pour reprogrammer les données temporelles d'entrée, et utilise une représentation en langage naturel pour représenter les informations sémantiques des données temporelles, alignant ainsi deux modalités de données différentes, de sorte que les grands modèles de langage n'aient pas besoin Toute modification pour comprendre les informations derrière une autre modalité de données. Dans le même temps, le grand modèle de langage ne nécessite aucun ensemble de données de formation spécifique pour comprendre les informations derrière les différentes modalités de données. Cette méthode améliore non seulement la précision du modèle, mais simplifie également le processus de prétraitement des données.

Afin de mieux gérer les données de séries chronologiques d'entrée et l'analyse des tâches correspondantes, l'auteur a proposé le paradigme Prompt-as-Prefix (PaP). Ce paradigme active pleinement les capacités de traitement de LLM sur les tâches temporelles en ajoutant des informations contextuelles supplémentaires et des instructions de tâches avant la représentation des données temporelles. Cette méthode permet d'obtenir une analyse plus raffinée des tâches de synchronisation et d'activer pleinement les capacités de traitement de LLM sur les tâches de synchronisation en ajoutant des informations contextuelles supplémentaires et des instructions de tâche devant le tableau de données de synchronisation.

Les principales contributions incluent :

Proposition d'un nouveau concept de reprogrammation de grands modèles de langage pour l'analyse temporelle sans aucune modification du modèle de langage de base.
Propose Time-LLM, un cadre de reprogrammation de modèle de langage général, qui implique la reprogrammation des données temporelles d'entrée dans une représentation prototype de texte plus naturelle et l'amélioration du contexte d'entrée avec des indices déclaratifs (tels que les connaissances d'experts du domaine et les descriptions de tâches) , pour guider le LLM pour un raisonnement inter-domaines efficace.
Les performances des tâches de prédiction traditionnelles dépassent systématiquement les performances des meilleurs modèles existants, en particulier dans les scénarios à quelques échantillons et à zéro échantillon. De plus, Time-LLM est capable d'atteindre des performances plus élevées tout en conservant une excellente efficacité de reprogrammation du modèle. Libérez considérablement le potentiel inexploité du LLM pour les séries chronologiques et autres données séquentielles.

En regardant ce cadre plus spécifiquement, d'abord, les données de séries chronologiques d'entrée sont d'abord normalisées par RevIN, puis divisées en différents correctifs et mappées à l'espace latent.

Il existe des différences significatives dans les méthodes d'expression entre les données de séries chronologiques et les données textuelles, et elles appartiennent à des modalités différentes.

Les séries chronologiques ne peuvent ni être éditées directement ni décrites sans perte en langage naturel. Par conséquent, nous devons aligner les fonctionnalités d’entrée temporelles sur le domaine textuel en langage naturel.

Une manière courante d'aligner différentes modalités est l'attention croisée, mais le vocabulaire inhérent du LLM est très vaste, il est donc impossible d'aligner efficacement et directement les caractéristiques temporelles sur tous les mots, et tous les mots ne sont pas liés au temps. Les séquences ont des relations sémantiques alignées.

Afin de résoudre ce problème, ce travail effectue une combinaison linéaire de vocabulaires pour obtenir des prototypes de texte. Le nombre de prototypes de texte est beaucoup plus petit que le vocabulaire original, et la combinaison peut être utilisée pour représenter les caractéristiques changeantes des données de séries chronologiques. .

Afin d'activer pleinement la capacité du LLM sur des tâches de timing spécifiées, ce travail propose un paradigme de préfixage rapide.

Pour faire simple, certaines informations préalables de l'ensemble de données de séries chronologiques sont transmises à LLM sous forme de langage naturel en tant qu'invite de préfixe, et les caractéristiques de séries chronologiques alignées sont associées à LLM. Cela peut-il améliorer l'effet de prédiction. ?

En pratique, les auteurs ont identifié trois éléments clés pour créer des invites efficaces :

le contexte de l'ensemble de données ; (2) les instructions de tâche, permettant à LLM de s'adapter aux différentes tâches en aval, (3) les descriptions statistiques, telles que les tendances et les délais ; , etc., permettant à LLM de mieux comprendre les caractéristiques des données de séries chronologiques.

L'équipe a mené des tests complets sur 8 ensembles de données publiques classiques pour des prédictions à long terme.

Le résultat est que Time-LLM dépasse largement les meilleurs résultats précédents dans le domaine dans la comparaison de référence. Par exemple, par rapport à GPT4TS qui utilise directement GPT-2, Time-LLM présente une amélioration significative, indiquant l'efficacité de cette méthode. .

De plus, il montre également une forte capacité de prédiction dans des scénarios sans tir.

Ce projet est soutenu par NextEvo, le département R&D d'innovation en IA de la division Intelligent Engine d'Ant Group.

Les amis intéressés peuvent cliquer sur le lien ci-dessous pour en savoir plus sur le papier~

Lien papierhttps://arxiv.org/abs/2310.01728.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7493

Tutoriel CakePHP

1377

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Comment créer une base de données Oracle Comment créer une base de données Oracle Apr 11, 2025 pm 02:36 PM

Pour créer une base de données Oracle, la méthode commune consiste à utiliser l'outil graphique DBCA. Les étapes sont les suivantes: 1. Utilisez l'outil DBCA pour définir le nom DBN pour spécifier le nom de la base de données; 2. Définissez Syspassword et SystemPassword sur des mots de passe forts; 3. Définir les caractères et NationalCharacterset à Al32Utf8; 4. Définissez la taille de mémoire et les espaces de table pour s'ajuster en fonction des besoins réels; 5. Spécifiez le chemin du fichier log. Les méthodes avancées sont créées manuellement à l'aide de commandes SQL, mais sont plus complexes et sujets aux erreurs. Faites attention à la force du mot de passe, à la sélection du jeu de caractères, à la taille et à la mémoire de l'espace de table

Comment créer une base de données Oracle Comment créer une base de données Oracle Apr 11, 2025 pm 02:33 PM

La création d'une base de données Oracle n'est pas facile, vous devez comprendre le mécanisme sous-jacent. 1. Vous devez comprendre les concepts de la base de données et des SGBD Oracle; 2. Master les concepts de base tels que SID, CDB (base de données de conteneurs), PDB (base de données enfichable); 3. Utilisez SQL * Plus pour créer CDB, puis créer PDB, vous devez spécifier des paramètres tels que la taille, le nombre de fichiers de données et les chemins; 4. Les applications avancées doivent ajuster le jeu de caractères, la mémoire et d'autres paramètres et effectuer un réglage des performances; 5. Faites attention à l'espace disque, aux autorisations et aux paramètres des paramètres, et surveillez et optimisez en continu les performances de la base de données. Ce n'est qu'en le maîtrisant habilement une pratique continue que vous pouvez vraiment comprendre la création et la gestion des bases de données Oracle.

Comment rédiger des instructions de base de données Oracle Apr 11, 2025 pm 02:42 PM

Le cœur des instructions Oracle SQL est sélectionné, insérer, mettre à jour et supprimer, ainsi que l'application flexible de diverses clauses. Il est crucial de comprendre le mécanisme d'exécution derrière l'instruction, tel que l'optimisation de l'indice. Les usages avancés comprennent des sous-requêtes, des requêtes de connexion, des fonctions d'analyse et PL / SQL. Les erreurs courantes incluent les erreurs de syntaxe, les problèmes de performances et les problèmes de cohérence des données. Les meilleures pratiques d'optimisation des performances impliquent d'utiliser des index appropriés, d'éviter la sélection *, d'optimiser les clauses et d'utiliser des variables liées. La maîtrise d'Oracle SQL nécessite de la pratique, y compris l'écriture de code, le débogage, la réflexion et la compréhension des mécanismes sous-jacents.

Comment ajouter, modifier et supprimer le guide de fonctionnement du champ de table de données MySQL Apr 11, 2025 pm 05:42 PM

Guide de fonctionnement du champ dans MySQL: Ajouter, modifier et supprimer les champs. Ajouter un champ: alter table table_name Ajouter Column_name data_type [pas null] [Default default_value] [Clé primaire] [Auto_increment] Modifier le champ: alter table table_name modifie Column_name data_type [pas null] [default default_value] [clé primaire]

Quelles sont les contraintes d'intégrité des tables de base de données Oracle? Apr 11, 2025 pm 03:42 PM

Les contraintes d'intégrité des bases de données Oracle peuvent garantir la précision des données, notamment: Not Null: les valeurs nulles sont interdites; Unique: garantie l'unicité, permettant une seule valeur nulle; Clé primaire: contrainte de clé primaire, renforcer unique et interdire les valeurs nulles; Clé étrangère: maintenir les relations entre les tableaux, les clés étrangères se réfèrent aux clés primaires primaires; Vérifiez: limitez les valeurs de colonne en fonction des conditions.

Explication détaillée des instances de requête imbriquées dans la base de données MySQL Apr 11, 2025 pm 05:48 PM

Les requêtes imbriquées sont un moyen d'inclure une autre requête dans une requête. Ils sont principalement utilisés pour récupérer des données qui remplissent des conditions complexes, associer plusieurs tables et calculer des valeurs de résumé ou des informations statistiques. Les exemples incluent la recherche de salaires supérieurs aux employés, la recherche de commandes pour une catégorie spécifique et le calcul du volume des commandes totales pour chaque produit. Lorsque vous écrivez des requêtes imbriquées, vous devez suivre: écrire des sous-requêtes, écrire leurs résultats sur les requêtes extérieures (référencées avec des alias ou en tant que clauses) et optimiser les performances de la requête (en utilisant des index).

Que fait Oracle Apr 11, 2025 pm 06:06 PM

Oracle est la plus grande société de logiciels de gestion de base de données au monde (SGBD). Ses principaux produits incluent les fonctions suivantes: Outils de développement du système de gestion de la base de données relationnels (Oracle Database) (Oracle Apex, Oracle Visual Builder) Middleware (Oracle Weblogic Server, Oracle Soa Suite) Cloud Service (Oracle Cloud Infrastructure) Analyse et Oracle Blockchain Pla Intelligence (Oracle Analytic

Comment configurer le format de journal debian Apache Apr 12, 2025 pm 11:30 PM

Cet article décrit comment personnaliser le format de journal d'Apache sur les systèmes Debian. Les étapes suivantes vous guideront à travers le processus de configuration: Étape 1: Accédez au fichier de configuration Apache Le fichier de configuration apache principal du système Debian est généralement situé dans /etc/apache2/apache2.conf ou /etc/apache2/httpd.conf. Ouvrez le fichier de configuration avec les autorisations racinaires à l'aide de la commande suivante: sudonano / etc / apache2 / apache2.conf ou sudonano / etc / apache2 / httpd.conf Étape 2: définir les formats de journal personnalisés à trouver ou

See all articles