Maison Périphériques technologiques IA Capable de compréhension interdisciplinaire et de modélisation multi-échelle, le MIT LAMM publie un grand modèle de langage affiné MechGPT

Capable de compréhension interdisciplinaire et de modélisation multi-échelle, le MIT LAMM publie un grand modèle de langage affiné MechGPT

Nov 15, 2023 pm 01:09 PM
产业

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

Éditeur | Radis Skin

Au cours des derniers siècles, les chercheurs ont cherché des moyens de relier différents domaines de connaissances. Avec l'avènement de l'intelligence artificielle, nous avons désormais la possibilité d'explorer les relations entre domaines (comme la mécanique et la biologie) ou entre différents domaines (comme la mécanique des défaillances et l'art)

Pour atteindre cet objectif, le Massachusetts Institute of Technology (MIT ) Des chercheurs du Laboratoire de mécanique atomique et moléculaire (LAMM) ont utilisé un grand modèle de langage (LLM) affiné pour obtenir un sous-ensemble pertinent de connaissances sur la défaillance des matériaux à plusieurs échelles

Les étapes de cette approche consistent d'abord à utiliser une approche générale -Purpose LLM extrait les paires question-réponse de la source d'origine, puis affine le LLM. Une série d'expériences informatiques ont été menées à l'aide de ce modèle de base MechGPT LLM affiné pour explorer ses capacités en matière de récupération de connaissances, de diverses tâches linguistiques, de génération d'hypothèses et de connexion des connaissances dans différents domaines.

Bien que le modèle ait une certaine capacité à rappeler les connaissances de formation dans le domaine, mais les chercheurs ont découvert que le LLM est plus utile pour extraire des informations structurelles via des graphiques de connaissances d'ontologie. Ces structures graphiques interprétables fournissent des informations interprétatives, des cadres pour de nouvelles questions de recherche et des représentations visuelles des connaissances qui peuvent également être utilisées pour une génération améliorée par la récupération.

La recherche s'intitule « MechGPT, a Language-Based Strategy for Mechanics and Materials Modeling That Connects Knowledge Across Scales, Disciplines and Modalities » et a été publiée dans « Applied Mechanics Reviews » le 19 octobre 2023.

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

La modélisation de concepts physiques, biologiques et métaphysiques a été une préoccupation des chercheurs dans de nombreuses disciplines. Les premiers scientifiques et ingénieurs étaient souvent profondément enracinés dans des domaines allant de la science à la philosophie, de la physique aux mathématiques et aux arts (par exemple, Galileo Galilei, Leonardo da Vinci, Johann Wolfgang von ·Goethe), mais avec le développement de la science, la spécialisation est devenue dominante aujourd'hui. Cela s’explique en partie par le fait qu’une grande quantité de connaissances a été accumulée dans tous les domaines, ce qui oblige les humains à consacrer beaucoup d’énergie à la recherche et à la pratique.

De nos jours, l'émergence des grands modèles de langage (LLM) remet en question le paradigme de la recherche scientifique. Il apporte non seulement de nouvelles stratégies de modélisation basées sur l'intelligence artificielle/l'apprentissage automatique, mais offre également des opportunités de connecter les connaissances, les idées et les concepts entre les domaines. Ces modèles peuvent compléter la modélisation multi-échelle traditionnelle pour l'analyse et la conception de matériaux en couches et de nombreuses autres applications en mécanique

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

Figure : Flux de travail schématique. (Source : article)

Ici, les chercheurs du LAMM ont développé un LLM général basé sur OpenOrca-Platypus2-13B basé sur Llama-2, basé sur l'utilisation récemment proposée du LLM dans la recherche et le développement en mécanique et en matériaux. Un modèle MechGPT affiné et ciblé. sur la modélisation des défaillances matérielles, la modélisation multi-échelle et les disciplines connexes.

La raison du choix du modèle OpenOrca-Platypus2-13B est qu'il fonctionne bien sur des tâches clés telles que le raisonnement, la logique, les mathématiques/sciences et d'autres disciplines, et peut fournir des connaissances riches et multidisciplinaires avec une taille de modèle modérée. . Concepts généraux et capacités informatiques efficaces

LLM a des applications puissantes dans le domaine scientifique. En plus de pouvoir analyser de grandes quantités de données et des systèmes complexes, dans les domaines de la mécanique et de la science des matériaux, le LLM est utilisé pour simuler et prédire le comportement des matériaux dans différentes conditions, telles que les contraintes mécaniques, la température et les interactions chimiques. Comme le montrent des travaux antérieurs, en formant les LLM sur de vastes ensembles de données issues de simulations de dynamique moléculaire, les chercheurs peuvent développer des modèles capables de prédire le comportement des matériaux dans de nouvelles situations, accélérant ainsi le processus de découverte et réduisant le besoin de tests expérimentaux.

Ces modèles sont également très efficaces pour analyser des textes scientifiques tels que des livres et des publications, permettant aux chercheurs d'extraire rapidement des informations et des idées clés à partir de grandes quantités de données. Cela peut aider les scientifiques à identifier les tendances, les modèles et les relations entre différents concepts et idées, et à générer de nouvelles hypothèses et idées pour des recherches ultérieures.

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

Veuillez jeter un œil à la figure ci-dessous, qui est un aperçu de l'architecture du transformateur de décodeur autorégressif utilisée pour construire MechGPT. (Source : papier)

Ici, l'équipe se concentre sur le développement de ce dernier et explore l'utilisation de MechGPT, un outil d'intelligence artificielle générative de la famille LLM basée sur Transformer spécifiquement ciblé sur les défaillances matérielles et la formation aux méthodes multi-échelles associées pour évaluer le potentiel de ces stratégies. .

La stratégie proposée dans cette étude comprend plusieurs étapes. La première est l’étape de distillation, où les chercheurs utilisent LLM pour générer des paires question-réponse à partir de texte extrait de morceaux de données brutes (tels qu’un ou plusieurs fichiers PDF). Ensuite, utilisez ces données pour affiner le modèle dans la deuxième étape. Cette étude a également entraîné spécifiquement le modèle MechGPT initial, démontrant son utilité pour la récupération de connaissances, les tâches de langage général et la génération d'hypothèses dans le domaine de la modélisation atomistique de la défaillance matérielle

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

Figure : Modélisation utilisée Aperçu de la stratégie. (Source : article)

Cet article présente une stratégie de modélisation globale dans laquelle les chercheurs utilisent des stratégies de modélisation de langage spécifiques pour générer des ensembles de données afin d'extraire des connaissances à partir de sources et d'exploiter de nouveaux ensembles de données sur la mécanique et les matériaux pour le modèle est formé. Les chercheurs ont analysé et discuté trois versions de MechGPT avec des tailles de paramètres allant de 13 milliards à 70 milliards et des longueurs de contexte dépassant 10 000 jetons

Après quelques commentaires généraux sur les modèles, astuces et méthodes de formation, les chercheurs ont appliqué le modèle et testé ses performances. dans une variété de contextes, y compris l'utilisation de LLM pour la génération de graphiques d'ontologie et le développement d'informations sur des sujets complexes dans plusieurs disciplines, ainsi que la modélisation d'agents, où plusieurs LLM interagissent de manière collaborative ou contradictoire pour générer des informations plus approfondies sur un sujet ou une réponse à une question. une question.

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

Graphique : Développement d'une représentation de graphe de connaissances ontologiques pour relier l'hyperélasticité dans le contexte de la fracture supersonique et des mécanismes de déploiement des protéines. (Source : article)

Dans le même temps, l'équipe propose en outre une comparaison conceptuelle entre les modèles de langage et les systèmes multiparticules à différents niveaux d'abstraction, et explique comment le nouveau cadre peut être considéré comme un moyen d'extraire des relations universelles qui gouverner des systèmes complexes.

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

Contenu réécrit : L'image ci-dessus montre l'analogie conceptuelle entre le LLM et la simulation multiparticules. (Source : article)

Dans l'ensemble, les travaux présentés dans cette étude contribuent au développement de modèles d'intelligence artificielle plus puissants et plus généraux qui peuvent aider à faire progresser la recherche scientifique et à résoudre des problèmes complexes dans des domaines d'application spécifiques, permettant une évaluation approfondie des performances du modèle. . Comme tous les modèles, ils doivent être soigneusement validés, et leur utilité réside dans le contexte des questions posées, de leurs forces et faiblesses, ainsi que des outils plus larges qui aident les scientifiques à faire progresser la science et l’ingénierie.

De plus, les outils d’IA, en tant qu’outils de recherche scientifique, doivent être considérés comme un ensemble d’outils permettant de comprendre, de modéliser et de concevoir le monde qui nous entoure. Alors que les outils d’IA se développent rapidement, leur application dans des contextes scientifiques commence seulement à apporter de nouvelles opportunités

Lien papier : https://arxiv.org/ftp/arxiv/papers/2310/2310.10445.pdf

Rapports associés : https://twitter.com/llama_index/status/1723379654550245719

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Le robot DeepMind joue au tennis de table, et son coup droit et son revers glissent dans les airs, battant complètement les débutants humains Le robot DeepMind joue au tennis de table, et son coup droit et son revers glissent dans les airs, battant complètement les débutants humains Aug 09, 2024 pm 04:01 PM

Mais peut-être qu’il ne pourra pas vaincre le vieil homme dans le parc ? Les Jeux Olympiques de Paris battent leur plein et le tennis de table suscite beaucoup d'intérêt. Dans le même temps, les robots ont également réalisé de nouvelles avancées dans le domaine du tennis de table. DeepMind vient tout juste de proposer le premier agent robot apprenant capable d'atteindre le niveau des joueurs amateurs humains de tennis de table de compétition. Adresse papier : https://arxiv.org/pdf/2408.03906 Quelle est la capacité du robot DeepMind à jouer au tennis de table ? Probablement à égalité avec les joueurs amateurs humains : tant en coup droit qu'en revers : l'adversaire utilise une variété de styles de jeu, et le robot peut également résister : recevoir des services avec des tours différents : Cependant, l'intensité du jeu ne semble pas aussi intense que le vieil homme dans le parc. Pour les robots, le tennis de table

La première griffe mécanique ! Yuanluobao est apparu à la World Robot Conference 2024 et a lancé le premier robot d'échecs pouvant entrer dans la maison La première griffe mécanique ! Yuanluobao est apparu à la World Robot Conference 2024 et a lancé le premier robot d'échecs pouvant entrer dans la maison Aug 21, 2024 pm 07:33 PM

Le 21 août, la Conférence mondiale sur les robots 2024 s'est tenue en grande pompe à Pékin. La marque de robots domestiques de SenseTime, "Yuanluobot SenseRobot", a dévoilé toute sa famille de produits et a récemment lancé le robot de jeu d'échecs Yuanluobot AI - Chess Professional Edition (ci-après dénommé "Yuanluobot SenseRobot"), devenant ainsi le premier robot d'échecs au monde pour le maison. En tant que troisième produit robot jouant aux échecs de Yuanluobo, le nouveau robot Guoxiang a subi un grand nombre de mises à niveau techniques spéciales et d'innovations en matière d'IA et de machines d'ingénierie. Pour la première fois, il a réalisé la capacité de ramasser des pièces d'échecs en trois dimensions. grâce à des griffes mécaniques sur un robot domestique et effectuer des fonctions homme-machine telles que jouer aux échecs, tout le monde joue aux échecs, réviser la notation, etc.

Claude aussi est devenu paresseux ! Internaute : apprenez à vous accorder des vacances Claude aussi est devenu paresseux ! Internaute : apprenez à vous accorder des vacances Sep 02, 2024 pm 01:56 PM

La rentrée scolaire est sur le point de commencer, et ce ne sont pas seulement les étudiants qui sont sur le point de commencer le nouveau semestre qui doivent prendre soin d’eux-mêmes, mais aussi les grands modèles d’IA. Il y a quelque temps, Reddit était rempli d'internautes se plaignant de la paresse de Claude. « Son niveau a beaucoup baissé, il fait souvent des pauses et même la sortie devient très courte. Au cours de la première semaine de sortie, il pouvait traduire un document complet de 4 pages à la fois, mais maintenant il ne peut même plus produire une demi-page. !" https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ dans un post intitulé "Totalement déçu par Claude", plein de

Lors de la World Robot Conference, ce robot domestique porteur de « l'espoir des futurs soins aux personnes âgées » a été entouré Lors de la World Robot Conference, ce robot domestique porteur de « l'espoir des futurs soins aux personnes âgées » a été entouré Aug 22, 2024 pm 10:35 PM

Lors de la World Robot Conference qui se tient à Pékin, l'exposition de robots humanoïdes est devenue le centre absolu de la scène. Sur le stand Stardust Intelligent, l'assistant robot IA S1 a réalisé trois performances majeures de dulcimer, d'arts martiaux et de calligraphie. un espace d'exposition, capable à la fois d'arts littéraires et martiaux, a attiré un grand nombre de publics professionnels et de médias. Le jeu élégant sur les cordes élastiques permet au S1 de démontrer un fonctionnement fin et un contrôle absolu avec vitesse, force et précision. CCTV News a réalisé un reportage spécial sur l'apprentissage par imitation et le contrôle intelligent derrière "Calligraphy". Le fondateur de la société, Lai Jie, a expliqué que derrière les mouvements soyeux, le côté matériel recherche le meilleur contrôle de la force et les indicateurs corporels les plus humains (vitesse, charge). etc.), mais du côté de l'IA, les données réelles de mouvement des personnes sont collectées, permettant au robot de devenir plus fort lorsqu'il rencontre une situation forte et d'apprendre à évoluer rapidement. Et agile

Annonce des prix ACL 2024 : l'un des meilleurs articles sur le déchiffrement Oracle par HuaTech, GloVe Time Test Award Annonce des prix ACL 2024 : l'un des meilleurs articles sur le déchiffrement Oracle par HuaTech, GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

Les contributeurs ont beaucoup gagné de cette conférence ACL. L'ACL2024, d'une durée de six jours, se tient à Bangkok, en Thaïlande. ACL est la plus grande conférence internationale dans le domaine de la linguistique informatique et du traitement du langage naturel. Elle est organisée par l'Association internationale pour la linguistique informatique et a lieu chaque année. L'ACL s'est toujours classée première en termes d'influence académique dans le domaine de la PNL, et c'est également une conférence recommandée par le CCF-A. La conférence ACL de cette année est la 62e et a reçu plus de 400 travaux de pointe dans le domaine de la PNL. Hier après-midi, la conférence a annoncé le meilleur article et d'autres récompenses. Cette fois, il y a 7 Best Paper Awards (deux inédits), 1 Best Theme Paper Award et 35 Outstanding Paper Awards. La conférence a également décerné 3 Resource Paper Awards (ResourceAward) et Social Impact Award (

Hongmeng Smart Travel S9 et conférence de lancement de nouveaux produits avec scénario complet, un certain nombre de nouveaux produits à succès ont été lancés ensemble Hongmeng Smart Travel S9 et conférence de lancement de nouveaux produits avec scénario complet, un certain nombre de nouveaux produits à succès ont été lancés ensemble Aug 08, 2024 am 07:02 AM

Cet après-midi, Hongmeng Zhixing a officiellement accueilli de nouvelles marques et de nouvelles voitures. Le 6 août, Huawei a organisé la conférence de lancement de nouveaux produits Hongmeng Smart Xingxing S9 et Huawei, réunissant la berline phare intelligente panoramique Xiangjie S9, le nouveau M7Pro et Huawei novaFlip, MatePad Pro 12,2 pouces, le nouveau MatePad Air, Huawei Bisheng With de nombreux nouveaux produits intelligents tous scénarios, notamment la série d'imprimantes laser X1, FreeBuds6i, WATCHFIT3 et l'écran intelligent S5Pro, des voyages intelligents, du bureau intelligent aux vêtements intelligents, Huawei continue de construire un écosystème intelligent complet pour offrir aux consommateurs une expérience intelligente du Internet de tout. Hongmeng Zhixing : Autonomisation approfondie pour promouvoir la modernisation de l'industrie automobile intelligente Huawei s'associe à ses partenaires de l'industrie automobile chinoise pour fournir

L'équipe de Li Feifei a proposé ReKep pour donner aux robots une intelligence spatiale et intégrer GPT-4o L'équipe de Li Feifei a proposé ReKep pour donner aux robots une intelligence spatiale et intégrer GPT-4o Sep 03, 2024 pm 05:18 PM

Intégration profonde de la vision et de l'apprentissage des robots. Lorsque deux mains de robot travaillent ensemble en douceur pour plier des vêtements, verser du thé et emballer des chaussures, associées au robot humanoïde 1X NEO qui a fait la une des journaux récemment, vous pouvez avoir le sentiment : nous semblons entrer dans l'ère des robots. En fait, ces mouvements soyeux sont le produit d’une technologie robotique avancée + d’une conception de cadre exquise + de grands modèles multimodaux. Nous savons que les robots utiles nécessitent souvent des interactions complexes et exquises avec l’environnement, et que l’environnement peut être représenté comme des contraintes dans les domaines spatial et temporel. Par exemple, si vous souhaitez qu'un robot verse du thé, le robot doit d'abord saisir la poignée de la théière et la maintenir verticalement sans renverser le thé, puis la déplacer doucement jusqu'à ce que l'embouchure de la théière soit alignée avec l'embouchure de la tasse. , puis inclinez la théière selon un certain angle. ce

Testé 7 artefacts de génération vidéo « de niveau Sora ». Qui a la capacité de monter sur le « Trône de fer » ? Testé 7 artefacts de génération vidéo « de niveau Sora ». Qui a la capacité de monter sur le « Trône de fer » ? Aug 05, 2024 pm 07:19 PM

Editeur du Machine Power Report : Yang Wen Qui peut devenir le roi du cercle vidéo de l'IA ? Dans la série télévisée américaine "Game of Thrones", il y a un "Trône de Fer". La légende raconte qu'il a été fabriqué par le dragon géant « Black Death » qui a fait fondre des milliers d'épées abandonnées par les ennemis, symbolisant l'autorité suprême. Pour s'asseoir sur cette chaise de fer, les grandes familles ont commencé à se battre et à se battre. Depuis l'émergence de Sora, un vigoureux "Game of Thrones" a été lancé dans le cercle vidéo de l'IA. Les principaux acteurs de ce jeu incluent RunwayGen-3 et Luma de l'autre côté de l'océan, ainsi que Kuaishou Keling, ByteDream, national. et Zhimo. Spectre Qingying, Vidu, PixVerseV2, etc. Aujourd'hui, nous allons évaluer et voir qui est qualifié pour siéger sur le « Trône de fer » du cercle vidéo IA. -1-Vincent Vidéo

See all articles