


Premier système d'IA de découverte scientifique entièrement automatisé, la startup auteur de Transformer, Sakana AI, lance AI Scientist
Éditeur | ScienceAI
Il y a un an, Llion Jones, le dernier auteur de l'article Transformer de Google, a quitté son entreprise pour créer une entreprise et a cofondé la société d'intelligence artificielle Sakana AI avec l'ancien chercheur de Google, David Ha. Sakana AI prétend créer un nouveau modèle fondamental basé sur une intelligence inspirée de la nature !
Maintenant, Sakana AI a remis sa feuille de réponses.
Sakana AI annonce le lancement d'AI Scientist, le premier système d'IA au monde pour la recherche scientifique automatisée et la découverte ouverte !
De la conception, l'écriture de code, la réalisation d'expériences et la synthèse des résultats, à la rédaction d'articles entiers et à la réalisation d'examens par les pairs, les scientifiques de l'IA ouvrent la voie à une nouvelle ère de recherche scientifique basée sur l'IA et de découverte accélérée.
En principe, il peut répéter continuellement le processus de recherche scientifique, en développant des idées de manière itérative et ouverte, tout comme les scientifiques humains.
Les chercheurs ont démontré sa polyvalence en l'appliquant à trois sous-domaines différents de l'apprentissage automatique : la modélisation de diffusion, la modélisation du langage basée sur Transformer et la dynamique d'apprentissage.
Chaque idée sera mise en œuvre et développée dans un article complet pour moins de 15 $ par article. Pour évaluer les articles générés, les chercheurs ont conçu et validé un évaluateur automatisé doté de performances quasi humaines dans l'évaluation des notes des articles.
AI Scientist peut rédiger des articles qui dépassent le seuil d'acceptation des meilleures conférences sur l'apprentissage automatique.
Le lancement d'AI Scientist marque une étape importante vers la réalisation du plein potentiel de l'intelligence artificielle dans la recherche scientifique. En automatisant le processus de découverte et en intégrant des systèmes d’examen basés sur l’IA, il ouvre la porte à des possibilités infinies d’innovation et de résolution de problèmes dans les domaines scientifiques et technologiques les plus difficiles.
Une recherche pertinente intitulée « The AI Scientist : Towards Fully Automated Open-Ended Scientific Discovery » a été publiée sur la plateforme de prépublication arXiv le 12 août.
Lien papier : https://arxiv.org/abs/2408.06292
L'un des défis auxquels est confrontée l'intelligence artificielle est de développer des agents capables de mener des recherches scientifiques et de découvrir de nouvelles connaissances. Bien que les modèles de pointe aient été utilisés comme outils auxiliaires par les scientifiques humains, comme le brainstorming d’idées, l’écriture de code ou l’exécution de tâches prédictives, ils ne complètent encore qu’une petite partie du processus scientifique.
Dans leurs dernières recherches, les scientifiques de Sakana AI proposent le premier cadre complet de découverte scientifique entièrement automatisée, permettant à des modèles linguistiques de pointe à grande échelle de mener des recherches de manière indépendante et de communiquer leurs résultats.
AI Scientist peut générer de nouvelles idées de recherche, écrire du code, réaliser des expériences, visualiser les résultats, décrire leurs conclusions en écrivant un article scientifique complet, puis exécuter un processus d'examen simulé pour évaluation.
À propos d'AI Scientist
AI Scientist comporte trois étapes principales : (1) la génération d'idées, (2) l'itération expérimentale, (3) la rédaction d'un article. Une fois rédigés, les chercheurs introduisent et valident les critiques générées par le LLM pour évaluer la qualité de l'article résultant.
Illustration : Illustration du concept du processus de découverte scientifique de bout en bout basé sur le LLM. (Source : article)
Les chercheurs fournissent aux scientifiques de l'IA un modèle de code de départ qui reproduit des séries d'entraînement de base légères de modèles ou de références populaires. Par exemple, il peut s'agir d'un code permettant de former un petit transformateur sur Shakespeare, une formation classique de validation de principe exécutée en traitement du langage naturel qui peut être complétée en quelques minutes.
Ensuite, les scientifiques de l’IA sont libres d’explorer toutes les directions de recherche possibles. Le modèle comprend également un dossier LaTeX contenant des fichiers de style et des en-têtes de section ainsi qu'un code de traçage simple. En règle générale, chaque série commence par une expérience représentative à petite échelle pertinente au domaine thématique.
Les chercheurs ont expliqué : « Se concentrer sur des expériences à petite échelle n'est pas une limitation fondamentale de notre méthode, mais simplement une question d'efficacité informatique et des limites informatiques de notre équipement.
Pourquoi la rédaction d'un article est-elle importante ?
Étant donné que l'objectif général des scientifiques est d'automatiser la découverte scientifique, pourquoi les chercheurs voudraient-ils que les scientifiques de l'IA rédigent des articles comme les scientifiques humains ? Par exemple, les systèmes d’IA précédents tels que FunSearch et GNoME produisaient autrefois des découvertes scientifiques impressionnantes dans des domaines restreints, mais ils n’étaient pas capables de rédiger des articles.
Das Team ist davon überzeugt, dass es für KI-Wissenschaftler aus folgenden Gründen von entscheidender Bedeutung ist, wissenschaftliche Arbeiten zu verfassen, um ihre Erkenntnisse zu verbreiten: Erstens bietet das Schreiben von Arbeiten den Menschen eine gut interpretierbare Möglichkeit, von dem zu profitieren, was sie gelernt haben; Der Rahmen bestehender Konferenzen zum maschinellen Lernen ermöglicht es Wissenschaftlern, Bewertungen zu standardisieren. Drittens sind wissenschaftliche Arbeiten seit der Geburt der modernen Wissenschaft das Hauptmedium für die Verbreitung von Forschungsergebnissen.
Da das Papier natürliche Sprache verwenden und Diagramme und Codes enthalten kann, kann es flexibel jede Art von wissenschaftlicher Forschung und Erkenntnissen beschreiben. Fast jedes andere vorstellbare Format ist an ein Daten- oder wissenschaftliches Genre gebunden. Bis eine überlegene Alternative auftaucht (oder möglicherweise durch künstliche Intelligenz erfunden wird), ist das Team davon überzeugt, dass die Ausbildung von KI-Wissenschaftlern zum Verfassen wissenschaftlicher Arbeiten für ihre Integration in die breitere wissenschaftliche Gemeinschaft von entscheidender Bedeutung ist.
Abbildung: Vorschau auf das völlig unabhängig von AI Scientist erstellte Paper „Adaptive Dual-Scale Denoising“. (Quelle: Papier)
Über die Kosten
Der Rahmen hier ist flexibel genug, um effizient Forschung in verschiedenen Teilbereichen des maschinellen Lernens durchzuführen, einschließlich transformatorbasierter Sprachmodellierung, Lerndynamik neuronaler Netze und Diffusionsmodellierung. Das System ist äußerst kosteneffektiv, kostet etwa 15 US-Dollar pro Beitrag und produziert konferenzrelevante Beiträge, was seine Fähigkeit unterstreicht, die Forschung zu demokratisieren (ihre Zugänglichkeit zu erhöhen) und den wissenschaftlichen Fortschritt zu beschleunigen.
Zum Beispiel legt die vorläufige qualitative Analyse der Forscher von AI Scientist nahe, dass die resultierenden Arbeiten weitgehend informativ und neuartig sein können oder zumindest Ideen enthalten, die einer zukünftigen Forschung würdig sind.
Der tatsächliche Rechenaufwand, den das Team den KI-Wissenschaftlern für Experimente zuweist, ist nach aktuellen Maßstäben ebenfalls sehr gering. Bemerkenswert ist, dass die meisten Experimente der Forscher, die in einer Woche Hunderte von Arbeiten hervorbrachten, nur mit einem einzigen 8×NVIDIA H100-Knoten durchgeführt wurden. Wenn der Such- und Filterumfang in großem Umfang erweitert würde, könnten qualitativ hochwertigere Arbeiten erstellt werden.
In diesem Projekt entfielen die meisten Kosten für den Betrieb von AI Scientist auf die Kosten für die LLM-API-Codierung und das Verfassen von Papieren. Im Vergleich dazu waren die mit dem Betrieb des LLM-Reviewers verbundenen Kosten und der Rechenaufwand für die Durchführung der Experimente aufgrund der vom Team auferlegten Einschränkungen zur Reduzierung der Gesamtkosten vernachlässigbar.
Natürlich kann sich diese Kostenbeteiligung in Zukunft ändern, wenn KI-Wissenschaftler in anderen wissenschaftlichen Bereichen eingesetzt oder in größeren Computerexperimenten eingesetzt werden.
Offenes vs. geschlossenes Modell
Um die generierten Arbeiten quantitativ auszuwerten und zu optimieren, haben die Forscher zunächst einen automatisierten Papierprüfer erstellt und validiert. Die Ergebnisse zeigen, dass LLM zwar noch viel Raum für Optimierungen gibt, aber in der Lage ist, ziemlich genaue Bewertungen zu erstellen und bei verschiedenen Kennzahlen mit Menschen vergleichbare Ergebnisse zu erzielen.
Grafik: Das Violindiagramm zeigt die Verteilung der Bewertungen für von AI Scientist-Rezensenten erstellte Arbeiten in drei Bereichen und vier Basismodellen. (Quelle: Paper)
Durch die Anwendung dieses Gutachters auf von AI Scientist erstellte Arbeiten können Wissenschaftler die Bewertung von Arbeiten über die menschliche Begutachtung hinaus erweitern. Die Forscher fanden heraus, dass Sonnet 3.5 durchweg die besten Arbeiten hervorbrachte, von denen einige sogar die Akzeptanzschwelle automatisierter Papierprüfer auf Standardkonferenzen für maschinelles Lernen übertrafen.
Allerdings hat das Team keinen Grund zu der Annahme, dass AI Scientist seinen Vorsprung mit einem einzigen Modell wie Sonnet 3.5 behaupten kann. Forscher glauben, dass sich alle hochmodernen LLMs, einschließlich offener Modelle, weiter verbessern werden. Der Wettbewerb zwischen LLMs wird ihre Kommerzialisierung und Fähigkeiten erheblich steigern.
Abbildung: Auswertung des Paper-Review-Prozesses von AI Scientist zu ICLR 2022 OpenReview-Daten mit GPT-4o. (Quelle: Paper)
In diesem Projekt untersuchten die Forscher eine Vielzahl proprietärer LLMs, darunter GPT-4o und Sonnet, untersuchten aber auch die Verwendung offener Modelle wie DeepSeek und Llama-3. Es wurde festgestellt, dass das offene Modell erhebliche Vorteile wie geringere Kosten, garantierte Verfügbarkeit, größere Transparenz und größere Flexibilität bietet, allerdings bei etwas geringerer Qualität.
In Zukunft wollen die Forscher den vorgeschlagenen Entdeckungsprozess nutzen, um mithilfe offener Modelle selbstverbessernde künstliche Intelligenz in geschlossenen Systemen zu erzeugen.
Zukünftige Richtungen
Unmittelbare Verbesserungen an AI Scientist können die Integration visueller Funktionen zur besseren Handhabung von Diagrammen und Grafiken, die Einbeziehung von menschlichem Feedback und Interaktion zur Verbesserung der KI-Ausgabe sowie die Möglichkeit umfassen, dass AI Scientist Daten aus dem Internet extrahieren kann, neue Daten und Modelle können den Umfang ihrer Experimente automatisch erweitern, sofern dies sicher ist.
De plus, les scientifiques en IA peuvent donner suite à leurs meilleures idées et même travailler directement sur leur propre code de manière autoréférentielle. En fait, la majeure partie du code du projet a été écrite par Aider. L’élargissement du cadre à d’autres domaines scientifiques pourrait encore accroître son impact, ouvrant la voie à une nouvelle ère de découverte scientifique automatisée.
Essentiellement, les travaux futurs devraient résoudre les problèmes de fiabilité et d’hallucinations, éventuellement grâce à une validation automatisée plus approfondie des résultats rapportés. Cela peut être réalisé en reliant directement le code et les expériences, ou en voyant si un vérificateur automatisé peut reproduire les résultats de manière indépendante.
Epilogue
AI Scientist marque le début d'une nouvelle ère de découverte scientifique dans le domaine de l'apprentissage automatique : intégrer les avantages transformateurs des agents d'IA dans l'ensemble du processus de recherche de l'IA elle-même et rapprocher les scientifiques d'un monde capable de libérer des possibilités illimitées. et abordable Un monde où la créativité et l'innovation viennent résoudre les problèmes les plus difficiles du monde.
En fin de compte, « Nous envisageons un écosystème scientifique entièrement alimenté par l’IA, comprenant non seulement des chercheurs axés sur l’IA, mais également des évaluateurs, des chaires de recherche et des conférences entières. Cependant, nous ne pensons pas que le rôle des scientifiques humains s’affaiblira à mesure que nous le ferons. s'adapter aux nouvelles technologies et progresser dans la chaîne alimentaire, le rôle des scientifiques va changer", affirment les chercheurs dans l'article.
Alors que les itérations actuelles d'AI Scientist démontrent une forte capacité à innover en s'appuyant sur des idées éprouvées (telles que la modélisation de diffusion ou les transformateurs), la question de savoir si de tels systèmes seront finalement capables de proposer des idées véritablement révolutionnaires reste une question ouverte.
Les futures versions d'AI Scientists seront-elles capables de proposer des idées aussi percutantes que la modélisation de diffusion, ou de proposer la prochaine architecture Transformer ? Les machines seront-elles un jour capables d’inventer des concepts aussi fondamentaux que les réseaux de neurones artificiels ou la théorie de l’information ?
"Nous pensons qu'AI Scientist sera un excellent partenaire pour les scientifiques humains, mais seul le temps nous le dira." :
https://arxiv.org/abs/2408.06292Contenu de référence :
http://sakana.ai/ai-scientist/
https://x.com/SakanaAILabs/status/ 1823178623513239992https://mp.weixin.qq.com/s/-jjXBJAkdMEyl2JhRgwdaA
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Ce site a rapporté le 27 juin que Jianying est un logiciel de montage vidéo développé par FaceMeng Technology, une filiale de ByteDance. Il s'appuie sur la plateforme Douyin et produit essentiellement du contenu vidéo court pour les utilisateurs de la plateforme. Il est compatible avec iOS, Android et. Windows, MacOS et autres systèmes d'exploitation. Jianying a officiellement annoncé la mise à niveau de son système d'adhésion et a lancé un nouveau SVIP, qui comprend une variété de technologies noires d'IA, telles que la traduction intelligente, la mise en évidence intelligente, l'emballage intelligent, la synthèse humaine numérique, etc. En termes de prix, les frais mensuels pour le clipping SVIP sont de 79 yuans, les frais annuels sont de 599 yuans (attention sur ce site : équivalent à 49,9 yuans par mois), l'abonnement mensuel continu est de 59 yuans par mois et l'abonnement annuel continu est de 59 yuans par mois. est de 499 yuans par an (équivalent à 41,6 yuans par mois) . En outre, le responsable de Cut a également déclaré que afin d'améliorer l'expérience utilisateur, ceux qui se sont abonnés au VIP d'origine

Dans la fabrication moderne, une détection précise des défauts est non seulement la clé pour garantir la qualité des produits, mais également la clé de l’amélioration de l’efficacité de la production. Cependant, les ensembles de données de détection de défauts existants manquent souvent de précision et de richesse sémantique requises pour les applications pratiques, ce qui rend les modèles incapables d'identifier des catégories ou des emplacements de défauts spécifiques. Afin de résoudre ce problème, une équipe de recherche de premier plan composée de l'Université des sciences et technologies de Hong Kong, Guangzhou et de Simou Technology a développé de manière innovante l'ensemble de données « DefectSpectrum », qui fournit une annotation à grande échelle détaillée et sémantiquement riche des défauts industriels. Comme le montre le tableau 1, par rapport à d'autres ensembles de données industrielles, l'ensemble de données « DefectSpectrum » fournit le plus grand nombre d'annotations de défauts (5 438 échantillons de défauts) et la classification de défauts la plus détaillée (125 catégories de défauts).

La communauté ouverte LLM est une époque où une centaine de fleurs fleurissent et s'affrontent. Vous pouvez voir Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 et bien d'autres. excellents interprètes. Cependant, par rapport aux grands modèles propriétaires représentés par le GPT-4-Turbo, les modèles ouverts présentent encore des lacunes importantes dans de nombreux domaines. En plus des modèles généraux, certains modèles ouverts spécialisés dans des domaines clés ont été développés, tels que DeepSeek-Coder-V2 pour la programmation et les mathématiques, et InternVL pour les tâches de langage visuel.

Pour l’IA, l’Olympiade mathématique n’est plus un problème. Jeudi, l'intelligence artificielle de Google DeepMind a réalisé un exploit : utiliser l'IA pour résoudre la vraie question de l'Olympiade mathématique internationale de cette année, l'OMI, et elle n'était qu'à un pas de remporter la médaille d'or. Le concours de l'OMI qui vient de se terminer la semaine dernière comportait six questions portant sur l'algèbre, la combinatoire, la géométrie et la théorie des nombres. Le système d'IA hybride proposé par Google a répondu correctement à quatre questions et a marqué 28 points, atteignant le niveau de la médaille d'argent. Plus tôt ce mois-ci, le professeur titulaire de l'UCLA, Terence Tao, venait de promouvoir l'Olympiade mathématique de l'IA (AIMO Progress Award) avec un prix d'un million de dollars. De manière inattendue, le niveau de résolution de problèmes d'IA s'était amélioré à ce niveau avant juillet. Posez les questions simultanément sur l'OMI. La chose la plus difficile à faire correctement est l'OMI, qui a la plus longue histoire, la plus grande échelle et la plus négative.

Editeur | ScienceAI Sur la base de données cliniques limitées, des centaines d'algorithmes médicaux ont été approuvés. Les scientifiques se demandent qui devrait tester les outils et comment le faire au mieux. Devin Singh a vu un patient pédiatrique aux urgences subir un arrêt cardiaque alors qu'il attendait un traitement pendant une longue période, ce qui l'a incité à explorer l'application de l'IA pour réduire les temps d'attente. À l’aide des données de triage des salles d’urgence de SickKids, Singh et ses collègues ont construit une série de modèles d’IA pour fournir des diagnostics potentiels et recommander des tests. Une étude a montré que ces modèles peuvent accélérer les visites chez le médecin de 22,3 %, accélérant ainsi le traitement des résultats de près de 3 heures par patient nécessitant un examen médical. Cependant, le succès des algorithmes d’intelligence artificielle dans la recherche ne fait que le vérifier.

Editeur | KX À ce jour, les détails structurels et la précision déterminés par cristallographie, des métaux simples aux grandes protéines membranaires, sont inégalés par aucune autre méthode. Cependant, le plus grand défi, appelé problème de phase, reste la récupération des informations de phase à partir d'amplitudes déterminées expérimentalement. Des chercheurs de l'Université de Copenhague au Danemark ont développé une méthode d'apprentissage en profondeur appelée PhAI pour résoudre les problèmes de phase cristalline. Un réseau neuronal d'apprentissage en profondeur formé à l'aide de millions de structures cristallines artificielles et de leurs données de diffraction synthétique correspondantes peut générer des cartes précises de densité électronique. L'étude montre que cette méthode de solution structurelle ab initio basée sur l'apprentissage profond peut résoudre le problème de phase avec une résolution de seulement 2 Angströms, ce qui équivaut à seulement 10 à 20 % des données disponibles à la résolution atomique, alors que le calcul ab initio traditionnel

L'ensemble de données ScienceAI Question Answering (QA) joue un rôle essentiel dans la promotion de la recherche sur le traitement du langage naturel (NLP). Des ensembles de données d'assurance qualité de haute qualité peuvent non seulement être utilisés pour affiner les modèles, mais également évaluer efficacement les capacités des grands modèles linguistiques (LLM), en particulier la capacité à comprendre et à raisonner sur les connaissances scientifiques. Bien qu’il existe actuellement de nombreux ensembles de données scientifiques d’assurance qualité couvrant la médecine, la chimie, la biologie et d’autres domaines, ces ensembles de données présentent encore certaines lacunes. Premièrement, le formulaire de données est relativement simple, et la plupart sont des questions à choix multiples. Elles sont faciles à évaluer, mais limitent la plage de sélection des réponses du modèle et ne peuvent pas tester pleinement la capacité du modèle à répondre aux questions scientifiques. En revanche, les questions et réponses ouvertes

En 2023, presque tous les domaines de l’IA évoluent à une vitesse sans précédent. Dans le même temps, l’IA repousse constamment les limites technologiques de domaines clés tels que l’intelligence embarquée et la conduite autonome. Sous la tendance multimodale, le statut de Transformer en tant qu'architecture dominante des grands modèles d'IA sera-t-il ébranlé ? Pourquoi l'exploration de grands modèles basés sur l'architecture MoE (Mixture of Experts) est-elle devenue une nouvelle tendance dans l'industrie ? Les modèles de grande vision (LVM) peuvent-ils constituer une nouvelle avancée dans la vision générale ? ...Dans la newsletter des membres PRO 2023 de ce site publiée au cours des six derniers mois, nous avons sélectionné 10 interprétations spéciales qui fournissent une analyse approfondie des tendances technologiques et des changements industriels dans les domaines ci-dessus pour vous aider à atteindre vos objectifs dans le nouveau année. Cette interprétation provient de la Week50 2023
