localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA
- Direction:
- tous web3.0 développement back-end interface Web base de données Opération et maintenance outils de développement cadre php programmation quotidienne Applet WeChat Problème commun autre technologie Tutoriel CMS Java Tutoriel système tutoriels informatiques Tutoriel matériel Tutoriel mobile Tutoriel logiciel Tutoriel de jeu mobile
- Classer:
-
- Runway et Luma se battent à nouveau ! Yann LeCun bombarde : Aussi bon que vous soyez, vous n'êtes pas un 'modèle mondial'
- Rédacteur du Machine Power Report : Yang Wen La vague d’intelligence artificielle représentée par les grands modèles et l’AIGC a discrètement changé notre façon de vivre et de travailler, mais la plupart des gens ne savent toujours pas comment l’utiliser. C'est pourquoi nous avons lancé la rubrique « AI in Use » pour présenter en détail comment utiliser l'IA à travers des cas d'utilisation de l'intelligence artificielle intuitifs, intéressants et concis et stimuler la réflexion de chacun. Nous invitons également les lecteurs à soumettre des cas d'utilisation innovants et pratiques. L'industrie de la vidéo IA se « bat » à nouveau ! Le 29 juin, la célèbre plateforme d'IA générative Runway a annoncé que son dernier modèle Gen-3Alpha avait commencé à tester pour certains utilisateurs. Le même jour, Luma a lancé une nouvelle fonctionnalité d’images clés et est ouverte gratuitement à tous les utilisateurs. On peut dire que "tu as un bon plan, j'ai une échelle murale"
- IA 1090 2024-07-03 09:13:06
-
- Publié dans la revue Nature, le modèle topologique Transformer prédit les interactions protéine-ligand à plusieurs échelles pour faciliter le développement de médicaments.
- Editeur | Radis Skin Une nouvelle application d'intelligence artificielle aidera les chercheurs à améliorer leurs capacités de développement de médicaments. Le projet, appelé TopoFormer, a été développé par une équipe interdisciplinaire dirigée par le professeur Guowei Wei du département de mathématiques de la Michigan State University. TopoFormer convertit les informations tridimensionnelles sur les molécules en données pouvant être utilisées par des modèles d'interaction médicamenteuse typiques basés sur l'IA, élargissant ainsi la capacité de ces modèles à prédire l'efficacité des médicaments. "Grâce à l'intelligence artificielle, vous pouvez rendre le développement de médicaments plus rapide, plus efficace et moins cher", a déclaré Wei, qui occupe des postes au Département de biochimie et de biologie moléculaire et au Département de génie électrique et informatique. Le professeur Wei a expliqué qu'aux États-Unis,
- IA 1218 2024-07-02 15:23:21
-
- J'ai hâte de voir Q* d'OpenAI, l'arme secrète de Huawei Noah, MindStar pour explorer le raisonnement LLM, est là en premier
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Les auteurs de cet article proviennent du laboratoire Arche de Noé de Huawei à Montréal, dont Kang Jikun, Li Xinze, Chen Xi, Amirreza Kazemi et Chen Boxing. L’intelligence artificielle (IA) a fait de grands progrès au cours de la dernière décennie, notamment dans le traitement du langage naturel et la vision par ordinateur.
- IA 681 2024-07-02 05:01:41
-
- Venir vite! Luchen Open-Sora peut collecter de la laine et vous pouvez facilement démarrer la génération de vidéos pour 10 yuans.
- Récemment, le domaine des modèles de génération vidéo est en plein essor, avec des vidéos basées sur Vincent, des vidéos basées sur T, etc. Cependant, malgré le grand nombre de modèles sur le marché, la plupart des gens ne peuvent toujours pas en faire l'expérience car ils n'ont pas les qualifications nécessaires pour les tests internes et ne peuvent que regarder les « modèles » et soupirer. Il n’y a pas si longtemps, nous avons parlé du modèle Open-Sora de Luchen Technology. En tant que premier modèle open source de type Sora au monde, il fonctionne non seulement bien sur plusieurs types de vidéos, mais il est également peu coûteux et accessible à tous. Est-ce que ça marche? comment utiliser? Jetons un coup d'œil à la critique de ce site. Récemment, la nouvelle version open source 1.2 d'Open-Sora peut générer des vidéos haute définition 720p d'une durée maximale de 16 secondes. L'effet vidéo officiel est le suivant : L'effet généré est vraiment incroyable. Je veux commencer et en faire l'expérience. Par rapport
- IA 1185 2024-07-02 04:22:00
-
- Amazon Cloud Innovation « Neural Sparse Retrieval » : seule la correspondance de texte est nécessaire pour réaliser une recherche sémantique
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. E-mail de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Les auteurs de cet article sont le Dr Yang Yang, responsable de l'apprentissage automatique, et les ingénieurs en apprentissage automatique Geng Zhichao et Guan Cong de l'équipe R&D d'OpenSearch China. OpenSearch est un projet de moteur de recherche et d'analyse en temps réel purement open source initié par Amazon Cloud Technology.
- IA 1028 2024-07-02 02:55:57
-
- Composez un programme graphique simplement en regardant un croquis dessiné à la main. Berkeley, en Californie, enseigne de nouvelles compétences aux modèles de diffusion.
- Il s’avère que les modèles de diffusion peuvent être utilisés non seulement pour générer des images et des vidéos, mais aussi pour synthétiser de nouveaux programmes. Supposons que nous donnions au modèle un graphique en forme de « 5 » dessiné à la main, il peut modifier le programme par des mutations continues et finalement obtenir un programme capable de générer le graphique cible. Le modèle provient d'une équipe de recherche de l'Université de Californie à Berkeley, qui a proposé une nouvelle méthode de synthèse de programme utilisant un modèle de diffusion neuronale pour manipuler directement les arbres syntaxiques. La thèse 1 est celle de Shreyas Kapur, doctorant à l'école, dont le directeur est Stuart Russell, professeur d'informatique à l'école. Titre de l’article : DiffusionOnSyntaxTreesForProgramSynthesis Adresse de l’article : https://arxiv.
- IA 1086 2024-07-02 01:14:04
-
- En battant 25 algorithmes de conception moléculaire, Georgia Tech, l'Université de Toronto et Cornell ont proposé un grand modèle de langage MOLLEO
- Auteur | Editeur Wang Haorui, Georgia Institute of Technology | ScienceAI La découverte moléculaire, en tant que problème d'optimisation, pose des défis informatiques importants car ses objectifs d'optimisation peuvent ne pas être différenciables. Les algorithmes évolutionnaires (EA) sont couramment utilisés pour optimiser les cibles de la boîte noire dans la découverte moléculaire en traversant l'espace chimique par mutation aléatoire et croisement, mais cela entraîne une évaluation de cible étendue et coûteuse. Dans ce travail, des chercheurs du Georgia Institute of Technology, de l'Université de Toronto et de l'Université Cornell ont collaboré pour proposer une optimisation évolutive améliorée du langage moléculaire (MOLLEO) en intégrant de grands modèles de langage (LLM) pré-entraînés avec des connaissances chimiques dans des algorithmes évolutifs. améliorant considérablement les capacités d’optimisation moléculaire des algorithmes évolutifs. L’étude s’intitule « EfficientEvolutionarySearc »
- IA 1307 2024-07-02 01:07:36
-
- ICML 2024 | Le grand modèle de langage facilite les tâches de détection de non-distribution basées sur CLIP
- Les modèles d'apprentissage automatique peuvent afficher des performances supérieures lorsque les distributions des ensembles de données de formation et de test sont les mêmes. Cependant, dans un environnement de monde ouvert, les modèles rencontrent souvent des échantillons hors distribution (OOD) qui peuvent rendre le modèle imprévisible et les conséquences des erreurs peuvent être fatales, en particulier dans des scénarios à haut risque tels que la conduite autonome. [1,2]. Par conséquent, la détection OOD est cruciale pour garantir la fiabilité des modèles d’apprentissage automatique lors d’un déploiement réel. La plupart des méthodes de détection OOD [1, 3] peuvent détecter efficacement les échantillons OOD sur la base de classificateurs en distribution (ID) bien entraînés. Couru
- IA 725 2024-07-01 23:29:18
-
- ICML 2024 Spotlight | Le réalignement du décodage rend les modèles de langage moins hallucinatoires et plus cohérents avec les préférences humaines
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Cet article présente un article sur la recherche sur l'alignement des modèles de langage, qui a été réalisé par des doctorants de trois universités de Suisse, du Royaume-Uni et de France, ainsi que par des chercheurs de Google DeepMind et Recherche Google. Parmi eux, l'auteur correspondant Ti
- IA 595 2024-07-01 22:09:56
-
- Les développeurs sont ravis ! La dernière version de Meta du compilateur LLM atteint une efficacité de réglage automatique de 77 %
- Meta a développé un formidable LLMCompiler pour aider les programmeurs à écrire du code plus efficacement. Hier, les trois grands géants de l'IA OpenAI, Google et Meta se sont associés pour publier les derniers résultats de recherche de leurs propres grands modèles - OpenAI a lancé CriticGPT, un nouveau modèle spécialement conçu pour trouver des bugs basés sur la formation GPT-4, Google a open source le Les versions 9B et 27B de Gemma2 et Meta ont développé une dernière percée en matière d'intelligence artificielle - LLMCompiler. Il s'agit d'un ensemble puissant de modèles open source conçus pour optimiser le code et révolutionner la conception des compilateurs. Cette innovation a le potentiel de changer la façon dont les développeurs abordent l'optimisation du code, la rendant plus rapide, plus efficace et plus économique.
- IA 1434 2024-07-01 18:16:39
-
- 30 fois plus efficace que les méthodes traditionnelles, le modèle d'apprentissage profond Transformer de l'équipe de l'Académie chinoise des sciences prédit les sites d'interaction sucre-protéine
- Les sucres sont les substances organiques les plus abondantes dans la nature et sont essentiels à la vie. Comprendre comment les glucides régulent les protéines au cours des processus physiologiques et pathologiques peut offrir la possibilité de répondre à des questions biologiques clés et de développer de nouveaux traitements. Cependant, la diversité et la complexité des molécules de sucre posent un défi pour identifier expérimentalement les sites de liaison et d’interaction sucre-protéine. Ici, une équipe de l'Académie chinoise des sciences a développé DeepGlycanSite, un modèle d'apprentissage profond capable de prédire avec précision les sites de liaison du sucre sur une structure protéique donnée. DeepGlycanSite intègre les caractéristiques géométriques et évolutives des protéines dans un réseau neuronal à graphes équivariants profonds avec une architecture Transformer. Ses performances dépassent considérablement les méthodes avancées précédentes et peuvent prédire efficacement.
- IA 1100 2024-07-01 15:17:50
-
- Plus de 300 études connexes, les derniers articles de synthèse sur l'édition d'images multimodales de l'Université de Fudan et de l'Université technologique de Nanyang
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Shuai Xincheng, le premier auteur de cet article, étudie actuellement pour un doctorat au laboratoire FVL de l'université de Fudan et est diplômé de l'université Jiao Tong de Shanghai avec un baccalauréat. Ses principaux intérêts de recherche incluent le montage d’images et de vidéos et l’apprentissage multimodal. Introduction Cet article propose une approche unifiée pour résoudre les tâches d'édition générales.
- IA 620 2024-06-29 06:14:41
-
- Avec une précision de 0,96, un réseau neuronal graphique de contraintes physiques et chimiques est utilisé pour prédire les interactions protéine-ligand à partir de séquences.
- Editeur | Radis Skin Dans le développement de médicaments, il est crucial de déterminer l'affinité de liaison et l'effet fonctionnel des ligands de petites molécules sur les protéines. Les méthodes informatiques actuelles peuvent prédire ces propriétés d’interaction protéine-ligand, mais sans structures protéiques à haute résolution, la précision est souvent perdue et les effets fonctionnels ne peuvent être prédits. Des chercheurs de l’Université Monash et de l’Université Griffith ont développé PSICHIC (PhySIcoCHhemICalgraphneuralnetwork), un cadre qui combine des contraintes physicochimiques pour décoder les empreintes digitales d’interaction directement à partir des données de séquence. Cela permet à PSICHIC de décoder les mécanismes à l’origine des interactions protéine-ligand, atteignant ainsi une précision et une interprétabilité de pointe. En l'absence de données structurées
- IA 810 2024-06-29 05:16:50
-
- Le « travail sincère » de Google, versions open source 9B et 27B de Gemma2, axées sur l'efficacité et l'économie !
- Comment Gemma2, qui a deux fois plus de performances, peut-il jouer avec Llama3, qui a le même niveau de performances ? Sur la piste de l’IA, les géants de la technologie se livrent une concurrence féroce. GPT-4o est sorti sur le pied avant et Claude3.5Sonnet est apparu sur le pied arrière. Dans une bataille aussi féroce, bien que Google ait lancé ses efforts tardivement, il a une capacité significative à donner suite dans un court laps de temps, ce qui montre son potentiel de développement technologique et d'innovation. En plus du modèle Gemini, Gemma, une série de modèles ouverts SOTA légers, semble plus proche de nous. Il s’appuie sur les mêmes recherches et technologies que le modèle Gemini et vise à donner à chacun les outils nécessaires pour construire l’IA. Google continue d'élargir la famille Gemma, notamment CodeGemma, RecurrentGemma et P
- IA 1147 2024-06-29 00:59:21
-
- ICML 2024 | Révéler le mécanisme de l'apprentissage non linéaire des transformateurs et de la généralisation dans l'apprentissage contextuel
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com L'auteur de cet article, Li Hongkang, est doctorant au Département de génie électrique, informatique et des systèmes de l'Institut polytechnique Rensselaer aux États-Unis. Université des sciences et technologies de Chine avec un baccalauréat. Les domaines de recherche incluent la théorie de l'apprentissage profond, la théorie des grands modèles de langage, l'apprentissage automatique statistique, etc. Actuellement en ICLR/
- IA 503 2024-06-29 00:44:41