localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA
- Direction:
- tous web3.0 développement back-end interface Web base de données Opération et maintenance outils de développement cadre php programmation quotidienne Applet WeChat Problème commun autre technologie Tutoriel CMS Java Tutoriel système tutoriels informatiques Tutoriel matériel Tutoriel mobile Tutoriel logiciel Tutoriel de jeu mobile
- Classer:
-
- Nouvelle méthode de glycoprotéomique, Fudan a développé un cadre hybride de bout en bout basé sur Transformer et GNN, publié dans la sous-journal Nature
- Editeur | La glycosylation des protéines cutanées du radis est une modification post-traductionnelle des protéines par des groupes sucre, qui joue un rôle important dans diverses fonctions physiologiques et pathologiques des cellules. La glycoprotéomique est l'étude de la glycosylation des protéines au sein du protéome, en utilisant la chromatographie liquide couplée à la technologie de spectrométrie de masse tandem (MS/MS) pour obtenir des informations combinées sur les sites de glycosylation, les niveaux de glycosylation et les structures des sucres. Cependant, les méthodes actuelles de recherche dans les bases de données en glycoprotéomique ont souvent du mal à déterminer les structures des glycanes en raison de la présence limitée d’ions déterminant la structure. Bien que les méthodes de recherche spectrale puissent exploiter l’intensité de la fragmentation pour faciliter l’identification structurelle des glycopeptides, les difficultés liées à la construction d’une bibliothèque spectrale entravent leur application. Dans la dernière recherche, des chercheurs de l'Université de Fudan ont proposé DeepGP, un système basé sur la transformation.
- IA 542 2024-08-06 08:31:22
-
- Changeant les règles du jeu pour les futures expériences sur les collisionneurs, l'Académie chinoise des sciences et l'Université de Pékin développent une technologie d'identification des sources d'injection basée sur l'IA
- Diagramme schématique d'un événement de double injection simulé au collisionneur circulaire électron-positon (CEPC). (Source : Institut de physique des hautes énergies, Académie chinoise des sciences) Editeur | Les quarks violets et les gluons sont des particules élémentaires dans le modèle standard de la physique des particules. Contrairement aux électrons ou aux photons, les quarks et les gluons ne peuvent pas se déplacer librement dans l'espace et dans le temps et ne peuvent être que mobiles. liés à des particules composites telles que des protons ou des neutrons. Les quarks ou gluons à haute énergie produits dans l'expérience du collisionneur seront convertis en un grand nombre de particules finales grâce à des interactions complexes, et ces dernières seront éjectées selon un angle plus petit dans la direction du mouvement des quarks ou gluons d'origine. connue sous le nom d’injection par jet. Récemment, l’équipe de Ruan Manqi de l’Institut de physique des hautes énergies de l’Académie chinoise des sciences, l’équipe de Zhou Chen de l’Université de Pékin et le chercheur Qu Huilin du Centre européen de recherche nucléaire ont proposé une technologie d’identification des sources de jets.
- IA 842 2024-08-06 06:55:12
-
- Yang Fengyu, PDG d'après 2000 : un médecin de Yale est retourné en Chine pour démarrer une entreprise et a construit le premier robot humanoïde « produit en série » en cinq mois AI Pioneer |
- L’humanité inaugure une mise à jour explosive dans le domaine de l’intelligence artificielle. Chaque étape de l’expansion de la technologie vers l’inconnu a attiré une attention étonnante. Dans le processus de repoussement des frontières de l'intelligence artificielle, l'innovation et le désaccord coexistent dans les parcours techniques des pistes importantes. Le jugement et les choix des pionniers de la technologie influencent les traces de nombreux adeptes. Au cours de l'année écoulée, ce site Web a pris les devants en exclusivité en présentant à tout le monde des sociétés exceptionnelles telles que Dark Side of the Moon, Shengshu Technology, Aishi Technology et Wuwen Core Dome, leur laissant avec le premier « script d'interview de 10 000 mots » en le monde Internet. À un stade où la feuille de route technique n’a pas encore convergé, nous avons vu le leadership d’entrepreneurs en IA qui ont véritablement foi, courage et cognition systématique. C’est pourquoi nous lançons « AIPioneers »
- IA 1025 2024-08-06 01:57:02
-
- Algorithmes, systèmes et applications, une compréhension globale des experts hybrides (MoE) sous trois angles
- Le LLM est très fort et afin de parvenir à une expansion durable du LLM, il est nécessaire de trouver et de mettre en œuvre des méthodes susceptibles d'améliorer son efficacité. L'Expert Hybride (MoE) est un membre important de cette méthode. Récemment, la nouvelle génération de grands modèles proposés par diverses entreprises technologiques utilise invariablement la méthode Mixture of Experts (MoE). Le concept d'experts hybrides est né dans l'article « Adaptive Mixtures of Local Experts » en 1991. Il a été largement exploré et développé pendant plus de 30 ans. Ces dernières années, avec l'émergence et le développement du MoE à portail clairsemé, en particulier lorsqu'il est combiné avec des modèles de langage à grande échelle basés sur Transformer, ce type de technologie avec une histoire de plus de trente ans a pris de l'ampleur.
- IA 1080 2024-08-06 01:49:02
-
- Compression ultime 70 fois supérieure ! Peu importe le nombre de points de contrôle que vous disposez sur un grand modèle, vous n'aurez pas peur.
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Les auteurs de cet article sont tous du laboratoire Noah de Huawei. Le premier auteur est Li Wenshuo et les auteurs correspondants sont Wang Yunhe et Chen Xinghao. Ces dernières années, les équipes concernées ont réalisé de nombreux travaux représentatifs lors de conférences de premier plan telles que ICML, CVPR, NeurIPS, ICCV et ECCV.
- IA 859 2024-08-06 01:46:42
-
- La mise à niveau de la stratégie de marque de NetEase Shufan : « Produits + Ingénierie + Talents » aide les entreprises à renforcer leur compétitivité en matière d'intelligence numérique
- La vague d'intelligence arrive. La numérisation et l'intelligence changent non seulement le travail et la vie du public, mais apportent également une imagination illimitée à l'industrie. Le 2 novembre, lors de la conférence NetEase Digital+ 2023 sur le thème « L'intelligence numérique se rassemble, partons pour un nouveau voyage », NetEase Shufan a annoncé une nouvelle stratégie de marque, qui la positionnera comme « leader dans la production de logiciels d'intelligence numérique ». et proposer une nouvelle stratégie de développement de logiciels d'intelligence numérique, fondée sur « produit + ingénierie + talent », qui permet de créer une compétitivité unique en matière d'intelligence numérique pour chaque organisation. Autour de cela, NetEase Shufan a publié des mises à niveau et des innovations multi-domaines et multidimensionnelles en matière de produits, d'écologie, de formation des talents, etc., pour gagner la nouvelle ère de l'intelligence numérique avec ses partenaires et ses clients ! Lors de l'ouverture de la conférence, Yang Xiaoyong, directeur adjoint du Bureau municipal d'information et d'économie de Hangzhou, a prononcé un discours. Il a affirmé l'importante contribution de NetEase à la construction de l'économie numérique de Hangzhou au fil des ans et a déclaré que l'économie numérique de NetEase était importante.
- IA 935 2024-08-06 00:59:02
-
- Tout à l'heure, Google a publié un modèle mondial de base : les paramètres 11B, qui peuvent générer un monde virtuel interactif.
- Générez un monde de jeu jouable en un seul clic. Cela ne fait que deux semaines qu’il est sorti, et le modèle mondial de Google est également arrivé, et ses capacités semblent encore plus puissantes : le monde virtuel qu’il génère est « autonome et contrôlable ». Tout à l'heure, Google a défini un nouveau paradigme d'IA générative : les environnements interactifs génératifs (Genie, Generative Interactive Environments). Genie est un modèle mondial de base de 11 milliards de paramètres qui peut générer des environnements interactifs jouables à partir d'une seule invite d'image. Nous pouvons le stimuler avec des images qu'il n'a jamais vues auparavant, puis interagir avec le monde virtuel de notre propre imagination. Qu'il s'agisse d'images composites, de photos ou même de croquis dessinés à la main, Genie peut générer une infinité de mondes jouables à partir d'elles. Ge
- IA 851 2024-08-06 00:18:32
-
- Lee Tsung-dao, le premier lauréat chinois du prix Nobel, est décédé à l'âge de 98 ans
- Tsung-Dao Lee, le premier lauréat chinois du prix Nobel, est décédé le 4 août à San Francisco, aux États-Unis, à l'âge de 98 ans. M. Tsung-Dao Lee (Tsung-Dao Lee) est né le 24 novembre 1926. C'est un physicien sino-américain. Il est célèbre pour ses recherches sur la non-conservation de la parité, le théorème de Li Yang, la physique des particules et les ions lourds relativistes. (RHIC) physique et solitons non topologiques Connu pour ses travaux sur les étoiles solitons. Tsung-Dao Lee était professeur honoraire à l'Université de Columbia et a enseigné de 1953 jusqu'à sa retraite en 2012. Lee Tsung-dao et Yang Chenning ont tous deux été les premiers lauréats chinois du prix Nobel. En 1957, Lee Tsung-dao, 31 ans, et Yang Chen-ning, 35 ans, remportent conjointement le prix Nobel pour leurs « recherches sur la loi de non-conservation de la parité (dans les interactions faibles) et les nombreuses découvertes qui en résultent ». sur les particules élémentaires"
- IA 938 2024-08-05 22:52:42
-
- Karpathy, qui a quitté OpenAI et était au chômage, a lancé un nouveau projet de modèle à grande échelle et le nombre d'étoiles a dépassé les 1 000 par jour.
- Même si vous n’avez pas de travail, vous devez quand même « le faire ». Andrej Karpathy, qui ne peut prendre aucun congé, a un nouveau projet ! OpenAI a été très animé ces derniers jours. Tout d'abord, le gourou de l'IA Andrej Karpathy a officiellement annoncé sa démission, puis le modèle de génération vidéo Sora a secoué le cercle de l'IA. Après avoir annoncé son départ d'OpenAI, Karpathy a tweeté : "Je peux faire une pause cette semaine." Source : https://twitter.com/karpathy/status/1757986972512239665 Cet état de n'avoir rien à faire rend même Musk envieux (Iamenvious). Mais si tu penses vraiment que Karpathy va prendre congé, c'est un peu trop
- IA 593 2024-08-05 22:09:42
-
- OpenDevin a publié un rapport technique, une lecture incontournable pour les développeurs d'agents de grands modèles
- Plateforme d'agent grand modèle à usage général populaire. En mars de cette année, « le premier ingénieur logiciel d'IA au monde » Devin a fait exploser le cercle de l'IA. Contrairement aux précédents assistants de programmation IA, Devin ne joue pas seulement le rôle d'assistance à la programmation, mais peut mener à bien l'ensemble du projet de développement de manière indépendante et de bout en bout. La naissance de Devin nous a permis d’apprécier les puissantes capacités des Agents à grande échelle. Bientôt, de nombreux projets open source sont apparus dans l'industrie essayant de le copier, parmi lesquels OpenDevin s'est démarqué et a reçu le plus d'attention. OpenDevin est une plate-forme de développement d'agents à usage général qui interagissent avec le monde via des logiciels. Ses fonctionnalités incluent : un mécanisme d'interaction entre les agents, les interfaces et les environnements de grand modèle ; un système d'exploitation sandbox disponible pour les agents.
- IA 1249 2024-08-05 21:40:01
-
- Quel algorithme d'optimisation des préférences humaines est le meilleur ? Suivez le maître pour comprendre DPO, IPO et KTO
- Bien que les approches visant à collecter des étiquettes humaines sur la qualité relative du contenu généré par le modèle et à affiner les grands modèles de langage non supervisés pour se conformer à ces préférences grâce à l'apprentissage par renforcement à partir de la rétroaction humaine (RLHF), ont considérablement fait progresser le développement de l'IA conversationnelle. Cependant, comme le RLHF est un processus complexe et souvent instable, la recherche sur l’utilisation directe des fonctions d’optimisation pour aligner les préférences humaines sur les résultats du modèle est devenue un sujet brûlant de nos jours. Cet article est un blog sur huggingface, qui compare les performances de trois algorithmes d'optimisation des préférences humaines courants de nos jours. Les auteurs ont mené des expériences approfondies pour évaluer trois méthodes réalisables pour ajuster les modèles de langage sans apprentissage par renforcement (ou ajustement des préférences), en utilisant différents modèles et différents hyperparamètres. ce
- IA 906 2024-08-05 21:19:22
-
- 'Le meilleur des deux mondes', conception de molécules à partir de zéro, architecture de deep learning S4 pour la modélisation du langage chimique
- Editeur | KX L'apprentissage profond génératif remodèle la conception des médicaments. Les modèles de langage chimique (CLM), qui génèrent des molécules sous forme de chaînes de molécules, sont particulièrement importants dans ce processus. Récemment, des chercheurs de l’Université de technologie d’Eindhoven aux Pays-Bas ont introduit une dernière architecture d’apprentissage profond (S4) dans la conception de médicaments de novo. Le modèle Structured State Space Sequence (S4) présente d’excellentes performances dans l’apprentissage des propriétés globales de la séquence. Alors, S4 peut-il faire progresser la modélisation du langage chimique conçue à partir de zéro ? Pour répondre à cette question, les chercheurs ont systématiquement comparé S4 au CL de pointe sur une gamme de tâches de découverte de médicaments.
- IA 1043 2024-08-05 20:58:22
-
- Comment choisir un schéma de compression et de quantification pour les grands modèles ? Évaluation complète du schéma de quantification Qllm-Eval du Wuwen Core Dome : multimodèle, multiparamètres, multidimensionnel
- Les modèles de langage à grande échelle basés sur l'architecture Transformer ont montré d'excellentes performances dans divers tests de référence, mais des échelles de paramètres de l'ordre de dizaines de milliards, de centaines de milliards, voire de milliards, entraîneront des coûts de service élevés. Par exemple, GPT-3 possède 175 milliards de paramètres, utilise le stockage FP16 et la taille du modèle est d'environ 350 Go, alors que même le dernier GPU B200 de Nvidia ne dispose que de 192 Go de mémoire, sans parler des autres GPU et appareils de pointe. La compression de grands modèles signifie « réduire » les grands modèles et les insérer dans des scénarios aux ressources limitées afin de réduire le stockage des modèles, l'accès à la mémoire et la surcharge de calcul. Améliorez le débit d'inférence des grands modèles sans perdre autant que possible les performances du modèle, afin que les grands modèles puissent être utilisés dans les appareils IoT Edge, les robots embarqués, les applications mobiles hors ligne, etc.
- IA 740 2024-08-05 20:56:12
-
- La mise au point de grands modèles doit-elle s'appuyer sur des données humaines ? DeepMind : l'auto-formation avec feedback est préférable
- Face à la pratique courante actuelle consistant à affiner de grands modèles en s'appuyant principalement sur des données générées par l'homme, Google DeepMind a exploré un moyen plus efficace de réduire cette dépendance. Comme vous et moi pouvons le constater, les grands modèles linguistiques (LLM) changent le paysage de l'apprentissage profond, démontrant des capacités supérieures à générer du texte de qualité humaine et à résoudre une variété de tâches linguistiques. Alors que l’industrie a encore amélioré ses performances sur des tâches spécifiques grâce à un réglage fin supervisé des données collectées par les humains, l’obtention de données humaines de haute qualité se heurte à d’importants goulots d’étranglement. Cela est particulièrement vrai pour les tâches qui impliquent de résoudre des problèmes complexes, nécessitant des ressources et une expertise importantes. Comment le résoudre? Les données synthétiques générées par les modèles constituent une alternative potentielle qui peut être évolutive et rentable tant que la qualité des données est maintenue.
- IA 1002 2024-08-05 20:48:40
-
- Intégration de nouvelles qualités et résonance de la puissance de calcul : Bose Quantum lance une nouvelle génération d'ordinateur quantique optique cohérent à 550 qubits de calcul
- Le 18 avril 2024, Beijing Bose Quantum Technology Co., Ltd. (ci-après dénommé « Bose Quantum ») a organisé avec succès la conférence de lancement de nouveaux produits 2024 à Wangjing, Pékin, sur le thème « Intégration de nouvelles qualités et résonance de puissance de calcul". Pound a publié des résultats de recherche de base tels que la nouvelle génération d'ordinateur quantique à lumière cohérente avec 550 qubits de calcul - "Tiangong Quantum Brain 550W" et Kaiwu SDK, qui démontre pleinement l'intégration de l'informatique quantique et de l'IA et constitue le point de départ de informatique quantique pratique. En 2024, la technologie quantique jouera un rôle important dans le développement des industries futures et des nouvelles forces productives, comme le propose clairement la future configuration industrielle de Pékin.
- IA 1317 2024-08-05 20:43:00