


Statistiques académiques 2021 ML et NLP : Google se classe premier et l'expert en apprentissage par renforcement Sergey Levine est en tête de liste
2021 est une année très productive pour le traitement du langage naturel (NLP) et l'apprentissage automatique (ML). Il est maintenant temps de compter les articles dans le domaine du NLP et du ML l'année dernière.
MAREK REI, chercheur en apprentissage automatique et traitement du langage naturel de l'Université de Cambridge, a résumé et analysé des articles classiques en 2021 et a résumé les statistiques des publications ML et NLP en 2021. Il a mené une enquête auprès des principales conférences et revues dans l'industrie de l'intelligence artificielle Pour l'analyse, ils incluent ACL, EMNLP, NAACL, EACL, CoNLL, TACL, CL, NeurIPS, AAAI, ICLR, ICML.
L'analyse du document est complétée à l'aide d'une série d'outils automatisés, qui peuvent ne pas être parfaits et peuvent contenir des défauts et des erreurs. Pour une raison quelconque, certains auteurs ont commencé à publier leurs articles sous une forme obscurcie pour empêcher toute forme de duplication de contenu ou d'extraction automatisée de contenu, et ces articles ont été exclus du processus d'analyse.
Jetons maintenant un œil aux résultats statistiques de MAREK REI.
Basé sur les statistiques des conférences académiques
Le nombre de soumissions à la plupart des conférences continue d'augmenter et de battre des records. ACL semble être une exception, AAAI a presque atteint un plateau, tandis que NeurIPS maintient toujours une croissance régulière.
Sur la base des statistiques institutionnelles
La principale institution de recherche en termes de nombre d'articles publiés en 2021 est sans aucun doute Google, qui se classe deuxième, la CMU, l'Université de Stanford, Meta et le MIT sont suivis de près, suivis de Tsinghua ; Université Classée septième. Microsoft, CAS, Amazon, Tencent, Cambridge, Washington et Alibaba se distinguent par une proportion importante d'articles lors des conférences NLP, tandis que d'autres grandes organisations semblent se concentrer principalement sur le domaine du ML.
À en juger par les données de 2012 à 2021, Google s'est classé premier avec 2 170 articles publiés, dépassant les 2 013 articles publiés par Microsoft. La CMU a publié 1 881 articles, se classant troisième.
La plupart des institutions continuent d'augmenter leur nombre de publications annuelles. Le nombre d'articles publiés par Google augmentait de manière linéaire, et maintenant cette tendance s'est atténuée, mais l'entreprise publie toujours plus d'articles qu'auparavant ; la CMU a connu un plateau l'année dernière, mais IBM semble être le seul à l'avoir rattrapé cette année ; entreprise qui publie un peu plus d’articles. Institutions en déclin.
Par auteur
Ensuite, jetons un coup d'œil aux chercheurs qui ont publié le plus d'articles en 2021. Sergey Levine (professeur adjoint de génie électrique et d'informatique, Université de Californie, Berkeley) a publié 42 articles, se classant premier ; Liu Tieyan (Microsoft), Zhou Jie (Université Tsinghua), Mohit Bansal (Université de Caroline du Nord à Chapel Hill), Graham Neubig (CMU) occupe également une place relativement élevée dans le nombre d'articles publiés.
En ce qui concerne la période 2012-2021, les articles publiés par Sergey Levine sont en tête de liste. Il s'est classé sixième l'année dernière et est passé au premier cette année ; Yue (Westlake University), Zhou Ming (scientifique en chef d'Innovation Works), Ting Liu (Harbin Institute of Technology) et d'autres se classent également relativement bien en termes de nombre d'articles publiés.
Sergey Levine a établi un nouveau record avec une marge considérable ; le nombre d'articles de Mohit Bansal a également augmenté de manière significative, publiant 31 articles en 2021, ce qui est le même que le nombre d'articles de Graham Neubig ; en baisse en 2020, mais maintenant il est à nouveau en hausse.
Statistiques des articles publiés en tant que premier auteur
Les chercheurs qui publient le plus d'articles sont généralement des postdoctorants et des superviseurs. En revanche, les personnes qui publient davantage d’articles en tant que premiers auteurs sont généralement des personnes qui effectuent de véritables recherches.
Ramit Sawhney (directeur technique de Tower Research Capital) a publié 9 articles influents en 2021, et Jason Wei (Google) et Tiago Pimentel (doctorant à l'Université de Cambridge) ont chacun publié 6 articles influents.
À en juger par la répartition de 2012 à 2021, Ivan Vulić (Université de Cambridge) et Zeyuan Allen-Zhu (Microsoft) ont tous deux publié 24 articles influents en tant que premiers auteurs, se classant premiers ; Jiwei (Shannon Technology) s'est classé deuxième, publiant respectivement 23 et 22 articles influents en tant que premiers auteurs ; Ilias Diakonikolas (Université du Wisconsin-Madison) Il a publié 15 articles NeurIPS en tant que premier auteur.
Sur la base des statistiques nationales
En nombre de publications par pays en 2021, les États-Unis comptent le plus grand nombre de publications, la Chine et le Royaume-Uni se classant respectivement 2e et 3e. Aux États-Unis et au Royaume-Uni, NeurIPS représente la plus grande proportion, tandis que l'AAAI représente la plus grande proportion en Chine.
Les coordonnées verticales de haut en bas sont 500, 1000, 1500, 2000, 2500, etc.
Presque tous les pays les mieux classés continuent d'augmenter leur nombre de publications et continueront d'augmenter leur nombre de publications au cours de l’année 2021 a établi un nouveau record. L'augmentation a été la plus importante pour les États-Unis, renforçant ainsi leur avance.
Aux États-Unis, Google, Microsoft et CMU sont une fois de plus en tête de liste des éditeurs.
En Chine, l'Université Tsinghua, l'Académie chinoise des sciences et l'Université de Pékin ont publié le plus d'articles en 2021.
Statistiques basées sur la pertinence du sujet
La visualisation montre que ces organisations sont principalement regroupées en fonction de la proximité géographique, avec des entreprises au milieu.
On peut aussi visualiser l'auteur, mais cette visualisation est un peu difficile à comprendre.
Par statistiques de mots-clés
Nous pouvons également tracer la proportion d'articles contenant des mots-clés spécifiques et suivre l'évolution de cette proportion au fil du temps.
Le mot « neuronal » semble suivre une légère tendance à la baisse, même si on peut encore le voir dans 80 % des journaux. Dans le même temps, les proportions de « récurrents » et de « convolutionnels » diminuent également, et le mot « transformateur » apparaît dans plus de 30 % des articles.
Si vous regardez seul le mot « contradictoire », nous constaterons qu'il est très courant dans l'ICLR, et près de la moitié des journaux le mentionnent. La proportion de « contradictoires » dans ICML et NeurIPS semble avoir déjà atteint un sommet, contrairement à l'AAAI.
Ces dernières années, le terme « transformateur » est devenu très populaire. Il est particulièrement largement utilisé dans les articles sur la PNL, avec plus de 50 % des articles publiés le contenant, et sa popularité ne cesse d'augmenter dans toutes les conférences ML.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

DDREASE est un outil permettant de récupérer des données à partir de périphériques de fichiers ou de blocs tels que des disques durs, des SSD, des disques RAM, des CD, des DVD et des périphériques de stockage USB. Il copie les données d'un périphérique bloc à un autre, laissant derrière lui les blocs corrompus et ne déplaçant que les bons blocs. ddreasue est un puissant outil de récupération entièrement automatisé car il ne nécessite aucune interruption pendant les opérations de récupération. De plus, grâce au fichier map ddasue, il peut être arrêté et repris à tout moment. Les autres fonctionnalités clés de DDREASE sont les suivantes : Il n'écrase pas les données récupérées mais comble les lacunes en cas de récupération itérative. Cependant, il peut être tronqué si l'outil est invité à le faire explicitement. Récupérer les données de plusieurs fichiers ou blocs en un seul

0. À quoi sert cet article ? Nous proposons DepthFM : un modèle d'estimation de profondeur monoculaire génératif de pointe, polyvalent et rapide. En plus des tâches traditionnelles d'estimation de la profondeur, DepthFM démontre également des capacités de pointe dans les tâches en aval telles que l'inpainting en profondeur. DepthFM est efficace et peut synthétiser des cartes de profondeur en quelques étapes d'inférence. Lisons ce travail ensemble ~ 1. Titre des informations sur l'article : DepthFM : FastMonocularDepthEstimationwithFlowMatching Auteur : MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Si vous avez besoin de savoir comment utiliser le filtrage avec plusieurs critères dans Excel, le didacticiel suivant vous guidera à travers les étapes pour vous assurer que vous pouvez filtrer et trier efficacement vos données. La fonction de filtrage d'Excel est très puissante et peut vous aider à extraire les informations dont vous avez besoin à partir de grandes quantités de données. Cette fonction peut filtrer les données en fonction des conditions que vous définissez et afficher uniquement les pièces qui remplissent les conditions, rendant la gestion des données plus efficace. En utilisant la fonction de filtre, vous pouvez trouver rapidement des données cibles, ce qui vous fait gagner du temps dans la recherche et l'organisation des données. Cette fonction peut non seulement être appliquée à de simples listes de données, mais peut également être filtrée en fonction de plusieurs conditions pour vous aider à localiser plus précisément les informations dont vous avez besoin. Dans l’ensemble, la fonction de filtrage d’Excel est très utile

Les performances de JAX, promu par Google, ont dépassé celles de Pytorch et TensorFlow lors de récents tests de référence, se classant au premier rang sur 7 indicateurs. Et le test n’a pas été fait sur le TPU présentant les meilleures performances JAX. Bien que parmi les développeurs, Pytorch soit toujours plus populaire que Tensorflow. Mais à l’avenir, des modèles plus volumineux seront peut-être formés et exécutés sur la base de la plate-forme JAX. Modèles Récemment, l'équipe Keras a comparé trois backends (TensorFlow, JAX, PyTorch) avec l'implémentation native de PyTorch et Keras2 avec TensorFlow. Premièrement, ils sélectionnent un ensemble de

Vous êtes confronté à un décalage et à une connexion de données mobile lente sur iPhone ? En règle générale, la puissance de l'Internet cellulaire sur votre téléphone dépend de plusieurs facteurs tels que la région, le type de réseau cellulaire, le type d'itinérance, etc. Vous pouvez prendre certaines mesures pour obtenir une connexion Internet cellulaire plus rapide et plus fiable. Correctif 1 – Forcer le redémarrage de l'iPhone Parfois, le redémarrage forcé de votre appareil réinitialise simplement beaucoup de choses, y compris la connexion cellulaire. Étape 1 – Appuyez simplement une fois sur la touche d’augmentation du volume et relâchez-la. Ensuite, appuyez sur la touche de réduction du volume et relâchez-la à nouveau. Étape 2 – La partie suivante du processus consiste à maintenir le bouton sur le côté droit. Laissez l'iPhone finir de redémarrer. Activez les données cellulaires et vérifiez la vitesse du réseau. Vérifiez à nouveau Correctif 2 – Changer le mode de données Bien que la 5G offre de meilleures vitesses de réseau, elle fonctionne mieux lorsque le signal est plus faible

Je pleure à mort. Le monde construit à la folie de grands modèles. Les données sur Internet ne suffisent pas du tout. Le modèle de formation ressemble à « The Hunger Games », et les chercheurs en IA du monde entier se demandent comment nourrir ces personnes avides de données. Ce problème est particulièrement important dans les tâches multimodales. À une époque où rien ne pouvait être fait, une équipe de start-up du département de l'Université Renmin de Chine a utilisé son propre nouveau modèle pour devenir la première en Chine à faire de « l'auto-alimentation des données générées par le modèle » une réalité. De plus, il s’agit d’une approche à deux volets, du côté compréhension et du côté génération, les deux côtés peuvent générer de nouvelles données multimodales de haute qualité et fournir un retour de données au modèle lui-même. Qu'est-ce qu'un modèle ? Awaker 1.0, un grand modèle multimodal qui vient d'apparaître sur le Forum Zhongguancun. Qui est l'équipe ? Moteur Sophon. Fondé par Gao Yizhao, doctorant à la Hillhouse School of Artificial Intelligence de l’Université Renmin.

Récemment, le milieu militaire a été submergé par la nouvelle : les avions de combat militaires américains peuvent désormais mener des combats aériens entièrement automatiques grâce à l'IA. Oui, tout récemment, l’avion de combat IA de l’armée américaine a été rendu public pour la première fois, dévoilant ainsi son mystère. Le nom complet de ce chasseur est Variable Stability Simulator Test Aircraft (VISTA). Il a été personnellement piloté par le secrétaire de l'US Air Force pour simuler une bataille aérienne en tête-à-tête. Le 2 mai, le secrétaire de l'US Air Force, Frank Kendall, a décollé à bord d'un X-62AVISTA à la base aérienne d'Edwards. Notez que pendant le vol d'une heure, toutes les actions de vol ont été effectuées de manière autonome par l'IA ! Kendall a déclaré : "Au cours des dernières décennies, nous avons réfléchi au potentiel illimité du combat air-air autonome, mais cela a toujours semblé hors de portée." Mais maintenant,

Cette semaine, FigureAI, une entreprise de robotique investie par OpenAI, Microsoft, Bezos et Nvidia, a annoncé avoir reçu près de 700 millions de dollars de financement et prévoit de développer un robot humanoïde capable de marcher de manière autonome au cours de la prochaine année. Et l’Optimus Prime de Tesla a reçu à plusieurs reprises de bonnes nouvelles. Personne ne doute que cette année sera celle de l’explosion des robots humanoïdes. SanctuaryAI, une entreprise canadienne de robotique, a récemment lancé un nouveau robot humanoïde, Phoenix. Les responsables affirment qu’il peut accomplir de nombreuses tâches de manière autonome, à la même vitesse que les humains. Pheonix, le premier robot au monde capable d'accomplir des tâches de manière autonome à la vitesse d'un humain, peut saisir, déplacer et placer avec élégance chaque objet sur ses côtés gauche et droit. Il peut identifier des objets de manière autonome
