Aujourd'hui, Stanford a publié le rapport 2023 AI Index.
Il convient de noter que le rapport Stanford AI Index répertorie les dix meilleures institutions au monde pour le « volume de publication d'articles sur l'IA », et 9 d'entre elles viennent toutes de Chine, et elles ont toutes rattrapé le MIT. .
Il s'agit de : l'Académie chinoise des sciences, l'Université Tsinghua, l'Université de l'Académie chinoise des sciences, l'Université Jiao Tong de Shanghai, l'Université du Zhejiang, l'Institut de technologie de Harbin, l'Université Beihang, l'Université des sciences et technologies électroniques de Chine, l'Université de Pékin, et le MIT.
Le rapport de cette année est principalement divisé en huit sections principales : recherche et développement, performance technologique, éthique technologique de l'intelligence artificielle, économie, éducation, politique et gouvernance, diversité et opinions du public.
Le contenu suivant extrait plusieurs points clés du rapport.
De 2010 à 2021, bien que le rythme de la coopération transfrontalière dans le domaine de l'IA ait ralenti, le nombre de collaborations de recherche sur l'intelligence artificielle entre les États-Unis et la Chine a augmenté d'environ 4 fois, soit 2,5 fois plus que la coopération totale entre la Chine et le Royaume-Uni.
Cependant, de 2020 à 2021, le nombre total de coopération entre les deux pays n'a augmenté que de 2,1%, ce qui représente le taux de croissance annuel le plus faible depuis 2010.
De plus, le nombre total d'articles sur l'IA a plus que doublé depuis 2010. Il est passé de 200 000 articles en 2010 à près de 500 000 articles en 2021 (49 601).
En termes de types d'articles sur l'IA publiés, en 2021, 60 % de tous les articles publiés sur l'IA étaient des articles de revues, 17 % étaient des articles de conférence et 13 % provenaient de référentiels.
Alors que les articles de revues et de référentiels ont augmenté respectivement de 3x et 26,6x au cours des 12 dernières années, le nombre d'articles de conférence a diminué depuis 2019.
La reconnaissance de formes, l'apprentissage automatique et la vision par ordinateur sont toujours des sujets d'actualité dans le domaine de l'intelligence artificielle.
La Chine est toujours en tête en termes de nombre total d'articles dans des revues, conférences et référentiels.
Les États-Unis sont toujours en tête des citations des conférences et des référentiels sur l'IA, mais ces avances s'érodent lentement. Malgré cela, la majorité des grands modèles linguistiques et modèles multimodaux du monde (54 % en 2022) sont produits par des institutions américaines.
La Chine a toujours maintenu sa position de leader dans la publication d'articles dans des revues sur l'IA, avec 39,8% en 2021, suivis de l’Union européenne et du Royaume-Uni (15,1 %), puis des États-Unis (10,0 %).
Depuis 2010, la proportion de citations d'articles de revues chinoises sur l'intelligence artificielle a progressivement augmenté, tandis que l'UE, le Royaume-Uni et les États-Unis ont tous diminué. La Chine, l’Union européenne, le Royaume-Uni et les États-Unis représentent 65,7 % du total des citations mondiales.
Alors, qu’en est-il du statut de publication des articles lors des plus grandes conférences du monde ?
En 2021, la Chine représentait la plus grande part des articles publiés lors des principales conférences mondiales sur l'IA avec 26,15 %, suivie par l'Union européenne et le Royaume-Uni avec 20,29 % et les États-Unis en troisième position avec 17,23 %.
À en juger par le nombre de citations des principaux articles de conférence, bien que la Chine soit très productive, le nombre de citations est inférieur à celui des États-Unis. Le nombre de citations des principaux articles de conférence aux États-Unis est de 23,9 % et celui en Chine de 22,02 %.
On peut voir de côté que la Chine publie le plus grand nombre d'articles, mais la qualité n'est pas aussi élevée que celle des États-Unis.
En termes de soumissions aux référentiels papier d'IA, les États-Unis sont en tête du monde avec 23,48 %. La Chine est le plus bas, 11,87 %.
En 2021, la Chine compte 9 des dix premières institutions au monde en termes de nombre total d'articles publiés. par différentes institutions est comme indiqué ci-dessous. Le MIT se classe au dixième rang et a publié 1 745 articles.
En termes de vision par ordinateur (CV), les dix institutions chinoises figurent parmi les dix meilleures au monde : l'Académie chinoise des sciences, l'Université Jiao Tong de Shanghai, l'Université de l'Académie chinoise des sciences, l'Université Tsinghua. , l'Université du Zhejiang, l'Université d'aéronautique et d'astronautique de Pékin, l'Université de Wuhan, l'Institut de technologie de Pékin, l'Institut de technologie de Harbin et l'Université de Tianjin.
Dans le domaine du traitement du langage naturel (NLP), c'est différent.
Les dix principales institutions/entreprises au monde sont : Académie chinoise des sciences, Université Carnegie Mellon, Microsoft, Université Tsinghua, Université Carnegie Mellon-Australie, Google, Université de Pékin, Université de l'Académie chinoise des sciences, Alibaba, Amazon. .
Les classements dans le domaine de la reconnaissance vocale sont les suivants :
Parmi les systèmes d'apprentissage automatique d'intelligence artificielle importants lancés en 2022, les systèmes linguistiques représentent le plus, avec 23, soit 6 fois le nombre de systèmes multimodaux.
En termes de production de papier, l'industrie est en avance sur le monde universitaire.
Jusqu'en 2014, les modèles les plus importants étaient publiés par le monde universitaire. Depuis, l’industrie s’est redressée. D’ici 2022, 32 modèles importants d’apprentissage automatique verront le jour dans l’industrie, contre seulement 3 dans le monde universitaire.
On peut constater que la construction de systèmes d'intelligence artificielle de pointe nécessite de plus en plus d'énormes quantités de données, de puissance informatique et de ressources financières par rapport aux organisations à but non lucratif et au monde universitaire, et les acteurs de l'industrie ont certainement plus de ressources financières pour y parvenir.
En 2022, les États-Unis ont produit le plus grand nombre de systèmes d'apprentissage automatique importants, avec 16, suivis du Royaume-Uni (8) et de la Chine (3).
De plus, depuis 2002, les États-Unis ont dépassé le Royaume-Uni, l'Union européenne et la Chine en termes de nombre total de systèmes d'apprentissage automatique importants créés
Regardons les pays derrière les chercheurs qui ont créé ces importants systèmes d'IA En termes de répartition, les États-Unis comptent le plus grand nombre de chercheurs, 285, soit plus du double de celui du Royaume-Uni et près de six fois celui de la Chine.
Les grands modèles linguistiques et multimodaux, parfois appelés modèles de base, sont actuellement un type de modèle d'IA émergent et de plus en plus populaire qui fonctionne bien sur de grands des quantités de données peuvent être formées et adaptées à une variété d’applications en aval.
Les modèles linguistiques et multimodaux à grande échelle tels que ChatGPT, DALL-E 2 et MakeA-Video ont démontré des capacités impressionnantes et commencent à être largement déployés dans le monde réel.
En analysant l'affiliation nationale des auteurs de ces modèles, la majorité de ces chercheurs sont issus d'institutions américaines (54,2%).
Le rapport Stanford AI Index présente également le calendrier des versions de langages et de modèles multimodaux à grande échelle.
Les grands modèles linguistiques deviennent de plus en plus gros et plus chers.
Le premier modèle de langage à grande échelle GPT-2 a été publié en 2019, avec 1,5 milliard de paramètres et un coût de formation d'environ 50 000 $ US. Google PaLM est l'un des grands modèles de langage lancés en 2022, avec 540 milliards de paramètres et un coût pouvant atteindre 8 millions de dollars.
En termes de paramètres et de coût de formation, Palm est 360 fois plus grand et 160 fois plus cher que GPT-2.
Il n'y a pas que PalM, les grands langages et les modèles multimodaux dans leur ensemble deviennent de plus en plus gros et plus chers.
Par exemple, le modèle de langage à grande échelle Chinchilla lancé par DeepMind en mai 2022 est estimé à 2,1 millions de dollars, tandis que la formation de BLOOM coûte environ 2,3 millions de dollars.
Au fil du temps, les progrès de GAN dans la génération de visages, la dernière image a été générée par Diffusion-GAN, ce modèle a atteint le dernier SOTA sur STL-10.
L'année dernière, avec la sortie de DALL-E 2 d'OpenAI, Stable Diffusion de Stability AI, Midjourney, Make-AScene de Meta et Imagen de Google, les modèles de génération de texte en image sont progressivement entrés dans la vision du public.
Comme suit, entrez la même invite, "Un panda joue du piano lors d'une chaude nuit parisienne", images générées par trois systèmes de synthèse texte-image d'IA accessibles au public : DALL-E 2, Stable Diffusion et Midjourney.
Parmi tous les modèles de génération de texte en image récemment publiés, Imagen de Google est le plus performant sur le benchmark COCO.
Cette année, les chercheurs de Google qui ont créé Imagen ont également publié un test de conversion texte-image plus difficile, DrawBench, conçu pour défier des modèles texte-image de plus en plus puissants.
De plus, le rapport a également introduit certains biais dans le modèle actuel d'IA générative. Par exemple, en invitant le PDG à DELLE-2, tout le monde semblait adopter une posture confiante avec les bras croisés.
Dans Midjourney, lorsqu'il est invité à générer des "influenceurs", il génère 4 images d'hommes blancs plus âgés.
Pour le contenu complet du rapport, veuillez consulter :
https://aiindex.stanford.edu/wp-content/uploads/2023/04/HAI_AI-Index_Report_2023.pdf
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!