Récemment, l'ICLR 2024, la plus grande conférence sur l'intelligence artificielle, a annoncé les résultats d'admission. Ant Group a accepté 11 articles lors de cette conférence, dont 1 a été évalué comme rapport oral, 3 ont été sélectionnés comme rapports thématiques et les 7 autres étaient des présentations par affiches. Les progrès d’Ant Group dans la communauté universitaire de l’intelligence artificielle ont attiré beaucoup d’attention.
(Photo : "L'apprentissage par association de bruit multi-granularité dans de longues vidéos" d'Ant Group a été inclus comme article oral)
Cette année, le comité d'organisation de l'ICLR a reçu 7 262 soumissions d'articles, et le taux d'acceptation est d'environ 31 % . Selon les résultats d'acceptation, 1,2 % des articles seront acceptés comme articles oraux, et ces auteurs bénéficieront d'une opportunité de discours oral de 10 minutes. 5 % supplémentaires des articles sont acceptés comme articles Spotlight, et ces auteurs disposeront de 4 minutes de temps de mise en lumière. Les communications restantes seront présentées sous forme d'affiches. Dans l'ensemble, les articles oraux ont la plus haute importance, suivis par les articles Spotlight et les articles par affiches ont la plus faible importance.
Chaque année, un nombre considérable d'articles oraux de l'ICLR seront classés « Meilleurs articles de l'ICLR », ce qui signifie également qu'ils guident l'orientation de la recherche pour la nouvelle année. Cette année, l'ICLR a sélectionné 85 articles oraux, dont « Apprentissage par correspondance multigranulaire à partir de vidéos pédagogiques bruyantes » d'Ant Group (Apprentissage par correspondance multigranulaire à partir de vidéos pédagogiques bruyantes). Cet article propose une méthode d'apprentissage utilisant des vidéos pédagogiques bruitées, qui améliore les performances et la robustesse du modèle grâce à un apprentissage associé à plusieurs granularités. Cette recherche revêt une grande importance pour résoudre les problèmes de bruit et d’incertitude qui existent dans le monde réel et fournit de nouvelles idées pour un développement ultérieur dans le domaine de la compréhension vidéo.
Les courtes vidéos sont devenues la principale forme de divertissement dans la vie quotidienne des gens, et la technologie multimodale est une direction de recherche populaire dans le domaine actuel de l’IA. Cependant, en raison de la surcharge de ressources informatiques, les travaux vidéo existants se concentrent principalement sur la compréhension des segments, tout en ignorant les dépendances temporelles dans les vidéos longues. Pour résoudre ce problème, cet article transforme l'apprentissage vidéo long en alignement d'associations entre de courts clips vidéo. Visant le problème de la corrélation du bruit entre la vidéo et le texte, l'étude a proposé un schéma d'alignement de transmission optimal unifié. Ce schéma a considérablement amélioré la compréhension des longues vidéos et a également permis de gagner du temps. Grâce à cette recherche, nous pouvons mieux comprendre les vidéos longues et être plus précis et plus efficaces dans le traitement de l’association entre vidéo et texte.
Cette solution est très polyvalente et la méthode de traitement de corrélation de bruit proposée convient à d'autres modèles d'apprentissage pré-formation qui nécessitent un alignement de contenu.
Spotlight a inclus trois articles, à savoir « iTransformer : les transformateurs inversés sont efficaces pour la prévision des séries chronologiques » (iTransformer : les transformateurs inversés sont plus efficaces pour la prévision des séries chronologiques), « Reconnaissance faciale améliorée à l'aide de la contrainte d'incohérence intra-classe » (Utilisation de la reconnaissance faciale de classe technologie de reconnaissance améliorée par des contraintes d'incohérence internes) et « Codage d'entropie autorégressif à états finis pour une compression efficace sans perte apprise » (un modèle autorégressif apprenable basé sur des tables de recherche pour des algorithmes de compression efficaces sans perte). Le premier article présente une nouvelle méthode de prévision de séries chronologiques, qui permet d'obtenir des résultats complets et de premier plan dans des tâches complexes de prévision de séries chronologiques en brisant la structure de modèle conventionnelle. Cette recherche a des implications importantes pour améliorer la précision et l’efficacité de la prévision des séries chronologiques. Le deuxième article présente une nouvelle méthode pour améliorer la précision de la reconnaissance faciale. Cette méthode utilise des contraintes d'incohérence intra-classe pour optimiser davantage la technologie de reconnaissance faciale. Cette recherche revêt une grande importance pour améliorer les performances et la précision des systèmes de reconnaissance faciale. Le troisième article propose un modèle autorégressif apprenable implémenté sur la base de tables de recherche pour une compression efficace sans perte. Cette recherche réalise un algorithme de compression sans perte avec un taux de compression et un débit élevés, qui présente une valeur d'application importante pour la compression et le stockage des données. La publication de ces trois articles a permis des percées et des progrès importants dans leurs domaines respectifs, apportant un soutien solide à la recherche et aux applications dans des domaines connexes. Leur émergence a enrichi les résultats de recherche universitaire et a apporté de nouvelles possibilités de développement de domaines connexes.
Depuis 2017, le nombre d'articles reçus par l'ICLR chaque année a augmenté de 30 %, et les deux principales conférences sur l'intelligence artificielle, NeurIPS et ICML, ont également montré des tendances de croissance rapides. Lors de la récente conférence NeurIPS, un total de 20 articles d'Ant Group ont été inclus. Ces articles couvrent des sujets de pointe en matière de vision par ordinateur, de traitement du langage naturel, de réseaux neuronaux graphiques, de traitement d'images et d'autres domaines de l'intelligence artificielle et de l'apprentissage automatique. Cette réalisation prouve une fois de plus la force de recherche exceptionnelle et les capacités d’innovation d’Ant Group dans le domaine de l’intelligence artificielle.
(Photo : nombre annuel de journaux de l'ICLR depuis sa création en 2013. À partir de 2017, le nombre de journaux a augmenté. )
ICLR a été bien accueilli par l'industrie ces dernières années, principalement grâce à son système d'évaluation Open Review. Tous les articles soumis seront évalués et interrogés par tous les pairs. Tout chercheur peut évaluer l'article de manière anonyme ou sous son vrai nom. Une fois l’examen public terminé, l’auteur de l’article peut également ajuster et modifier l’article.
Il est entendu qu'au cours des cinq dernières années, Ant Group a publié près de 500 articles dans des revues universitaires et conférences universitaires internationales de premier plan, dont plus de 300 articles dans le domaine de l'IA. Ant Group continue d'investir dans la technologie dans le domaine de l'intelligence artificielle. Sur la base des besoins des scénarios commerciaux à grande échelle, il a défini des domaines techniques comprenant les grands modèles, les graphiques de connaissances, l'optimisation des opérations, l'apprentissage des graphiques et l'IA de confiance.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!