Kürzlich gab die ICLR 2024, die führende Konferenz für künstliche Intelligenz, die Zulassungsergebnisse bekannt. Die Ant Group hatte auf dieser Konferenz 11 Beiträge angenommen, von denen 1 als mündlicher Bericht bewertet wurde, 3 als Fokusberichte ausgewählt wurden und die anderen 7 Posterpräsentationen waren. Die Fortschritte der Ant Group in der akademischen Gemeinschaft der künstlichen Intelligenz haben viel Aufmerksamkeit erregt.
(Bild: „Multi-granularity Noise Association Learning in Long Videos“ der Ant Group wurde als mündlicher Vortrag aufgenommen)
In diesem Jahr gingen beim ICLR-Organisationskomitee 7262 Beiträge ein, mit einer Annahmequote von etwa 31 % . Gemäß den Annahmeergebnissen werden 1,2 % der Arbeiten als mündliche Arbeiten angenommen und diese Autoren erhalten die Möglichkeit einer 10-minütigen mündlichen Präsentation. Weitere 5 % der Beiträge werden als Spotlight-Beiträge akzeptiert, und diese Autoren erhalten 4 Minuten Spotlight-Zeit. Die restlichen Vorträge werden im Posterformat präsentiert. Insgesamt haben mündliche Vorträge die höchste Bedeutung, gefolgt von Spotlight-Vorträgen und Poster-Vorträgen die geringste Bedeutung.
Jedes Jahr wird eine beträchtliche Anzahl mündlicher ICLR-Aufträge als „ICLR Best Papers“ bewertet, was auch bedeutet, dass sie die Forschungsrichtung für das neue Jahr vorgeben. In diesem Jahr wählte das ICLR 85 mündliche Arbeiten aus, darunter „Multi-granularity Correspondence Learning from Noisy Instructional Videos“ der Ant Group (Multi-granularity Correspondence Learning from Noisy Instructional Videos). In diesem Artikel wird eine Lernmethode unter Verwendung verrauschter Lehrvideos vorgeschlagen, die die Leistung und Robustheit des Modells durch zugehöriges Lernen auf mehreren Granularitäten verbessert. Diese Forschung ist von großer Bedeutung für die Lösung der in der realen Welt bestehenden Probleme von Rauschen und Unsicherheit und liefert neue Ideen für die weitere Entwicklung im Bereich des Videoverständnisses.
Kurzvideos sind zur wichtigsten Unterhaltungsform im täglichen Leben der Menschen geworden, und multimodale Technologie ist eine beliebte Forschungsrichtung im aktuellen KI-Bereich. Aufgrund des hohen Rechenressourcenaufwands konzentrieren sich bestehende Videoarbeiten jedoch hauptsächlich auf das Verständnis von Segmenten, während die zeitlichen Abhängigkeiten in langen Videos ignoriert werden. Um dieses Problem zu lösen, wandelt dieser Artikel das Lernen langer Videos in eine Assoziationsausrichtung zwischen kurzen Videoclips um. Mit Blick auf das Problem der Rauschkorrelation zwischen Video und Text schlug die Studie ein einheitliches optimales Übertragungsausrichtungsschema vor. Dieses Schema verbesserte das Verständnis langer Videos erheblich und sparte auch Zeit. Durch diese Forschung können wir lange Videos besser verstehen und den Zusammenhang zwischen Video und Text genauer und effizienter verarbeiten.
Diese Lösung ist sehr vielseitig und die vorgeschlagene Methode zur Verarbeitung der Rauschkorrelation eignet sich für das Lernen anderer Modelle vor dem Training, die eine Inhaltsausrichtung erfordern.
Spotlight hat drei Artikel beigefügt, nämlich „iTransformer: Inverted Transformers Are Effective for Time Series Forecasting“ (iTransformer: Inverted Transformers are Effective for Time Series Forecasting), „Enhanced Face Recognition using Intra-class Incoherence Constraint“ (Utilizing class Face Erkennungstechnologie, die durch interne Inkonsistenzbeschränkungen erweitert wird) und „Finite-State Autoregressive Entropy Coding for Efficient Learned Lossless Compression“ (ein lernbares autoregressives Modell basierend auf Nachschlagetabellen für effiziente verlustfreie Komprimierungsalgorithmen). Im ersten Artikel wird eine neue Methode zur Zeitreihenprognose vorgestellt, die durch Aufbrechen der herkömmlichen Modellstruktur umfassende führende Ergebnisse bei komplexen Zeitreihenprognoseaufgaben erzielt. Diese Forschung hat wichtige Auswirkungen auf die Verbesserung der Genauigkeit und Effizienz der Zeitreihenvorhersage. Im zweiten Artikel wird eine neue Methode zur Verbesserung der Genauigkeit der Gesichtserkennung vorgestellt. Diese Methode nutzt Inkonsistenzbeschränkungen innerhalb der Klasse, um die Gesichtserkennungstechnologie weiter zu optimieren. Diese Forschung ist von großer Bedeutung für die Verbesserung der Leistung und Genauigkeit von Gesichtserkennungssystemen. Der dritte Artikel schlägt ein lernbares autoregressives Modell vor, das auf der Grundlage von Nachschlagetabellen für eine effiziente verlustfreie Komprimierung implementiert wird. Diese Forschung realisiert einen verlustfreien Komprimierungsalgorithmus mit hoher Komprimierungsrate und hoher Durchsatzrate, der einen wichtigen Anwendungswert für die Datenkomprimierung und -speicherung hat. Die Veröffentlichung dieser drei Artikel hat zu wichtigen Durchbrüchen und Fortschritten in ihren jeweiligen Bereichen geführt und eine starke Unterstützung für Forschung und Anwendungen in verwandten Bereichen bereitgestellt. Ihr Aufkommen hat die Forschungsergebnisse der Wissenschaft bereichert und neue Möglichkeiten für die Entwicklung verwandter Bereiche eröffnet.
Seit 2017 ist die Zahl der beim ICLR jedes Jahr eingegangenen Beiträge um 30 % gestiegen, und auch die beiden führenden Konferenzen für künstliche Intelligenz, NeurIPS und ICML, weisen schnelle Wachstumstrends auf. Auf der jüngsten NeurIPS-Konferenz wurden insgesamt 20 Beiträge der Ant Group vorgestellt. Diese Beiträge behandeln aktuelle Themen in verschiedenen Bereichen der künstlichen Intelligenz und des maschinellen Lernens wie Computer Vision, Verarbeitung natürlicher Sprache, graphische neuronale Netze und Bildverarbeitung. Dieser Erfolg ist ein weiterer Beweis für die herausragende Forschungsstärke und Innovationsfähigkeit der Ant Group im Bereich der künstlichen Intelligenz.
(Bild: Die jährliche Anzahl der Beiträge des ICLR seit seiner Gründung im Jahr 2013. Ab 2017 ist die Anzahl der Beiträge gestiegen. )
ICLR wurde in den letzten Jahren von der Branche gut angenommen, vor allem aufgrund seines Open-Review-Systems. Alle eingereichten Arbeiten akzeptieren Bewertungen und Fragen von allen Kollegen, und jeder Wissenschaftler kann Arbeiten anonym oder unter seinem richtigen Namen bewerten. Nach Abschluss der öffentlichen Begutachtung kann der Autor des Papiers das Papier auch anpassen und modifizieren.
Es wird davon ausgegangen, dass die Ant Group in den letzten fünf Jahren fast 500 Artikel in führenden internationalen Fachzeitschriften und wissenschaftlichen Konferenzen veröffentlicht hat, darunter mehr als 300 Artikel im Bereich KI. Die Ant Group investiert weiterhin in Technologie im Bereich der künstlichen Intelligenz und hat auf der Grundlage der Anforderungen groß angelegter Geschäftsszenarien technische Bereiche entwickelt, darunter große Modelle, Wissensgraphen, Betriebsoptimierung, Graph-Learning und vertrauenswürdige KI.
Das obige ist der detaillierte Inhalt vonDie 11 Beiträge der Ant Group wurden erfolgreich für die ICLR 2024, die wichtigste internationale KI-Konferenz, ausgewählt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!