Heim Technologie-Peripheriegeräte KI Die 11 Beiträge der Ant Group wurden erfolgreich für die ICLR 2024, die wichtigste internationale KI-Konferenz, ausgewählt

Die 11 Beiträge der Ant Group wurden erfolgreich für die ICLR 2024, die wichtigste internationale KI-Konferenz, ausgewählt

Jan 24, 2024 pm 11:54 PM
入门 iclr Rauschkorrelation multimodale Technologie Relevantes Lernen

Kürzlich gab die ICLR 2024, die führende Konferenz für künstliche Intelligenz, die Zulassungsergebnisse bekannt. Die Ant Group hatte auf dieser Konferenz 11 Beiträge angenommen, von denen 1 als mündlicher Bericht bewertet wurde, 3 als Fokusberichte ausgewählt wurden und die anderen 7 Posterpräsentationen waren. Die Fortschritte der Ant Group in der akademischen Gemeinschaft der künstlichen Intelligenz haben viel Aufmerksamkeit erregt.

AI国际顶会ICLR 2024结果揭晓,蚂蚁集团11篇论文入选

(Bild: „Multi-granularity Noise Association Learning in Long Videos“ der Ant Group wurde als mündlicher Vortrag aufgenommen)

In diesem Jahr gingen beim ICLR-Organisationskomitee 7262 Beiträge ein, mit einer Annahmequote von etwa 31 % . Gemäß den Annahmeergebnissen werden 1,2 % der Arbeiten als mündliche Arbeiten angenommen und diese Autoren erhalten die Möglichkeit einer 10-minütigen mündlichen Präsentation. Weitere 5 % der Beiträge werden als Spotlight-Beiträge akzeptiert, und diese Autoren erhalten 4 Minuten Spotlight-Zeit. Die restlichen Vorträge werden im Posterformat präsentiert. Insgesamt haben mündliche Vorträge die höchste Bedeutung, gefolgt von Spotlight-Vorträgen und Poster-Vorträgen die geringste Bedeutung.

Jedes Jahr wird eine beträchtliche Anzahl mündlicher ICLR-Aufträge als „ICLR Best Papers“ bewertet, was auch bedeutet, dass sie die Forschungsrichtung für das neue Jahr vorgeben. In diesem Jahr wählte das ICLR 85 mündliche Arbeiten aus, darunter „Multi-granularity Correspondence Learning from Noisy Instructional Videos“ der Ant Group (Multi-granularity Correspondence Learning from Noisy Instructional Videos). In diesem Artikel wird eine Lernmethode unter Verwendung verrauschter Lehrvideos vorgeschlagen, die die Leistung und Robustheit des Modells durch zugehöriges Lernen auf mehreren Granularitäten verbessert. Diese Forschung ist von großer Bedeutung für die Lösung der in der realen Welt bestehenden Probleme von Rauschen und Unsicherheit und liefert neue Ideen für die weitere Entwicklung im Bereich des Videoverständnisses.

Kurzvideos sind zur wichtigsten Unterhaltungsform im täglichen Leben der Menschen geworden, und multimodale Technologie ist eine beliebte Forschungsrichtung im aktuellen KI-Bereich. Aufgrund des hohen Rechenressourcenaufwands konzentrieren sich bestehende Videoarbeiten jedoch hauptsächlich auf das Verständnis von Segmenten, während die zeitlichen Abhängigkeiten in langen Videos ignoriert werden. Um dieses Problem zu lösen, wandelt dieser Artikel das Lernen langer Videos in eine Assoziationsausrichtung zwischen kurzen Videoclips um. Mit Blick auf das Problem der Rauschkorrelation zwischen Video und Text schlug die Studie ein einheitliches optimales Übertragungsausrichtungsschema vor. Dieses Schema verbesserte das Verständnis langer Videos erheblich und sparte auch Zeit. Durch diese Forschung können wir lange Videos besser verstehen und den Zusammenhang zwischen Video und Text genauer und effizienter verarbeiten.

Diese Lösung ist sehr vielseitig und die vorgeschlagene Methode zur Verarbeitung der Rauschkorrelation eignet sich für das Lernen anderer Modelle vor dem Training, die eine Inhaltsausrichtung erfordern.

Spotlight hat drei Artikel beigefügt, nämlich „iTransformer: Inverted Transformers Are Effective for Time Series Forecasting“ (iTransformer: Inverted Transformers are Effective for Time Series Forecasting), „Enhanced Face Recognition using Intra-class Incoherence Constraint“ (Utilizing class Face Erkennungstechnologie, die durch interne Inkonsistenzbeschränkungen erweitert wird) und „Finite-State Autoregressive Entropy Coding for Efficient Learned Lossless Compression“ (ein lernbares autoregressives Modell basierend auf Nachschlagetabellen für effiziente verlustfreie Komprimierungsalgorithmen). Im ersten Artikel wird eine neue Methode zur Zeitreihenprognose vorgestellt, die durch Aufbrechen der herkömmlichen Modellstruktur umfassende führende Ergebnisse bei komplexen Zeitreihenprognoseaufgaben erzielt. Diese Forschung hat wichtige Auswirkungen auf die Verbesserung der Genauigkeit und Effizienz der Zeitreihenvorhersage. Im zweiten Artikel wird eine neue Methode zur Verbesserung der Genauigkeit der Gesichtserkennung vorgestellt. Diese Methode nutzt Inkonsistenzbeschränkungen innerhalb der Klasse, um die Gesichtserkennungstechnologie weiter zu optimieren. Diese Forschung ist von großer Bedeutung für die Verbesserung der Leistung und Genauigkeit von Gesichtserkennungssystemen. Der dritte Artikel schlägt ein lernbares autoregressives Modell vor, das auf der Grundlage von Nachschlagetabellen für eine effiziente verlustfreie Komprimierung implementiert wird. Diese Forschung realisiert einen verlustfreien Komprimierungsalgorithmus mit hoher Komprimierungsrate und hoher Durchsatzrate, der einen wichtigen Anwendungswert für die Datenkomprimierung und -speicherung hat. Die Veröffentlichung dieser drei Artikel hat zu wichtigen Durchbrüchen und Fortschritten in ihren jeweiligen Bereichen geführt und eine starke Unterstützung für Forschung und Anwendungen in verwandten Bereichen bereitgestellt. Ihr Aufkommen hat die Forschungsergebnisse der Wissenschaft bereichert und neue Möglichkeiten für die Entwicklung verwandter Bereiche eröffnet.

Seit 2017 ist die Zahl der beim ICLR jedes Jahr eingegangenen Beiträge um 30 % gestiegen, und auch die beiden führenden Konferenzen für künstliche Intelligenz, NeurIPS und ICML, weisen schnelle Wachstumstrends auf. Auf der jüngsten NeurIPS-Konferenz wurden insgesamt 20 Beiträge der Ant Group vorgestellt. Diese Beiträge behandeln aktuelle Themen in verschiedenen Bereichen der künstlichen Intelligenz und des maschinellen Lernens wie Computer Vision, Verarbeitung natürlicher Sprache, graphische neuronale Netze und Bildverarbeitung. Dieser Erfolg ist ein weiterer Beweis für die herausragende Forschungsstärke und Innovationsfähigkeit der Ant Group im Bereich der künstlichen Intelligenz.

AI国际顶会ICLR 2024结果揭晓,蚂蚁集团11篇论文入选

(Bild: Die jährliche Anzahl der Beiträge des ICLR seit seiner Gründung im Jahr 2013. Ab 2017 ist die Anzahl der Beiträge gestiegen. )

ICLR wurde in den letzten Jahren von der Branche gut angenommen, vor allem aufgrund seines Open-Review-Systems. Alle eingereichten Arbeiten akzeptieren Bewertungen und Fragen von allen Kollegen, und jeder Wissenschaftler kann Arbeiten anonym oder unter seinem richtigen Namen bewerten. Nach Abschluss der öffentlichen Begutachtung kann der Autor des Papiers das Papier auch anpassen und modifizieren.

Es wird davon ausgegangen, dass die Ant Group in den letzten fünf Jahren fast 500 Artikel in führenden internationalen Fachzeitschriften und wissenschaftlichen Konferenzen veröffentlicht hat, darunter mehr als 300 Artikel im Bereich KI. Die Ant Group investiert weiterhin in Technologie im Bereich der künstlichen Intelligenz und hat auf der Grundlage der Anforderungen groß angelegter Geschäftsszenarien technische Bereiche entwickelt, darunter große Modelle, Wissensgraphen, Betriebsoptimierung, Graph-Learning und vertrauenswürdige KI.

Das obige ist der detaillierte Inhalt vonDie 11 Beiträge der Ant Group wurden erfolgreich für die ICLR 2024, die wichtigste internationale KI-Konferenz, ausgewählt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Repo: Wie man Teamkollegen wiederbelebt
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Ein Diffusionsmodell-Tutorial, das Ihre Zeit wert ist, von der Purdue University Ein Diffusionsmodell-Tutorial, das Ihre Zeit wert ist, von der Purdue University Apr 07, 2024 am 09:01 AM

Diffusion kann nicht nur besser imitieren, sondern auch „erschaffen“. Das Diffusionsmodell (DiffusionModel) ist ein Bilderzeugungsmodell. Im Vergleich zu bekannten Algorithmen wie GAN und VAE im Bereich der KI verfolgt das Diffusionsmodell einen anderen Ansatz. Seine Hauptidee besteht darin, dem Bild zunächst Rauschen hinzuzufügen und es dann schrittweise zu entrauschen. Das Entrauschen und Wiederherstellen des Originalbilds ist der Kernbestandteil des Algorithmus. Der endgültige Algorithmus ist in der Lage, aus einem zufälligen verrauschten Bild ein Bild zu erzeugen. In den letzten Jahren hat das phänomenale Wachstum der generativen KI viele spannende Anwendungen in der Text-zu-Bild-Generierung, Videogenerierung und mehr ermöglicht. Das Grundprinzip dieser generativen Werkzeuge ist das Konzept der Diffusion, ein spezieller Sampling-Mechanismus, der die Einschränkungen bisheriger Methoden überwindet.

Generieren Sie PPT mit einem Klick! Kimi: Lassen Sie zuerst die „PPT-Wanderarbeiter' populär werden Generieren Sie PPT mit einem Klick! Kimi: Lassen Sie zuerst die „PPT-Wanderarbeiter' populär werden Aug 01, 2024 pm 03:28 PM

Kimi: In nur einem Satz, in nur zehn Sekunden ist ein PPT fertig. PPT ist so nervig! Um ein Meeting abzuhalten, benötigen Sie einen PPT; um einen wöchentlichen Bericht zu schreiben, müssen Sie einen PPT vorlegen, auch wenn Sie jemanden des Betrugs beschuldigen PPT. Das College ähnelt eher dem Studium eines PPT-Hauptfachs. Man schaut sich PPT im Unterricht an und macht PPT nach dem Unterricht. Als Dennis Austin vor 37 Jahren PPT erfand, hatte er vielleicht nicht damit gerechnet, dass PPT eines Tages so weit verbreitet sein würde. Wenn wir über unsere harte Erfahrung bei der Erstellung von PPT sprechen, treiben uns Tränen in die Augen. „Es dauerte drei Monate, ein PPT mit mehr als 20 Seiten zu erstellen, und ich habe es Dutzende Male überarbeitet. Als ich das PPT sah, musste ich mich übergeben.“ war PPT.“ Wenn Sie ein spontanes Meeting haben, sollten Sie es tun

Alle CVPR 2024-Auszeichnungen bekannt gegeben! Fast 10.000 Menschen nahmen offline an der Konferenz teil und ein chinesischer Forscher von Google gewann den Preis für den besten Beitrag Alle CVPR 2024-Auszeichnungen bekannt gegeben! Fast 10.000 Menschen nahmen offline an der Konferenz teil und ein chinesischer Forscher von Google gewann den Preis für den besten Beitrag Jun 20, 2024 pm 05:43 PM

Am frühen Morgen des 20. Juni (Pekinger Zeit) gab CVPR2024, die wichtigste internationale Computer-Vision-Konferenz in Seattle, offiziell die besten Beiträge und andere Auszeichnungen bekannt. In diesem Jahr wurden insgesamt 10 Arbeiten ausgezeichnet, darunter zwei beste Arbeiten und zwei beste studentische Arbeiten. Darüber hinaus gab es zwei Nominierungen für die beste Arbeit und vier Nominierungen für die beste studentische Arbeit. Die Top-Konferenz im Bereich Computer Vision (CV) ist die CVPR, die jedes Jahr zahlreiche Forschungseinrichtungen und Universitäten anzieht. Laut Statistik wurden in diesem Jahr insgesamt 11.532 Arbeiten eingereicht, von denen 2.719 angenommen wurden, was einer Annahmequote von 23,6 % entspricht. Laut der statistischen Analyse der CVPR2024-Daten des Georgia Institute of Technology befassen sich die meisten Arbeiten aus Sicht der Forschungsthemen mit der Bild- und Videosynthese und -generierung (Imageandvideosyn

Fünf Programmiersoftware für den Einstieg in das Erlernen der C-Sprache Fünf Programmiersoftware für den Einstieg in das Erlernen der C-Sprache Feb 19, 2024 pm 04:51 PM

Als weit verbreitete Programmiersprache ist die C-Sprache eine der grundlegenden Sprachen, die für diejenigen erlernt werden müssen, die sich mit Computerprogrammierung befassen möchten. Für Anfänger kann das Erlernen einer neuen Programmiersprache jedoch etwas schwierig sein, insbesondere aufgrund des Mangels an entsprechenden Lernwerkzeugen und Lehrmaterialien. In diesem Artikel werde ich fünf Programmiersoftware vorstellen, die Anfängern den Einstieg in die C-Sprache erleichtert und Ihnen einen schnellen Einstieg ermöglicht. Die erste Programmiersoftware war Code::Blocks. Code::Blocks ist eine kostenlose integrierte Open-Source-Entwicklungsumgebung (IDE) für

PyCharm Community Edition-Installationsanleitung: Beherrschen Sie schnell alle Schritte PyCharm Community Edition-Installationsanleitung: Beherrschen Sie schnell alle Schritte Jan 27, 2024 am 09:10 AM

Schnellstart mit PyCharm Community Edition: Detailliertes Installations-Tutorial, vollständige Analyse Einführung: PyCharm ist eine leistungsstarke integrierte Python-Entwicklungsumgebung (IDE), die einen umfassenden Satz an Tools bereitstellt, mit denen Entwickler Python-Code effizienter schreiben können. In diesem Artikel wird die Installation der PyCharm Community Edition im Detail vorgestellt und spezifische Codebeispiele bereitgestellt, um Anfängern den schnellen Einstieg zu erleichtern. Schritt 1: PyCharm Community Edition herunterladen und installieren Um PyCharm verwenden zu können, müssen Sie es zunächst von der offiziellen Website herunterladen

Eine Pflichtlektüre für technische Anfänger: Analyse der Schwierigkeitsgrade von C-Sprache und Python Eine Pflichtlektüre für technische Anfänger: Analyse der Schwierigkeitsgrade von C-Sprache und Python Mar 22, 2024 am 10:21 AM

Titel: Ein Muss für technische Anfänger: Schwierigkeitsanalyse der C-Sprache und Python, die spezifische Codebeispiele erfordert. Im heutigen digitalen Zeitalter ist Programmiertechnologie zu einer immer wichtigeren Fähigkeit geworden. Ob Sie in Bereichen wie Softwareentwicklung, Datenanalyse, künstliche Intelligenz arbeiten oder einfach nur aus Interesse Programmieren lernen möchten, die Wahl einer geeigneten Programmiersprache ist der erste Schritt. Unter vielen Programmiersprachen sind C-Sprache und Python zwei weit verbreitete Programmiersprachen, jede mit ihren eigenen Merkmalen. In diesem Artikel werden die Schwierigkeitsgrade der C-Sprache und von Python analysiert

Von Bare-Metal bis hin zu einem großen Modell mit 70 Milliarden Parametern finden Sie hier ein Tutorial und gebrauchsfertige Skripte Von Bare-Metal bis hin zu einem großen Modell mit 70 Milliarden Parametern finden Sie hier ein Tutorial und gebrauchsfertige Skripte Jul 24, 2024 pm 08:13 PM

Wir wissen, dass LLM auf großen Computerclustern unter Verwendung umfangreicher Daten trainiert wird. Auf dieser Website wurden viele Methoden und Technologien vorgestellt, die den LLM-Trainingsprozess unterstützen und verbessern. Was wir heute teilen möchten, ist ein Artikel, der tief in die zugrunde liegende Technologie eintaucht und vorstellt, wie man einen Haufen „Bare-Metals“ ohne Betriebssystem in einen Computercluster für das LLM-Training verwandelt. Dieser Artikel stammt von Imbue, einem KI-Startup, das allgemeine Intelligenz durch das Verständnis der Denkweise von Maschinen erreichen möchte. Natürlich ist es kein einfacher Prozess, einen Haufen „Bare Metal“ ohne Betriebssystem in einen Computercluster für das Training von LLM zu verwandeln, aber Imbue hat schließlich erfolgreich ein LLM mit 70 Milliarden Parametern trainiert der Prozess akkumuliert

Der leitende NVIDIA-Architekt zählt die 12 Schwachstellen von RAG auf und vermittelt Lösungen Der leitende NVIDIA-Architekt zählt die 12 Schwachstellen von RAG auf und vermittelt Lösungen Jul 11, 2024 pm 01:53 PM

Retrieval-Augmented Generation (RAG) ist eine Technik, die Retrieval nutzt, um Sprachmodelle zu verbessern. Bevor ein Sprachmodell eine Antwort generiert, ruft es insbesondere relevante Informationen aus einer umfangreichen Dokumentendatenbank ab und verwendet diese Informationen dann zur Steuerung des Generierungsprozesses. Diese Technologie kann die Genauigkeit und Relevanz von Inhalten erheblich verbessern, das Problem der Halluzinationen wirksam lindern, die Geschwindigkeit der Wissensaktualisierung erhöhen und die Nachverfolgbarkeit der Inhaltsgenerierung verbessern. RAG ist zweifellos einer der spannendsten Bereiche der Forschung im Bereich der künstlichen Intelligenz. Weitere Informationen zu RAG finden Sie im Kolumnenartikel auf dieser Website „Was sind die neuen Entwicklungen bei RAG, das sich darauf spezialisiert hat, die Mängel großer Modelle auszugleichen?“ Diese Rezension erklärt es deutlich. Aber RAG ist nicht perfekt und Benutzer stoßen bei der Verwendung oft auf einige „Problempunkte“. Kürzlich die fortschrittliche generative KI-Lösung von NVIDIA

See all articles