Der Funke großer Modelle und verkörperter Intelligenz, Aufruf zur Einreichung von Beiträgen und Herausforderungen für den ICML 2024 MFM-EAI-Workshop gestartet-KI-php.cn

Heim

Der Funke großer Modelle und verkörperter Intelligenz, Aufruf zur Einreichung von Beiträgen und Herausforderungen für den ICML 2024 MFM-EAI-Workshop gestartet

PHPz

Jul 15, 2024 am 11:57 AM

产业具身智能 Multimodales Grundmodell workshop

大模型与具身智能的火花，ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

Workshop-Homepage: https://icml-mfm-eai.github.io/

Übersicht

In den letzten Jahren wurden multimodale Basismodelle (MFM), wie CLIP, ImageBind, DALL・E 3. GPT-4V, Gemini und Sora haben sich zu einem der auffälligsten und sich am schnellsten entwickelnden Bereiche im Bereich der künstlichen Intelligenz entwickelt. Gleichzeitig ist auch die MFM-Open-Source-Community mit repräsentativen Open-Source-Projekten wie LLaVA, LAMM, MiniGPT-4, Stable Diffusion und OpenSora entstanden.

Im Gegensatz zu herkömmlichen Computer-Vision- und Natural-Language-Processing-Modellen erforscht diese Art von MFM aktiv allgemeine Problemlösungen. Durch die Einführung von MFM kann Embodied Intelligence (EAI) verschiedene komplexe Aufgaben in Simulatoren und realen Umgebungen besser bewältigen. Es gibt jedoch immer noch viele Probleme, die im Schnittpunkt von MFM und EAI noch nicht untersucht und gelöst wurden, einschließlich der langfristigen Entscheidungsfindung des Agenten, der Bewegungsplanung des Agenten, der Fähigkeiten zur Generalisierung neuer Umgebungen usw.

Dieser Workshop widmet sich der Erforschung verschiedener Schlüsselthemen, einschließlich, aber nicht beschränkt auf:

Verallgemeinerungsfähigkeit von MFM;
Weltmodell basierend auf generativen Modellen;
Workshop Call for Papers

Dieser Workshop konzentriert sich auf das multimodale Basismodell (MFM), die verkörperte Intelligenz (EAI) und die Schnittstelle der beiden Studien. Zu den Themen dieser Aufforderung zur Einreichung von Beiträgen gehören unter anderem:

Training und Evaluierung von MFM in Szenarien mit offenem Ende

Datenerfassung für das Training verkörperter Agenten

Framework-Designs für MFM-gestützte verkörperte Agenten
Wahrnehmung und Hoch- Ebenenplanung in verkörperten Agenten, unterstützt durch MFM
Entscheidungsfindung und Low-Level-Kontrolle in verkörperten Agenten, unterstützt durch MFM
Bewertung der Fähigkeiten verkörperter Agenten
Generatives Modell als Weltsimulator
Einschränkungen von MFM bei der Stärkung von EAI
Einreichungsregeln

Diese Einreichung unterliegt einer doppelten Blindprüfung über die OpenReview-Plattform. Die Länge des Haupttextes der Einreichung beträgt 4 Seiten, die Länge der Referenzen und ergänzenden Materialien ist unbegrenzt.

Das Einreichungsformat und die Vorlage folgen den ICML 2024-Einreichungsrichtlinien: https://icml.cc/Conferences/2024/CallForPapers

Zugang zur Einreichung: https://openreview.net/group?id=ICML.cc/2024 /Workshop /MFM-EAI

Zeitknoten

Alle Zeitknoten sind [AoE] (Anywhere on Earth).

MFM-EAI Challenge

大模型与具身智能的火花，ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

Drei Strecken (gleichzeitige Teilnahme möglich)

EgoPlan Challenge

EgoPlan Challenge wurde entwickelt, um multimodale große Modelle in realen Szenarien zu bewerten. Targeting Die Fähigkeit, reale Aufgaben im Zusammenhang mit alltäglichen menschlichen Aktivitäten zu planen. Das Modell muss auf der Grundlage der Beschreibung des Aufgabenziels, des Videos aus der Ich-Perspektive und der aktuellen Umgebungsbeobachtung angemessene Maßnahmen zur Erledigung der Aufgabe auswählen.

offizielle Website des Wettbewerbs: https://chenyi99.github.io/ego_plan_challenge/

registration Methode: Füllform [Google Form] (https://docs.google.com/forms/d/e/1faipqlscnwoxjzcwaagnp3jxxxxx3R2TGXBQWAGWAGNEZWAGNZWAGNZWAGNZWAGWAGWAGWAGWAGWAGWAGWAGWAGWAGWAGWAGWAGNZWAGWAGWAGWAGWAGWAGNZWAGWAGWAGNEXXWALLEx /viewform? usp =sf_link)

Anmeldezeit: ab sofort – 1. Juli 2024
Preiseinstellungen:
Gewinner: 800 $
Zweitplatzierter: 600 $
- Innovationspreis: 600 $

Die Composable Generalization Challenge zielt darauf ab, die Aufgabenfähigkeiten und Generalisierungsfähigkeiten des kombinierten Planungs- und Ausführungssystems in offenen Szenarien zu bewerten. Das Modell führt die Aufgabenzerlegung basierend auf der Sprachaufgabenbeschreibung und der multimodalen visuellen Eingabe durch, und der Controller führt die zerlegten Teilaufgaben aus.

Weitere Details werden im Juli bekannt gegeben

World Model Challenge

Die World Model Challenge zielt darauf ab, die Anwendungsleistung von Weltsimulatoren in verkörperten Intelligenzszenarien zu bewerten. Das Modell generiert Videos, die den Aufgabenanweisungen entsprechen, basierend auf verkörperten Aufgabenbeschreibungen und Echtzeit-Szenenbeobachtungen, und bewertet die Qualität der Videogenerierung und die Fähigkeit, den Agenten bei der Erledigung von Aufgaben anzuleiten.

Weitere Einzelheiten werden im Juli bekannt gegeben

Das obige ist der detaillierte Inhalt vonDer Funke großer Modelle und verkörperter Intelligenz, Aufruf zur Einreichung von Beiträgen und Herausforderungen für den ICML 2024 MFM-EAI-Workshop gestartet. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Repo: Wie man Teamkollegen wiederbelebt

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Wie lange dauert es, um Split Fiction zu schlagen?

3 Wochen vor By DDD

R.E.P.O. Dateispeicherspeicherort: Wo ist es und wie schützt sie?

3 Wochen vor By DDD

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7315

Java-Tutorial

1625

CakePHP-Tutorial

1348

Laravel-Tutorial

1260

PHP-Tutorial

1207

Related knowledge

Der DeepMind-Roboter spielt Tischtennis und seine Vor- und Rückhand rutschen in die Luft, wodurch menschliche Anfänger völlig besiegt werden Aug 09, 2024 pm 04:01 PM

Der DeepMind-Roboter spielt Tischtennis und seine Vor- und Rückhand rutschen in die Luft, wodurch menschliche Anfänger völlig besiegt werden

Claude ist auch faul geworden! Netizen: Lernen Sie, sich einen Urlaub zu gönnen Sep 02, 2024 pm 01:56 PM

Claude ist auch faul geworden! Netizen: Lernen Sie, sich einen Urlaub zu gönnen

Die erste mechanische Klaue! Yuanluobao trat auf der Weltroboterkonferenz 2024 auf und stellte den ersten Schachroboter vor, der das Haus betreten kann Aug 21, 2024 pm 07:33 PM

Die erste mechanische Klaue! Yuanluobao trat auf der Weltroboterkonferenz 2024 auf und stellte den ersten Schachroboter vor, der das Haus betreten kann

Auf der Weltroboterkonferenz wurde dieser Haushaltsroboter, der „die Hoffnung auf eine zukünftige Altenpflege' in sich trägt, umzingelt Aug 22, 2024 pm 10:35 PM

Auf der Weltroboterkonferenz wurde dieser Haushaltsroboter, der „die Hoffnung auf eine zukünftige Altenpflege' in sich trägt, umzingelt

Das Team von Li Feifei schlug ReKep vor, um Robotern räumliche Intelligenz zu verleihen und GPT-4o zu integrieren Sep 03, 2024 pm 05:18 PM

Das Team von Li Feifei schlug ReKep vor, um Robotern räumliche Intelligenz zu verleihen und GPT-4o zu integrieren

Bekanntgabe der ACL 2024 Awards: Eines der besten Papers zum Thema Oracle Deciphering von HuaTech, GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

Bekanntgabe der ACL 2024 Awards: Eines der besten Papers zum Thema Oracle Deciphering von HuaTech, GloVe Time Test Award

Hongmeng Smart Travel S9 und die umfassende Einführungskonferenz für neue Produkte wurden gemeinsam mit einer Reihe neuer Blockbuster-Produkte veröffentlicht Aug 08, 2024 am 07:02 AM

Hongmeng Smart Travel S9 und die umfassende Einführungskonferenz für neue Produkte wurden gemeinsam mit einer Reihe neuer Blockbuster-Produkte veröffentlicht

Das erste große UI-Modell in China wird veröffentlicht! Das große Modell von Motiff ist der beste Assistent für Designer und optimiert den UI-Design-Workflow Aug 19, 2024 pm 04:48 PM

Das erste große UI-Modell in China wird veröffentlicht! Das große Modell von Motiff ist der beste Assistent für Designer und optimiert den UI-Design-Workflow

See all articles