


Der Funke großer Modelle und verkörperter Intelligenz, Aufruf zur Einreichung von Beiträgen und Herausforderungen für den ICML 2024 MFM-EAI-Workshop gestartet
Übersicht
In den letzten Jahren wurden multimodale Basismodelle (MFM), wie CLIP, ImageBind, DALL・E 3. GPT-4V, Gemini und Sora haben sich zu einem der auffälligsten und sich am schnellsten entwickelnden Bereiche im Bereich der künstlichen Intelligenz entwickelt. Gleichzeitig ist auch die MFM-Open-Source-Community mit repräsentativen Open-Source-Projekten wie LLaVA, LAMM, MiniGPT-4, Stable Diffusion und OpenSora entstanden.
Im Gegensatz zu herkömmlichen Computer-Vision- und Natural-Language-Processing-Modellen erforscht diese Art von MFM aktiv allgemeine Problemlösungen. Durch die Einführung von MFM kann Embodied Intelligence (EAI) verschiedene komplexe Aufgaben in Simulatoren und realen Umgebungen besser bewältigen. Es gibt jedoch immer noch viele Probleme, die im Schnittpunkt von MFM und EAI noch nicht untersucht und gelöst wurden, einschließlich der langfristigen Entscheidungsfindung des Agenten, der Bewegungsplanung des Agenten, der Fähigkeiten zur Generalisierung neuer Umgebungen usw.
Dieser Workshop widmet sich der Erforschung verschiedener Schlüsselthemen, einschließlich, aber nicht beschränkt auf:
- Verallgemeinerungsfähigkeit von MFM;
- Weltmodell basierend auf generativen Modellen;
- Workshop Call for Papers
Dieser Workshop konzentriert sich auf das multimodale Basismodell (MFM), die verkörperte Intelligenz (EAI) und die Schnittstelle der beiden Studien. Zu den Themen dieser Aufforderung zur Einreichung von Beiträgen gehören unter anderem:
Training und Evaluierung von MFM in Szenarien mit offenem EndeDatenerfassung für das Training verkörperter Agenten- Framework-Designs für MFM-gestützte verkörperte Agenten
- Wahrnehmung und Hoch- Ebenenplanung in verkörperten Agenten, unterstützt durch MFM
- Entscheidungsfindung und Low-Level-Kontrolle in verkörperten Agenten, unterstützt durch MFM
- Bewertung der Fähigkeiten verkörperter Agenten
- Generatives Modell als Weltsimulator
- Einschränkungen von MFM bei der Stärkung von EAI
- Einreichungsregeln
Diese Einreichung unterliegt einer doppelten Blindprüfung über die OpenReview-Plattform. Die Länge des Haupttextes der Einreichung beträgt 4 Seiten, die Länge der Referenzen und ergänzenden Materialien ist unbegrenzt.
Das Einreichungsformat und die Vorlage folgen den ICML 2024-Einreichungsrichtlinien: https://icml.cc/Conferences/2024/CallForPapersZugang zur Einreichung: https://openreview.net/group?id=ICML.cc/2024 /Workshop /MFM-EAI- Zeitknoten
Alle Zeitknoten sind [AoE] (Anywhere on Earth).
MFM-EAI Challenge
EgoPlan Challenge
- EgoPlan Challenge wurde entwickelt, um multimodale große Modelle in realen Szenarien zu bewerten. Targeting Die Fähigkeit, reale Aufgaben im Zusammenhang mit alltäglichen menschlichen Aktivitäten zu planen. Das Modell muss auf der Grundlage der Beschreibung des Aufgabenziels, des Videos aus der Ich-Perspektive und der aktuellen Umgebungsbeobachtung angemessene Maßnahmen zur Erledigung der Aufgabe auswählen.
- Anmeldezeit: ab sofort – 1. Juli 2024
- Preiseinstellungen:
- Gewinner: 800 $Zweitplatzierter: 600 $
- Innovationspreis: 600 $
Composable Generalization Agent Challenge
- Die Composable Generalization Challenge zielt darauf ab, die Aufgabenfähigkeiten und Generalisierungsfähigkeiten des kombinierten Planungs- und Ausführungssystems in offenen Szenarien zu bewerten. Das Modell führt die Aufgabenzerlegung basierend auf der Sprachaufgabenbeschreibung und der multimodalen visuellen Eingabe durch, und der Controller führt die zerlegten Teilaufgaben aus.
- World Model Challenge
- Die World Model Challenge zielt darauf ab, die Anwendungsleistung von Weltsimulatoren in verkörperten Intelligenzszenarien zu bewerten. Das Modell generiert Videos, die den Aufgabenanweisungen entsprechen, basierend auf verkörperten Aufgabenbeschreibungen und Echtzeit-Szenenbeobachtungen, und bewertet die Qualität der Videogenerierung und die Fähigkeit, den Agenten bei der Erledigung von Aufgaben anzuleiten.
Das obige ist der detaillierte Inhalt vonDer Funke großer Modelle und verkörperter Intelligenz, Aufruf zur Einreichung von Beiträgen und Herausforderungen für den ICML 2024 MFM-EAI-Workshop gestartet. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Der DeepMind-Roboter spielt Tischtennis und seine Vor- und Rückhand rutschen in die Luft, wodurch menschliche Anfänger völlig besiegt werden

Claude ist auch faul geworden! Netizen: Lernen Sie, sich einen Urlaub zu gönnen

Die erste mechanische Klaue! Yuanluobao trat auf der Weltroboterkonferenz 2024 auf und stellte den ersten Schachroboter vor, der das Haus betreten kann

Auf der Weltroboterkonferenz wurde dieser Haushaltsroboter, der „die Hoffnung auf eine zukünftige Altenpflege' in sich trägt, umzingelt

Das Team von Li Feifei schlug ReKep vor, um Robotern räumliche Intelligenz zu verleihen und GPT-4o zu integrieren

Bekanntgabe der ACL 2024 Awards: Eines der besten Papers zum Thema Oracle Deciphering von HuaTech, GloVe Time Test Award

Hongmeng Smart Travel S9 und die umfassende Einführungskonferenz für neue Produkte wurden gemeinsam mit einer Reihe neuer Blockbuster-Produkte veröffentlicht

Das erste große UI-Modell in China wird veröffentlicht! Das große Modell von Motiff ist der beste Assistent für Designer und optimiert den UI-Design-Workflow
