Übersicht
In den letzten Jahren wurden multimodale Basismodelle (MFM), wie CLIP, ImageBind, DALL・E 3. GPT-4V, Gemini und Sora haben sich zu einem der auffälligsten und sich am schnellsten entwickelnden Bereiche im Bereich der künstlichen Intelligenz entwickelt. Gleichzeitig ist auch die MFM-Open-Source-Community mit repräsentativen Open-Source-Projekten wie LLaVA, LAMM, MiniGPT-4, Stable Diffusion und OpenSora entstanden.
Im Gegensatz zu herkömmlichen Computer-Vision- und Natural-Language-Processing-Modellen erforscht diese Art von MFM aktiv allgemeine Problemlösungen. Durch die Einführung von MFM kann Embodied Intelligence (EAI) verschiedene komplexe Aufgaben in Simulatoren und realen Umgebungen besser bewältigen. Es gibt jedoch immer noch viele Probleme, die im Schnittpunkt von MFM und EAI noch nicht untersucht und gelöst wurden, einschließlich der langfristigen Entscheidungsfindung des Agenten, der Bewegungsplanung des Agenten, der Fähigkeiten zur Generalisierung neuer Umgebungen usw.
Dieser Workshop widmet sich der Erforschung verschiedener Schlüsselthemen, einschließlich, aber nicht beschränkt auf:
Dieser Workshop konzentriert sich auf das multimodale Basismodell (MFM), die verkörperte Intelligenz (EAI) und die Schnittstelle der beiden Studien. Zu den Themen dieser Aufforderung zur Einreichung von Beiträgen gehören unter anderem:
Training und Evaluierung von MFM in Szenarien mit offenem EndeDatenerfassung für das Training verkörperter AgentenDiese Einreichung unterliegt einer doppelten Blindprüfung über die OpenReview-Plattform. Die Länge des Haupttextes der Einreichung beträgt 4 Seiten, die Länge der Referenzen und ergänzenden Materialien ist unbegrenzt.
Das Einreichungsformat und die Vorlage folgen den ICML 2024-Einreichungsrichtlinien: https://icml.cc/Conferences/2024/CallForPapersZugang zur Einreichung: https://openreview.net/group?id=ICML.cc/2024 /Workshop /MFM-EAIAlle Zeitknoten sind [AoE] (Anywhere on Earth).
MFM-EAI Challenge
Drei Strecken (gleichzeitige Teilnahme möglich)EgoPlan Challenge
Das obige ist der detaillierte Inhalt vonDer Funke großer Modelle und verkörperter Intelligenz, Aufruf zur Einreichung von Beiträgen und Herausforderungen für den ICML 2024 MFM-EAI-Workshop gestartet. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!