Overview
최근에는 CLIP, ImageBind, DALL・E 등 다중 모드 기본 모델(MFM)이 등장하고 있습니다. 3. GPT-4V, Gemini 및 Sora는 인공 지능 분야에서 가장 눈길을 끌고 빠르게 발전하는 분야 중 하나가 되었습니다. 동시에 LLaVA, LAMM, MiniGPT-4, Stable Diffusion, OpenSora 등 대표적인 오픈소스 프로젝트를 통해 MFM 오픈소스 커뮤니티도 등장했습니다.
기존 컴퓨터 비전 및 자연어 처리 모델과 달리 이 유형의 MFM은 일반적인 문제 해결 방법을 적극적으로 탐색합니다. MFM을 도입함으로써 EAI(Embodied Intelligence)는 시뮬레이터와 실제 환경에서 다양하고 복잡한 작업을 더 잘 처리할 수 있습니다. 하지만 에이전트의 장기적인 의사결정, 에이전트 동작 계획, 새로운 환경 일반화 역량 등 MFM과 EAI의 교차점에는 아직 탐구하고 해결하지 못한 문제가 많다.
이 워크숍은 다음을 포함하되 이에 국한되지 않는 몇 가지 주요 문제를 탐구하는 데 전념할 것입니다:
개방형 시나리오에서 MFM 교육 및 평가
체화된 에이전트 교육을 위한 데이터 수집
제출 형식과 템플릿은 ICML 2024 제출 지침을 따릅니다: https://icml.cc/Conferences/2024/CallForPapers
제출 입구: https://openreview.net/group?id=ICML.cc/2024 /워크숍 /MFM-EAI
MFM-EAI 챌린지 3개 트랙(동시 참여 가능)
EgoPlan 챌린지
접수 방법: [구글 양식] 작성(https://docs.google.com/forms/d/e/1FAIpQLScnWoXjZcwaagozP3jXnzdSEXX3r2tgXbqO6JWP_lr_fdnp) Qw /viewform? usp =sf_link)
우승: $600
워크숍 주최자
운영위원회
워크숍 관련 문의는 imlmfmeai@gmail.com으로 문의하세요.
위 내용은 대형 모델과 구체화된 지능의 불꽃, ICML 2024 MFM-EAI 워크숍 논문 및 챌린지 요청 개시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!