인간의 기대를 뛰어넘는 AI가 수행할 수 있는 또 다른 작업은 무엇인가요? 최근 Nvidia의 인공지능 연구원들은 AI의 보다 복잡한 기능을 탐색하기 위해 샌드박스 게임 'Minecraft'에 언어 모델 GPT-4를 도입했습니다.
5월 25일, 캘리포니아 공과대학을 비롯한 여러 대학의 연구원들이 Voyager를 출시했습니다. 논문의 정의에 따르면 Voyager는 대규모 언어 모델을 갖춘 개방형 표현 에이전트입니다. 자유도가 높은 게임 "Minecraft".
AI가 게임 내에서 구현하는 다양한 연산
보이저에게 주어진 임무는 생존, 전투, 건설 등 게임 내 다양한 목표를 달성하고, 게임 시간과 경험의 축적을 통해 점차 실력을 향상시키는 것입니다.
시스템이 이 목표를 생성하면 GPT-4는 목표를 달성하는 데 필요한 코드를 자동으로 생성하므로 캐릭터가 해당 작업을 완료할 수 있습니다.
이 프로젝트의 가장 혁신적인 부분은 GPT-4를 사용하여 게임 캐릭터가 행동하도록 유도하는 코드를 생성한다는 것입니다. AI 구현 논리는 인간과 동일하며 작업을 처음 시도하면 필연적으로 실패합니다. 하지만 오류 정보와 게임 피드백을 수집하고 상황에 따라 코드를 조정하여 최종적으로 작업을 완료합니다.
게임 시간이 길어짐에 따라 Voyager는 게임 내 다양한 소품을 더 빠르게 구축하기 위해 자체 코드 기반을 구축했습니다. 이러한 동작은 AI가 자체 게임 경험을 축적하는 것으로도 이해할 수 있습니다. 연구진은 보이저의 게임 진행 상황을 다른 인공지능 에이전트와 비교한 결과, 보이저가 다른 AI 에이전트보다 3배 많은 아이템을 얻었고, 탐색 거리와 아이템 제작 속도도 다른 컨트롤 그룹보다 훨씬 뛰어난 것으로 나타났다.
보이저는 최초로 동시에 다이아몬드 검을 만들었습니다
GPT-4 테스트를 위한 테스트 장소로 '마인크래프트'를 선택한 이유는 이 게임이 자유도가 높고, AI가 '잘 플레이'하려면 목표가 너무 명확하지 않기 때문입니다. 인간 플레이어의 능력과 유사하게 일부를 진화시키기 위해 연구원들은 몇 가지 핵심 기술을 요약했습니다.
예를 들어 "현재 스킬 레벨과 세계 상태에 따라 적절한 작업 제안" - 사막에 있을 때 AI는 철광석 대신 선인장 수집을 먼저 고려합니다. 또 다른 예는 "환경 피드백을 기반으로 스킬을 향상시키고 숙달한 스킬을 메모리에 저장하는 것"입니다. 적으로 좀비는 거미와 유사하므로 좀비와 싸우면서 얻은 전투 경험을 거미에게 사용할 수 있습니다.
물론, AI에게 게임을 가르치는 궁극적인 목표는 게임 외부에 있습니다. 연구원들은 이런 방식으로 언어 모델을 훈련함으로써 앞으로 일상적인 많은 사무 작업이 자동화되거나 사용자의 요구에 따라 자동으로 구현될 수 있다고 말합니다. 특정 효과.
그러나 전망은 밝지만 이 실험은 아직 초기 단계입니다. 실제로 귀찮은 작업을 AI에 맡기려면 잠시 기다려야 할 수도 있습니다.
참고자료: https://voyager.minedojo.org/
위 내용은 GPT-4를 '마인크래프트'에 연결함으로써 과학자들은 AI의 새로운 잠재력을 발견하고 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!