로봇 개가 실제 개의 움직임 데이터를 학습하게 하면, 정말 개처럼 느껴질 것입니다!
쉽게 장애물을 뛰어넘었고 그 뒤에 있는 "주인"은 거의 따라잡지 못했습니다:
"개 구멍"을 뚫는 것은 매우 익숙했습니다:
그것도 할 수 있습니다 두 마리의 강아지가 함께 즐거운 시간을 보내고, 추격하고, 탈출하고...
구스팩토리 로봇견의 최신 진행 상황입니다.
사전 훈련된 모델을 사용하여 실제 개들의 움직임 데이터를 로봇 개에게 제공하고 강화 학습을 통해 로봇 개 Max는 행동이 더 민첩할 뿐만 아니라 보유한 기술을 기반으로 더 복잡한 환경에 적응할 수 있습니다. 이미 마스터했습니다.
결론적으로 말하면, 안팎이 좀 더 '멍청'합니다.
로봇개가 이번에 배운 새로운 기술 중 가장 강한 것은 바로 게임입니다.
로봇 개는 규칙을 지킬 뿐만 아니라 게임에서 승리하기 위한 자신만의 전략을 생각해 낼 수 있어 실제 개보다 더 똑똑할 수도 있습니다.
구체적으로 이 게임은 "World Chase Tag"에서 영감을 받은 장애물 추적 게임입니다. 규칙은 다음과 같습니다.
연구원들은 다양한 게임 난이도를 설정했으며, 가장 간단한 것은 오픈 필드입니다.
Play 게임 중에 로봇 개는 분명히 전략을 가지고 있습니다.
예를 들어, 일반적으로 추격자는 다저가 체스 깃발에서 멀리 떨어져 있을 때 맹렬한 공격을 가해 체스 깃발을 사각지대에 몰아넣고 게임이 종료됩니다.
추격자는 다저가 깃발에 매우 가까워서 따라잡을 기회가 없다는 것을 알게 되면 먼저 추적을 포기하고 다음 깃발이 나타날 때까지 기다립니다.
장애물이 있어도 상관없습니다. 두 개는 똑같이 잘 놀았습니다.
그리고 이렇게 수행할 수 있는 것은 로봇 개가 처음부터 이 게임에서 훈련을 받았기 때문이 아닙니다.
실제로 이 게임 시나리오를 다루기 위해 배운 일부 행동, 지식 및 기술을 기반으로 합니다.
구체적으로 어떻게 구현하나요? 아래를보세요.
연구는 세 단계로 나누어집니다.
첫 번째 단계는 게임에서 일반적으로 사용되는 모션 캡처 시스템을 통해 실제 개를 수집하는 것입니다. 걷기, 달리기, 점프하기, 서기 및 기타 동작을 포함한 다양한 동작을 사용하여 시뮬레이터에서 모방 학습 작업을 구성합니다.
그런 다음 이러한 데이터의 정보는 심층 신경망 모델로 추상화되고 압축되어 특정 해석 가능성을 가지면서 동작 자세 정보를 다룰 수 있습니다. Tencent RoboticsX Robotics Laboratory는 Tencent Games와 협력하여 게임 기술을 사용하여 시뮬레이션 엔진의 정확성과 효율성을 높이는 동시에 게임 제작 및 개발 과정에서 다양한 모션 캡처 자료를 축적해 왔습니다. 이러한 기술과 데이터는 물리적 시뮬레이션과 실제 로봇 전략 배포를 기반으로 한 에이전트 교육에서도 일정한 보조 역할을 합니다.모방 학습 과정에서 신경망은 로봇의 모터 상태 등
로봇개의 고유 감각 정보만 입력으로 받아들입니다.다음 단계에서 모델은 다른 센서를 통해 "보이는" 발밑 장애물과 같은 주변 환경의 감각 데이터를 도입합니다.
두 번째 단계에서는 추가 네트워크 매개변수를 통해 첫 번째 단계에서 익힌 동물 자세가 외부 인식과 연결됩니다.
이렇게 로봇개는 학습한 행동을 통해 외부 환경에 반응할 수 있습니다.
로봇이 다양하고 복잡한 환경에 적응할 수 있게 되면 동물의 자세와 외부 인식을 연결하는 지식도 신경망 구조에 굳어져 저장될 것입니다.
그러면 로봇개는 계단을 자유롭게 올라갈 수 있어요.
또는 불연속적이고 울퉁불퉁한 땅 위를 달리는 것:
그리고 마지막 단계로 넘어가면, 로봇 개가 위에서 배운 기술을 바탕으로 실질적인 문제를 해결합니다
또한 위에서 언급한 게임 제작 부분.
보도에 따르면 게임 속 로봇개에 대한 모든 제어 전략은 신경망 전략입니다.
시뮬레이션에서 학습하고 zero-shot transfer(제로 조정 전송)을 통해 신경망이 인간의 추론을 시뮬레이션하여 이전에 본 적이 없는 새로운 것을 식별하고 이 지식을 실제 로봇에 배포하도록 하세요.
예를 들어 사전 훈련된 모델에서 장애물을 피하는 방법을 배웠다면 게임에서 장애물을 설정하면 로봇 개는 쉽게 대처할 수 있습니다.
이 새로운 연구 진행 상황은 Tencent Robotics X Robotics Laboratory에서 가져왔습니다.
실험은 2018년에 시작되었습니다. 현재 출시된 로봇 프로젝트에는 1/2세대 로봇개 맥스, 로봇개 자모카, 바퀴 달린 로봇 올리, 스스로 균형을 잡는 자율주행 오토바이 등이 있습니다.
UC Berkeley의 학자들도 로봇 개에게 "진짜 개" 훈련 방법을 사용했다는 점을 언급할 가치가 있습니다.
Ng의 창립 제자인 Pieter Abbeel과 다른 사람들은 로봇 개를 한 시간 동안 땅에서 굴리게 하고 걷는 법을 배웠습니다.
작년에 Tencent가 2세대 로봇개 Max를 출시했을 때, 작은 소소한 이야기로 개가 "발을 퍼덕이고" "달려다닐" 수 있었는데, 정말 집에 있는 복슬복슬한 아이처럼 보였습니다.
(물론 주인의 말을 잘 듣는 개가 되기를 원한다면 지시를 통해 명령을 내릴 수도 있습니다.)
우리가 말하는 것은 현재 로봇의 발전 방향이 개는 재주 넘기면서 직업을 놓고 실제 개와 경쟁하려고 하시나요?
위 내용은 구스팩토리의 로봇 개가 실제 개들의 '일'을 대신합니다! 게임도 하고 즐겁게 게임도 할 수 있고, 6세쯤 되면 사람들과 산책도 할 수 있어요.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!