단일 신경망을 사용하여 조작하는 것은 4족 로봇 분야의 주요 기술 혁신입니다.
파쿠르는 참가자들이 대부분의 시간 동안 매우 역동적인 방식으로 장애물을 넘어야 하는 익스트림 스포츠입니다. "서투른" 로봇은 손이 닿지 않는 것 같지만 최근 로봇 제어 분야에서 기술적 혁신이 일어나는 추세가 있습니다. 몇 주 전, 이 사이트에서는 강화 학습 방법을 사용하여 로봇 개에게 파쿠르를 달성하고 좋은 결과를 얻은 연구에 대해 보고했습니다. 최근 카네기멜론대학교(CMU)에서는 로봇견 파쿠르에 도전하는 놀라운 새로운 방법을 제안하는 새로운 연구를 진행했고, 그 효과는 더욱 향상되어 사람들이 만장일치로 "대단하다" "대단하다"라는 평가를 했을 정도다.
관객들은 "마치 '블랙미러'에 나오는 것 같다"고 말했다. 로봇개들은 장애물 코스에서 경쟁자처럼 행동하고, 불연속적인 상자를 자동으로 건너고, 쉽게 달릴 수 있다. 다양한 각도로 기울어진 경사면 사이를 점프하고
0.8미터(로봇개 길이의 2배)의 틈을 쉽게 뛰어넘기:
로봇개는 앞다리 두 개만으로 걷는 등 현실 세계의 동물들이 하기 힘든 일도 할 수 있는데, 이는 거꾸로 걷는 것과 같습니다.
이 연구의 목표는 작고 저렴한 제품을 가능하게 하는 것입니다. 로봇 개는 파쿠르 작업을 성공적으로 완료합니다. 이 로봇 개의 운전 시스템은 충분히 정확하지 않으며 인식을 위한 전면 깊이 카메라만 있습니다. 이는 주파수가 낮고 지터와 인공물이 발생하기 쉽습니다.
이 연구는 원시 깊이 및 내장 센서 입력을 기반으로 한 신경망을 제안합니다. 관절 각도 명령을 직접 생성하기 위한 네트워크입니다. 대규모 강화 학습 시뮬레이션 교육을 수행함으로써 이 방법은 센서 부정확성과 액추에이터 문제로 인한 문제를 해결하여 엔드투엔드 고정밀 제어 동작을 달성할 수 있습니다. 이 연구 프로젝트는 오픈 소스 플랫폼에 공개되었습니다
이 연구는 엔드투엔드 데이터를 사용합니다. 로봇 개에게 "파쿠르" 능력을 갖추기 위한 강화 학습 프레임워크를 기반으로 합니다. 본 연구에서는 로봇견이 배치 시 장애물 유형에 따라 자가 조정이 가능하도록 새로운 이중증류 방식을 제안한다. 이 전략은 유연한 모션 명령을 출력할 수 있을 뿐만 아니라 입력된 깊이 이미지에 따라 방향을 빠르게 조정할 수도 있습니다.
구체적으로 연구의 목표는 원시 깊이 및 온보드 감지부터 관절 각도 명령까지 신경망을 직접 훈련하는 것입니다. 적응형 움직임 전략을 훈련하기 위해 이 연구는 극한 파쿠르 작업에 대한 주요 수정 사항이 포함된 정규화된 온라인 적응(ROA) 방법을 채택했습니다.
실험 결과이번 연구의 목표는 로봇개에게 오르기, 틈새 뛰어넘기, 달리기와 경사면 점프하기, 거꾸로 서기 등 4가지 기술을 익히는 것입니다. 아래 표 1은 다른 여러 방법과 비교한 비교 결과를 보여줍니다
시스템 내 각 부분의 역할을 확인하기 위해 연구에서는 두 가지 기준선을 제안했습니다. 연구는 먼저 보상 설계와 전반적인 프로세스를 테스트했으며 결과는 아래 표 2에 나와 있습니다.
두 번째 기준 세트의 목적은 방향 예측을 위한 BC와 방향 예측을 위한 단검을 포함하는 증류 설정을 테스트하는 것입니다. 행위. 실험 결과는 표 3에 나와 있습니다
또한 연구에서는 여러 가지 실제 실험을 수행하고 성공률을 기록하고 이를 NoClear 및 NoDir 기준과 비교했습니다. 실험 결과는 그림 7에 나와 있습니다.
관심 있는 독자는 논문의 원문을 읽고 연구 내용에 대해 자세히 알아볼 수 있습니다.
위 내용은 놀랍게도 로봇 개는 이미 이 능력을 갖고 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!