인출식 레일이 있는 서랍, 수직 회전축이 있는 도어, 수평 회전축이 있는 오븐 등 일상생활에서 사람들이 접하는 대부분의 가구는 "관절형 개체"입니다. 다양한 관절로 연결됩니다.
이러한 관절의 존재로 인해 연결되는 물체의 부품 중 다양한 부분이 관절에 의해 운동학적으로 구속되므로 이러한 부품은 1개의 자유도(1DoF)만 갖습니다. 이러한 품목은 우리 삶의 모든 곳에, 특히 일상생활의 중요한 부분입니다. 인간으로서 우리는 어떤 종류의 가구를 가지고 있더라도 그것을 조작하고 제어하는 방법을 빠르게 알아낼 수 있다는 것을 알고 있습니다. 이는 마치 우리가 이 물체의 모든 관절이 어떻게 움직이는지 아는 것과 같습니다.
그럼 로봇도 사람처럼 가구가 어떻게 움직일지 예측할 수 있을까요? 이런 예측 능력은 나오기 힘든데, 만약 로봇이 이런 능력을 배울 수 있다면 가정용 로봇에게는 큰 힘이 될 것입니다.
최근 CMU 로봇 공학 대학의 David Held 교수가 이끄는 R-PAD 연구실의 두 학생인 Ben Eisner와 Harry Zhang은 복잡한 관절 개체를 조작하는 데 획기적인 발전을 이루었고 3D 신경망 기반 FlowBot 3D를 출시했습니다. 일상적인 가구와 같은 관절로 연결된 물체의 움직임 궤적을 효과적으로 표현하고 예측하는 알고리즘입니다. 알고리즘은 두 부분으로 구성됩니다.
첫 번째 부분은 인식 부분으로, 3D 심층 신경망을 사용하여 조작된 가구 객체의 포인트 클라우드 데이터로부터 3차원 순간 운동 궤적(3D Articulated Flow)을 예측합니다.
알고리즘의 두 번째 부분은 정책 부분으로, 예측된 3D Articulated Flow를 사용하여 로봇의 다음 동작을 선택합니다. 둘 다 시뮬레이터에서 완전히 학습되며 재교육이나 조정 없이 실제 세계에서 직접 구현할 수 있습니다. FlowBot 3D 알고리즘의 도움으로 로봇은 인간처럼 일상 가구와 같은 관절로 연결된 물체를 마음대로 조작할 수 있습니다.
본 논문은 현재 세계 최고의 로봇공학 컨퍼런스인 Robotics Science and Systems (RSS) 2022에서 최우수 논문 후보(상위 3%)이며, 미국 뉴욕에서 전시될 예정입니다. 7월에는 최고의 논문의 영예를 놓고 다른 7개의 우수한 논문을 출판하고 경쟁했습니다.
FlowBot 3D는 시뮬레이터에만 의존하여 시뮬레이션된 데이터에서 지도 학습을 수행하여 일상 가구와 같은 관절 객체 부품의 순간적인 운동 궤적을 학습합니다(3D Articulated Flow). 3D Articulated Flow는 로봇의 다음 전략의 복잡성을 크게 단순화하고 일반화 및 효율성을 향상시킬 수 있는 시각적 포인트 클라우드 궤적 표현 방법입니다. 로봇은 관절 물체를 조작하는 작업을 완료하기 위해 이 순간적인 궤적을 따르고 폐쇄 루프에서 이 궤적을 다시 예측하기만 하면 됩니다.
기존 학계에서 가구 등 관절물체를 조작하는 기존 방식은 조작된 물체의 기하학적 특성(연결된 부품의 위치, 방향 등)을 통해 부품의 이동방향을 계산하거나, 공동 개체 조작의 복잡한 동작을 완료하기 위해 특정 개체의 작동을 배우는 전문가 전략(보통 인간의 전략)을 모방합니다. 이러한 학계의 전통적인 방법은 일반화가 잘 되지 않고, 데이터 활용의 효율성도 낮습니다. 이와 달리 FlowBot 3D는 인간이 시연 데이터를 제공할 필요가 없는 최초의 순수 시뮬레이터 기반 학습이며, 알고리즘을 통해 로봇은 각 부품의 순간적인 동작 궤적을 학습하여 최적의 객체 조작 경로를 계산할 수 있으므로 알고리즘은 일반화 가능성이 높습니다. FlowBot 3D가 시뮬레이터 교육 중에 보이지 않는 물체를 일반화하여 실제 일상 가구 항목을 현실 세계에서 직접 성공적으로 조작할 수 있는 것이 바로 이 기능입니다.
다음 애니메이션은 FlowBot 3D의 조작 과정을 보여줍니다. 왼쪽은 조작된 영상이고, 오른쪽은 포인트 클라우드 3D Articulated Flow의 예측된 순간 모션 궤적입니다. FlowBot 3D 알고리즘을 사용하면 먼저 로봇이 물체의 어느 부분을 조작할 수 있는지 식별한 다음 해당 부분의 이동 방향을 예측할 수 있습니다.
냉장고 문을 열어보세요:
ㅋㅋㅋ : 전반적으로 본 논문은 다음과 같은 분야에 상당한 기여를 하고 있다. 로봇 제어.그렇다면 FlowBot 3D는 이 기술을 어떻게 학습할까요?
인간이 문과 같은 새로운 가구 품목을 볼 때 문이 문 축을 통해 회전한다는 것을 알고 있으며 문 축의 제약으로 인해 문이 한 방향으로만 회전할 수 있다는 것을 알고 있습니다. 우리는 마음 속에 상상한 방향을 따라 문을 열 수 있습니다. 따라서 로봇이 가구와 같은 관절 물체의 조작 방법과 동작 궤적을 예측하는 데 정말 능숙하고 효과적이기를 원한다면, 효과적인 방법은 로봇이 이러한 부품의 운동학적 제약을 이해하도록 하여 동작을 예측할 수 있도록 하는 것입니다. 이 물체의 움직임.FlowBot 3D의 구체적인 방법은 복잡하지 않으며 복잡한 실제 인간 데이터 없이 시뮬레이터에만 의존합니다. 또한 시뮬레이터의 또 다른 이점은 시뮬레이터에서 이러한 가정용 물체의 3D 데이터 파일(URDF)에 각 부품의 운동학적 제약 조건과 제약 조건의 특정 매개 변수가 포함되어 있으므로 각 부품의 운동 궤적이 시뮬레이터로 정확하게 계산할 수 있습니다.
시뮬레이터 훈련 중에 로봇은 조작 대상의 3차원 포인트 클라우드 데이터를 로봇 비전 모듈에 대한 입력 데이터로 관찰합니다. 비전 모듈(인식 모듈)은 PointNet++를 사용하여 외부 힘의 작용에 따라 입력 포인트 클라우드의 각 지점의 순간 동작 궤적에 대한 3D 연결 흐름을 예측합니다(예: 서랍이 1cm 열리면 문이 5도 열립니다). 외부), 열악한 형태로 표현된 3차원 좌표 벡터를 사용합니다. 이 운동 궤적의 실제 데이터는 순운동학을 통해 정확하게 계산될 수 있습니다. 다음 3차원 벡터 좌표에서 현재 3차원 벡터 좌표를 빼면 조작 대상 부분의 운동 궤적을 얻을 수 있다. 따라서 훈련 중에 지도 학습을 위해서는 예측된 3D Articulated 흐름의 L2 손실만 최소화하면 됩니다.
이 그림에서 파란색 점은 관찰된 포인트 클라우드 데이터이고 빨간색 화살표는 정면 3D Articulated Flow의 예상 이동 궤적을 나타냅니다.
이런 방식으로 학습하면 FlowBot 3D는 운동학적 제약 하에서 각 부품의 이동 방향과 동일한 힘으로 움직이는 부품의 각 지점의 상대 속도 및 상대 방향(속도)을 학습할 수 있습니다. 일반적인 가정용 공동 품목은 각기둥 모양이며 회전합니다. 서랍과 같은 트위치 부품의 경우 동일한 외력을 받으면 서랍 표면의 각 지점의 이동 방향과 속도가 동일합니다. 도어와 같은 회전 부품의 경우, 동일한 외력을 받을 때 도어 표면의 각 지점의 이동 방향은 동일하지만 회전축에서 멀어질수록 속도가 증가합니다. 연구원들은 로봇 공학의 물리적 법칙(나사 이론)을 사용하여 가장 긴 3D 관절 흐름이 물체의 가속도를 최대화할 수 있음을 증명했습니다. 뉴턴의 제2법칙에 따르면 이 전략이 최적의 솔루션입니다.
이론적으로 실제 동작에서 로봇이 해야 할 일은 FlowBot 3D의 비전 모듈을 통해 각 지점의 이동 궤적을 예측하는 것입니다. 궤적, 가장 긴 3D 관절형 흐름 방향에 해당하는 점을 제어점으로 찾고, 폐루프에서 이 제어점의 모션 궤적을 예측합니다. 선택한 조작 지점을 성공적으로 잡을 수 없는 경우(예: 표면이 로봇 손의 파지 조건을 충족하지 않는 경우) FlowBot 3D는 파지 조건을 충족하는 두 번째로 긴 길이를 가진 지점을 선택합니다.
또한 PointNet++의 특성으로 인해 FlowBot 3D는 각 점의 동작 궤적을 예측하고 물체 자체의 기하학적 특성에 의존하지 않으며 로봇이 물체를 가리는 경우에도 매우 견고합니다. 또한 이 알고리즘은 폐쇄 루프이기 때문에 로봇은 다음 예측 단계에서 발생할 수 있는 오류를 수정할 수 있습니다.
FlowBot 3D의 현실 세계 성능FlowBot 3D는 현실 세계의 일반화 문제를 극복할 수 있는 능력을 갖추고 있습니다. FlowBot 3D의 설계 개념은 조작된 객체 3D 관절 흐름의 이동 궤적을 정확하게 예측할 수 있는 한 다음 단계는 이 궤적을 따라 작업을 완료하는 것입니다.
또 다른 중요한 점은 FlowBot 3D가 단일 훈련 모델을 사용하여 훈련에서 볼 수 없는 범주를 포함하여 여러 범주의 항목을 조작한다는 것입니다. 그리고 현실 세계에서 로봇은 다양한 실제 물체를 조작하기 위해 순수한 시뮬레이터 훈련을 통해 얻은 모델만 사용하면 됩니다. 따라서 현실 세계에서는 가정용 물체의 운동학적 제약이 시뮬레이터와 압도적으로 동일하기 때문에 FlowBot 3D를 현실 세계에 직접 일반화할 수 있습니다.
실제 실험에서 FlowBot3D가 사용하는 가정용품(쓰레기통, 냉장고, 변기, 상자, 금고 등 포함)
시뮬레이터에서 로봇은 일부 카테고리의 가정용품을 사용합니다. 스테이플러, 쓰레기통, 서랍, 창문, 냉장고 등을 포함한 훈련용. 시뮬레이터 및 실제 테스트에서 테스트 데이터는 훈련 중에 보지 못한 훈련 범주 및 범주의 새로운 개체에서 나옵니다.
FlowBot 3D 시뮬레이터의 조작 작업
이에 비해 학계에서는 모방 학습을 기반으로 한 일반적인 방법이 필요합니다. 새로운 물체를 조작하는 방법을 배우기 위한 수동 지침으로 인해 이러한 로봇을 현실 세계, 특히 가정용 로봇 시나리오에서 구현하는 것은 비현실적입니다. 또한 3D 포인트 클라우드 데이터는 2D RGB 데이터에서 사용되는 것보다 강력합니다. 포인트 클라우드를 사용하면 로봇이 각 관절과 관절 간의 관계를 이해할 수 있으므로 더 높은 수준에서 부품의 이동 궤적을 이해하고 예측할 수 있어 일반화가 크게 향상됩니다
.실험 결과에 따르면 FlowBot 3D는 대부분의 물체를 작동할 때(훈련 중에 표시되는 카테고리인지 여부에 관계없이) 10% 미만의 "완전 개방" 거리와 90% 이상의 성공 범위를 달성할 수 있는 것으로 나타났습니다. 이에 비해 모방 학습(DAgger) 또는 강화 학습(SAC)을 기반으로 하는 다른 방법은 훨씬 뒤떨어져 있고 일반화가 부족합니다.
간단히 말하면 FlowBot 3D는 엄청난 잠재력을 지닌 작업입니다. 미세 조정 없이도 현실 세계에서 효율적으로 배포할 수 있습니다. 이 작업은 또한 컴퓨터 비전의 발전이 로봇 공학 분야, 특히 3D 관절형 흐름이라고 불리는 모션 궤적의 시각적 표현을 변화시킬 수 있음을 보여줍니다. 이는 로봇 전략 선택 및 의사 결정 프로세스를 단순화하기 위해 여러 작업에 적용할 수 있습니다. 이러한 일반화 가능한 표현을 통해 시뮬레이터 학습 방법은 실제 세계에 직접 배포될 수 있는 잠재력을 갖게 되며, 이는 미래의 가정용 로봇 훈련 및 학습 비용을 크게 절감할 것입니다.
FlowBot 3D의 다음 계획현재 연구팀은 흐름을 활용해 6자유도로 물체의 궤적을 예측하는 방법 등 관절 물체 이외의 물체에도 흐름 이해 및 예측 방법을 적용하려고 노력하고 있다. . 동시에 저자는 흐름을 일반적인 시각적 표현으로 활용하여 강화학습 등 다른 로봇 학습 작업에도 적용함으로써 학습 효율성, 견고성, 일반화 가능성을 높이려고 노력하고 있습니다.
David Held 부교수 홈페이지: https://davheld.github.io/Ben Eisner 홈페이지: https://beisner.me/Harry Zhang 홈페이지: https://harryzhangog.github.io/
위 내용은 CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!