2개월 만에 휴머노이드 로봇 '워커S' 옷 개기 가능

王林
풀어 주다: 2024-04-03 08:01:16
앞으로
1202명이 탐색했습니다.

기계력 보고서

편집자: Wu Xin

국내판 휴머노이드 로봇+대형 모델이 팀을 이루어 옷 접기 등 복잡하고 유연한 소재의 작업 작업을 최초로 완료했습니다.

OpenAI 멀티모달 대형 모델이 적용된 Figure 01이 공개되면서 국내 동종업체들의 관련 진전이 주목받고 있습니다.

어제 중국의 '최초의 휴머노이드 로봇 주식'인 UBTECH는 Baidu Wenxin의 대형 모델을 심층적으로 통합한 후 휴머노이드 로봇 Walker S의 첫 번째 데모를 출시하여 몇 가지 흥미로운 새로운 기능을 선보였습니다.

이제 Baidu Wenxin 대형 모델 기능의 축복을 받아 Walker S는 이렇게 생겼습니다.

2 个月不见,人形机器人 Walker S 会叠衣服了

그림 01과 마찬가지로 Walker S는 움직이지 않고 책상 뒤에 서서 일련의 작업을 완료합니다. 인간의 명령을 따르고 옷을 접을 수 있습니다.

작업을 완료한 후 채팅도 가능합니다. 예를 들어, 이 검은색 상의는 무엇을 입어야 할까요? 로봇은 당신이 출장을 간다는 것을 여전히 기억하고 있으며 공식적인 자리에 더 적합한 어두운 바지와 함께 매치하는 것이 좋습니다.

테이블 위의 다양한 스위치를 접시에 배치할 수도 있습니다.

설치된 스위치가 테이블 위로 다시 던져지는 등 방해를 받더라도, 닿으려는 소켓이 제거되는 경우에도 Walker S는 실시간으로 작동 상태를 조정하고 지시에 따라 배치 작업을 완료할 수 있습니다. 새로운 상황.

2월 Walker S는 이미 신에너지 자동차 공장에서 실습 교육을 통해 다중 모드 인식 및 모션 제어 기능을 시연했습니다.

이번 Wenxin 대형 모델과의 심층적인 통합을 통해 Walker S의 인지 및 제어 기능은 고급 의도 이해 및 세분화된 작업 계획 기능을 확보했을 뿐만 아니라 다음과 같은 복잡한 유연성을 완성했습니다. 처음으로 옷을 접는 작업.

Wenxin 대형 모델은 Wenxin의 산업 수준 지식 향상 대형 모델로, 교차 모드 및 언어 간 깊은 의미 이해 및 생성 기능은 물론 지식 추론, 작업 계획 및 기타 기능을 갖추고 있습니다. 이러한 능력을 휴머노이드 로봇에 접목함으로써 로봇은 인간과 마찬가지로 옷의 재질, 모양, 주름 등의 속성을 분석하고 이해하며, 과거의 경험을 바탕으로 옷을 개는 가장 좋은 방법과 순서를 추론할 수 있습니다. 실제 옷 개는 과정에서 로봇은 옷의 상태 변화를 실시간으로 분석하고 이에 따라 행동 전략을 조정한다.

객체 간섭 정렬 작업에서도 워커S는 'AI 대형모델+로봇'의 시너지 장점을 십분 발휘했다. 먼저, 장치 측의 다중 모드 인식 모델을 통해 객체의 공간 위치 및 의미 정보를 얻은 다음 해당 정보를 대형 모델에 전달하여 지능형 처리를 수행합니다. 뛰어난 작업으로 Walker S를 신속하게 구축합니다. 해체 및 논리적 추론 능력을 바탕으로 최적의 업무 계획 및 실행 경로를 찾아드립니다. Walker S는 이 솔루션을 로봇 팔과 능숙한 손의 실제 제어에 매핑하고 마침내 복잡한 작업 전체를 성공적으로 완료합니다.

이것은 또한 국내 동종 업체가 최초로 유사한 기능을 시연한 것이기도 하며 혁신적인 적용 및 구현 난이도도 전 세계적으로 업계 최초 수준입니다. "Figure의 OpenAI와의 협력, Baidu와의 협력을 포함한 많은 시연에서 이제 엔드투엔드가 달성될 수 있습니다." UBTECH 경영진은 어젯밤 성과 검토 및 전망 회의에서 China Business News에 말했습니다.

" 우리는 Baidu의 대형 모델을 사용하여 작업을 분해하고, 자연어를 이해하고, 논리적 배열 순서를 지정합니다. 작년에 오픈 소스 모델 교육을 기반으로 구축되고 클라이언트 기반의 다중 모드 대형 모델 외에도 future 휴머노이드 로봇 시장의 경쟁이 점점 치열해지는 만큼, 강력한 힘을 합쳐야만 1+1>2를 이룰 수 있다”고 이번 협력을 설명하면서 유비텍 경영진은 “외국 테슬라는 오픈AI, 엔비디아 등 대규모 모델 역량을 보유하고 있다. Figure와 결합하면 협력이 휴머노이드 로봇 구현을 위한 강력한 기술 지원을 제공할 수 있음을 알 수 있습니다.”

그러나 OpenAI의 영상을 비교해 보면 권한이 부여된 Walker S와 Figure 01 사이에는 여전히 격차가 있음을 알 수 있습니다.

가장 확실한 것은 행동의 속도입니다. 또한, 명령 내용 측면에서 보면 Walker S가 받은 명령은 일반적으로 상대적으로 명확하고 구체적인 반면, 그림 01은 상식 추론을 통해 보다 추상적인 명령을 합리적이고 실행 가능한 특정 작업으로 변환할 수 있습니다.

또한 Figure 01은 작업 중에 채팅을 할 수 있고(특히 작업 설명) 단기 기억 능력이 있으며 이전 대화 내용을 기반으로 현재 행동을 합리적으로 계획할 수 있습니다.

생성 AI 경쟁이 점점 치열해지고 연구 초점이 긴 텍스트와 다중 양식에서 구체화된 지능으로 확장됨에 따라 미래의 휴머노이드 로봇은 더 이상 정적 데이터를 인식하는 데 국한되지 않고 실제 3차원 세계에서 자유롭게 움직이며 환경과 상호작용할 수 있습니다. 이는 또한 단순한 기계 학습에서 인간과 유사한 복잡한 작업 실행에 이르기까지 AI의 큰 도약을 의미합니다.

실제 휴머노이드 로봇 트랙은 국내외에서 수시로 프로토타입이 공개되고, 스타트업의 자금 조달이 활발해지는 등 지난 6개월간 매우 뜨거운 기세를 보여왔습니다. 지난 2월, UBTECH는 NIO의 신에너지 자동차 공장에서 Walker S를 시험하는 영상을 공개했습니다. 이 로봇은 안전 벨트 검사, 차량 로고 부착 및 기타 작업을 원활하게 완료할 수 있습니다. 유비텍 주가도 3월 초 이틀 만에 200% 급등했다.

그러나 전 세계의 휴머노이드 로봇은 아직 파일럿 단계에 있으며, 규모를 확대하는 데는 아직 시간이 걸릴 것입니다. 결국 데모와 실제 적용에는 큰 차이가 있고, 후자는 신뢰성, 안정성, 비용 등 일련의 요소를 종합적으로 고려해야 한다. UBTECH는 대형 AI 모델과 휴머노이드 로봇의 결합이 휴머노이드 로봇의 지능 수준과 다중 시나리오 작업에 대한 적응성을 크게 향상시키고 산업화 프로세스를 가속화할 것이라고 밝혔습니다. 설립자 Zhou Jian은 또한 올해 말까지 공장에서 첫 번째 휴머노이드 로봇 배치를 완료하고 테스트를 통과하며 2025년 휴머노이드 로봇의 대량 확산에 대비하기를 희망한다고 공개적으로 밝혔습니다. 또한, 유비테크는 올해 말까지 대형 모델을 탑재하고 단기 및 장기 기억을 형성할 수 있는 1세대 휴머노이드 로봇을 출시할 계획이다.

참조 링크

https://www.stcn.com/article/detail/1164967.html

THE END

재인쇄 승인을 받으려면 이 공개 계정에 문의하세요

제보 또는 보고서 검색: content@jiqizhixin.com

위 내용은 2개월 만에 휴머노이드 로봇 '워커S' 옷 개기 가능의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:myzaker.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!