목차
Method
기술 주변기기 일체 포함 MoE와 함께 99개의 제출 미션을 청소하세요! 절강대학교 등은 새로운 일반 로봇 전략 GeRM을 제안했습니다.

MoE와 함께 99개의 제출 미션을 청소하세요! 절강대학교 등은 새로운 일반 로봇 전략 GeRM을 제안했습니다.

Apr 17, 2024 pm 11:40 PM
git ai 모델

다양하고 복잡한 시나리오를 다루는 데 있어 다중 작업 로봇 학습은 매우 중요합니다. 그러나 현재 방법은 성능 문제와 교육 데이터 세트 수집의 어려움으로 인해 제한됩니다.

본 논문에서는 연구자들이 오프라인 강화 학습을 활용하여 데이터 활용 전략을 최적화하고 시연 및 차선 데이터로부터 학습함으로써 인간 시연의 한계를 뛰어넘는 GeRM(Generic Robot Model)을 제안합니다.

MoE와 함께 99개의 제출 미션을 청소하세요! 절강대학교 등은 새로운 일반 로봇 전략 GeRM을 제안했습니다.

저자: Song Wenxuan, Zhao Han, Ding Pengxiang, Cui Can, Lu Shangke, Fan Yaning, Wang Donglin

저자: West Lake University, Zhejiang University

논문 주소: https: //arxiv.org/abs/2403.13358

프로젝트 주소: https://songwxuan.github.io/GeRM/

그런 다음 Transformer 기반 비전-언어-액션 모델을 사용하여 다중 모드를 처리합니다. 입력 및 출력 동작.

GeRM은 전문적인 하이브리드 구조를 도입하여 더 빠른 추론 속도와 더 높은 전체 모델 용량을 달성하여 제한된 강화 학습 매개 변수 볼륨 문제를 해결하고 다중 작업 학습에서 모델 성능을 향상시키는 동시에 비용 계산을 제어합니다.

일련의 실험을 통해 GeRM이 모든 작업에서 다른 방법보다 뛰어난 성능을 발휘하는 동시에 훈련 및 추론 프로세스에서 효율성을 검증한다는 것이 입증되었습니다.

또한 연구원들은 훈련을 지원하기 위해 QUARD-Auto 데이터 세트도 제공했습니다. 이 데이터 세트의 구성은 기사에서 제안한 데이터 자동화 수집의 새로운 패러다임을 따릅니다. 이 방법은 로봇 데이터 수집 비용을 줄일 수 있습니다. 다중 작업 학습을 촉진합니다.

주요 기여:

1. 혼합 품질 데이터로 훈련되고 최적의 전략을 학습할 수 있는 네발 강화 학습을 위한 하이브리드 전문가 모델을 처음으로 제안했습니다.

2. GeRM은 기존 방법에 비해 자체 매개변수의 1/2만 활성화할 때 더 높은 성공률을 보이고, 출현 기능을 활성화하며, 전략 과정에서 더 나은 데이터 활용도를 보여줍니다.

3. 전자동 로봇 데이터 세트 수집 패러다임을 제안하고, 대규모 오픈소스 데이터 세트를 수집했습니다.

Method

GeRM 네트워크 구조는 그림 1과 같습니다. 데모 데이터와 실패 데이터를 포함한 시각적 언어 입력은 각각 인코더와 토크나이저를 거친 후 8계층 하이브리드 전문가 구조의 디코더에 입력되며, 그리고 행동 토큰을 생성하고 최종적으로 개별 로봇 행동 데이터로 변환하고 기본 전략을 통해 로봇에 배포합니다. 또한 훈련을 위해 강화 학습을 사용합니다.

MoE와 함께 99개의 제출 미션을 청소하세요! 절강대학교 등은 새로운 일반 로봇 전략 GeRM을 제안했습니다.

그림 1 GeRM 네트워크 구조 다이어그램

GeRM 디코더는 FFN(피드포워드 네트워크)이 8개의 서로 다른 전문가 네트워크 세트에서 선택되는 트랜스포머 디코더 아키텍처 모델입니다.

각 레이어에서 각 토큰에 대해 게이트 네트워크는 두 명의 전문가를 선택하여 토큰을 처리하고 가중치 방식으로 출력을 결합합니다.

다양한 전문가는 다양한 작업/다양한 행동 차원에 능숙하여 다양한 시나리오의 문제를 해결함으로써 여러 작업에 걸쳐 공통 모델을 학습합니다. 이 아키텍처는 계산 비용을 본질적으로 변경하지 않고 유지하면서 네트워크 매개변수의 양을 확장합니다.

MoE와 함께 99개의 제출 미션을 청소하세요! 절강대학교 등은 새로운 일반 로봇 전략 GeRM을 제안했습니다.

그림 2 디코더 구조 다이어그램

로봇으로부터 다중 모드 데이터를 수집하는 자동 패러다임을 제안합니다. 이러한 방식으로 우리는 데모 데이터와 차선 데이터의 조합을 포함하는 대규모 로봇 공학 데이터 세트인 QUARD-Auto를 구축했습니다. 여기에는 5개의 작업과 99개의 하위 작업이 포함되어 있으며 총 257,000개의 궤적이 있습니다. 우리는 로봇 커뮤니티의 발전을 촉진하기 위해 소스를 오픈할 것입니다.

MoE와 함께 99개의 제출 미션을 청소하세요! 절강대학교 등은 새로운 일반 로봇 전략 GeRM을 제안했습니다.

표 1 데이터 세트 소개

MoE와 함께 99개의 제출 미션을 청소하세요! 절강대학교 등은 새로운 일반 로봇 전략 GeRM을 제안했습니다.

그림 3 데이터 볼륨 통계

실험

99개 하위 작업을 모두 포괄하는 포괄적이고 강력한 일련의 실험을 수행했으며 각 하위 작업은 400개 궤적에서 신중하게 테스트되었습니다.

표 1에서 볼 수 있듯이 GeRM은 모든 작업 중 성공률이 가장 높습니다. RT-1 및 GeRM의 다른 변형과 비교하여 혼합 품질 데이터로부터 효과적으로 학습하고 다른 방법보다 성능이 뛰어나며 여러 작업에서 뛰어난 기능을 보여줍니다. 동시에 MoE 모듈은 추론 중에 일부 매개변수를 활성화하여 계산 비용과 성능의 균형을 유지합니다.

MoE와 함께 99개의 제출 미션을 청소하세요! 절강대학교 등은 새로운 일반 로봇 전략 GeRM을 제안했습니다.

표 2 다중 작업 비교 실험

GeRM은 훌륭한 훈련 효율성을 보여줍니다. 다른 방법과 비교하여 GeRM은 단 몇 개의 배치만으로 매우 낮은 손실과 높은 성공률을 달성하여 데이터 활용 전략을 최적화하는 GeRM의 능력을 강조합니다.

MoE와 함께 99개의 제출 미션을 청소하세요! 절강대학교 등은 새로운 일반 로봇 전략 GeRM을 제안했습니다.

그림 4 성공률/손실 변화 곡선

GeRM은 동적 적응형 경로 계획에서 새로운 기능을 입증했습니다. 영상에서 볼 수 있듯이 4족 로봇은 초기 위치에서는 시야가 제한되어 이동 방향을 결정하기 어렵습니다. 장애물을 피하기 위해 무작위로 좌회전을 선택합니다.

결과적으로 잘못된 시각적 입력이 발생하면 로봇은 원래 시야 밖의 올바른 대상에 정렬하기 위해 과감한 방향 전환을 수행합니다. 그런 다음 목적지를 향해 계속 나아가 궁극적으로 임무를 완료합니다.

그러한 궤적은 훈련 데이터 세트의 분포에 속하지 않는다는 점에 주목할 가치가 있습니다. 이는 장면의 맥락에서 동적 적응형 경로 계획에서 GeRM의 새로운 기능, 즉 시각적 인식을 기반으로 결정을 내리고, 미래 경로를 계획하고, 필요에 따라 다음 단계를 변경하는 능력을 보여줍니다.

MoE와 함께 99개의 제출 미션을 청소하세요! 절강대학교 등은 새로운 일반 로봇 전략 GeRM을 제안했습니다.

그림 5 응급 능력

위 내용은 MoE와 함께 99개의 제출 미션을 청소하세요! 절강대학교 등은 새로운 일반 로봇 전략 GeRM을 제안했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. 크로스 플레이가 있습니까?
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

git로 저장소를 삭제하는 방법 git로 저장소를 삭제하는 방법 Apr 17, 2025 pm 04:03 PM

git 저장소를 삭제하려면 다음 단계를 따르십시오. 삭제하려는 저장소를 확인하십시오. 로컬 리포지토리 삭제 : rm -rf 명령을 사용하여 폴더를 삭제하십시오. 원격으로 창고 삭제 : 창고 설정으로 이동하고 "창고 삭제"옵션을 찾은 후 작동을 확인하십시오.

Git Commit을 사용하는 방법 Git Commit을 사용하는 방법 Apr 17, 2025 pm 03:57 PM

Git Commit은 프로젝트의 현재 상태에 대한 스냅 샷을 저장하기 위해 파일 변경을 GIT 저장소에 기록하는 명령입니다. 사용 방법은 다음과 같습니다. 임시 저장 영역에 변경 사항 추가 제출 메시지를 저장하고 종료하기 위해 간결하고 유익한 제출 메시지를 작성하여 제출을 완료하기 위해 제출물을 완료하십시오. 제출자에 서명을 추가하여 제출 내용을보기 위해 GIT 로그를 사용하십시오.

GIT 다운로드가 활성화되지 않은 경우해야 할 일 GIT 다운로드가 활성화되지 않은 경우해야 할 일 Apr 17, 2025 pm 04:54 PM

해결 : GIT 다운로드 속도가 느리면 다음 단계를 수행 할 수 있습니다. 네트워크 연결을 확인하고 연결 방법을 전환하십시오. GIT 구성 최적화 : 포스트 버퍼 크기를 늘리고 (GIT 구성-글로벌 http.postBuffer 524288000) 저속 제한 (git config --global http.lowspeedlimit 1000)을 줄입니다. git 프록시 (예 : git-proxy 또는 git-lfs-proxy)를 사용하십시오. 다른 git 클라이언트 (예 : Sourcetree 또는 Github 데스크탑)를 사용해보십시오. 화재 보호를 확인하십시오

PHP 프로젝트에서 효율적인 검색 문제를 해결하는 방법은 무엇입니까? Typesense는이를 달성하는 데 도움이됩니다! PHP 프로젝트에서 효율적인 검색 문제를 해결하는 방법은 무엇입니까? Typesense는이를 달성하는 데 도움이됩니다! Apr 17, 2025 pm 08:15 PM

전자 상거래 웹 사이트를 개발할 때 어려운 문제가 발생했습니다. 대량의 제품 데이터에서 효율적인 검색 기능을 달성하는 방법은 무엇입니까? 기존 데이터베이스 검색은 비효율적이며 사용자 경험이 좋지 않습니다. 일부 연구 후, 나는 검색 엔진 타입을 발견하고 공식 PHP 클라이언트 Typeense/Typeense-PHP를 통해이 문제를 해결하여 검색 성능을 크게 향상 시켰습니다.

GIT 프로젝트를 로컬로 다운로드하는 방법 GIT 프로젝트를 로컬로 다운로드하는 방법 Apr 17, 2025 pm 04:36 PM

GIT를 통해 로컬로 프로젝트를 다운로드하려면 다음 단계를 따르십시오. GIT를 설치하십시오. 프로젝트 디렉토리로 이동하십시오. 다음 명령을 사용하여 원격 저장소 클로닝 : git 클론 https://github.com/username/repository-name.git

Composer를 사용하여 WordPress 설치 및 업데이트의 복잡성을 해결하는 방법 Composer를 사용하여 WordPress 설치 및 업데이트의 복잡성을 해결하는 방법 Apr 17, 2025 pm 10:54 PM

WordPress 웹 사이트를 관리 할 때는 종종 설치, 업데이트 및 다중 사이트 변환과 같은 복잡한 작업이 발생합니다. 이러한 작업은 시간이 많이 걸릴뿐만 아니라 오류가 발생하기 쉬우므로 웹 사이트를 마비시킵니다. WP-CLI Core 명령을 Composer와 결합하면 이러한 작업을 크게 단순화하고 효율성과 안정성을 향상시킬 수 있습니다. 이 기사는 작곡가를 사용하여 이러한 문제를 해결하고 WordPress 관리의 편의성을 향상시키는 방법을 소개합니다.

git에서 코드를 업데이트하는 방법 git에서 코드를 업데이트하는 방법 Apr 17, 2025 pm 04:45 PM

GIT 코드를 업데이트하는 단계 : 코드 확인 : git 클론 https://github.com/username/repo.git 최신 변경 사항 가져 오기 : Git Fetch Merge 변경 사항 : GIT 병합 원산지/마스터 푸시 변경 (옵션) : Git Push Origin Master

git rebase를 사용하는 방법 git rebase를 사용하는 방법 Apr 17, 2025 pm 04:00 PM

Git Rebase는 기록을 정리하거나 가지를 재배치하기 위해 새로운 기준선에 커밋하는 데 사용됩니다. 사용 방법 : 대상 분기 생성 커밋을 선택하고 GIT Rebase 명령을 실행하고 실행하고, 대상 지점을 지정하고, 충돌을 해결하고, 나머지 커밋 확인 변경을 계속 다시 적용 할 수 있습니다.

See all articles