목차
로봇 일상 응용의 첫 번째 단계: 이전에 본 적 없는 작업을 직접 수행할 수 있습니다.
데이터가 충분하지 않나요? 직접 만들어 보세요
구글 로봇 하면
기술 주변기기 일체 포함 Google DeepMind 로봇이 세 가지 결과를 연속으로 공개했습니다! 두 가지 기능 모두 완전히 향상되었으며 데이터 수집 시스템은 동시에 20대의 로봇을 관리할 수 있습니다.

Google DeepMind 로봇이 세 가지 결과를 연속으로 공개했습니다! 두 가지 기능 모두 완전히 향상되었으며 데이터 수집 시스템은 동시에 20대의 로봇을 관리할 수 있습니다.

Jan 11, 2024 pm 10:36 PM
ai 기차

스탠퍼드의 '새우튀김 및 설거지' 로봇과 거의 동시에 Google DeepMind도 최신 구체화된 지능 결과를 발표했습니다.

Google DeepMind 로봇이 세 가지 결과를 연속으로 공개했습니다! 두 가지 기능 모두 완전히 향상되었으며 데이터 수집 시스템은 동시에 20대의 로봇을 관리할 수 있습니다.

3연속 촬영입니다.

첫째, 의사결정 속도 향상에 초점을 맞춘 새로운 모델로 로봇의 작동 속도(원래 Robotics Transformer 대비) 14% 향상 - 빠르면서도 품질은 저하되지 않았으며 정확도는 10.6% 증가했습니다.

Google DeepMind 로봇이 세 가지 결과를 연속으로 공개했습니다! 두 가지 기능 모두 완전히 향상되었으며 데이터 수집 시스템은 동시에 20대의 로봇을 관리할 수 있습니다.

그런 다음 로봇의 모션 궤적 프롬프트를 생성하여 이전에는 볼 수 없었던 41가지 작업에 직면하고 63%의 성공률을 달성할 수 있는 일반화 기능을 전문으로 하는 새로운 프레임워크 가 있습니다.

Google DeepMind 로봇이 세 가지 결과를 연속으로 공개했습니다! 두 가지 기능 모두 완전히 향상되었으며 데이터 수집 시스템은 동시에 20대의 로봇을 관리할 수 있습니다.

이 배열을 과소평가하지 마세요. 이전 29%에 비해 개선폭이 상당히 큽니다.

마지막은 로봇 데이터 수집 시스템으로, 한 번에 20개의 로봇을 관리할 수 있습니다. 지금까지 수집된 실험 데이터는 Google이 후속 교육 작업을 더 잘 완료하는 데 도움이 됩니다.

Google DeepMind 로봇이 세 가지 결과를 연속으로 공개했습니다! 두 가지 기능 모두 완전히 향상되었으며 데이터 수집 시스템은 동시에 20대의 로봇을 관리할 수 있습니다.

그렇다면 이 세 가지 결과는 구체적으로 무엇인가요? 하나씩 살펴보겠습니다.

로봇 일상 응용의 첫 번째 단계: 이전에 본 적 없는 작업을 직접 수행할 수 있습니다.

Google은 실제로 현실 세계에 들어갈 수 있는 로봇을 구현하려면 두 가지 기본적인 과제를 해결해야 한다고 지적했습니다.

1. 새로운 작업 추진 능력

2. 의사결정 속도 향상

이 3부작 시리즈의 처음 두 가지 결과는 주로 이 두 가지 영역의 개선이며, 둘 다 Google의 기본 로봇 모델인 Robotics Transformer를 기반으로 합니다. RT)로 약칭합니다.

먼저 첫 번째를 살펴보겠습니다.

RT-Trajectory는 로봇을 일반화하는 데 도움이 됩니다.

사람에게는 테이블 청소 같은 일이 이해하기 쉽지만, 로봇은 잘 이해하지 못합니다.

다행히도 다양한 방법으로 이 명령을 전달할 수 있어 실제 물리적 행동을 취할 수 있습니다.

일반적으로 전통적인 방법은 작업을 특정 동작으로 매핑한 다음 로봇 팔이 완료하도록 하는 것입니다. 예를 들어 테이블을 닦는 것은 "클램프 닫기, 왼쪽으로 이동, 오른쪽으로 이동"으로 나눌 수 있습니다. "

분명히 이 방법의 일반화 능력은 매우 낮습니다.

여기서 Google이 새로 제안한 RT-Trajectory는 로봇에게 시각적 신호를 제공하여 작업을 완료하도록 가르칩니다.

Google DeepMind 로봇이 세 가지 결과를 연속으로 공개했습니다! 두 가지 기능 모두 완전히 향상되었으며 데이터 수집 시스템은 동시에 20대의 로봇을 관리할 수 있습니다.

특히 RT-Trajectory로 제어되는 로봇은 훈련 중에 2D 궤적 강화 데이터를 추가합니다.

이러한 궤적은 경로 및 주요 지점을 포함하여 RGB 이미지로 표시되어 로봇이 작업 수행 방법을 학습할 때 낮은 수준이지만 매우 유용한 힌트를 제공합니다.

이 모델을 사용하면 이전에 볼 수 없었던 작업을 수행하는 로봇의 성공률이 최대 1배나 직접적으로 향상되었습니다

(Google의 기본 로봇 모델인 RT-2 대비, 29% => 63%) .

더 언급할 가치가 있는 점은 RT-Trajectory가

사람의 시연을 관찰하고, 손으로 그린 ​​스케치를 받아들이고, VLM
(Visual Language Model)을 통해 생성하는 등 다양한 방식으로 궤적을 생성할 수 있다는 것입니다.

Google DeepMind 로봇이 세 가지 결과를 연속으로 공개했습니다! 두 가지 기능 모두 완전히 향상되었으며 데이터 수집 시스템은 동시에 20대의 로봇을 관리할 수 있습니다.

일상 로봇화의 두 번째 단계: 의사결정 속도가 빨라야 합니다

일반화 능력이 향상되면 의사결정 속도에 집중하겠습니다.

Google의 RT 모델은 Transformer 아키텍처를 사용합니다. Transformer는 강력하지만 2차 복잡성을 지닌 Attention 모듈에 크게 의존합니다.

따라서 RT 모델에 대한 입력이 두 배가 되면

(예: 로봇에 고해상도 센서 장착) 이를 처리하는 데 필요한 계산 리소스가 4배로 늘어나 결정 속도가 심각하게 느려집니다. - 만드는 속도.

로봇의 속도를 향상시키기 위해 Google은 기본 모델인 Robotics Transformer에

SARA-RT를 개발했습니다.

SARA-RT는 새로운 모델 미세 조정 방법을 사용하여 원래 RT 모델을 더욱 효율적으로 만듭니다.

이 방법을 Google에서는 '업 트레이닝'이라고 합니다. 주요 기능은 처리 품질을 유지하면서 원래 2차 복잡도를 선형 복잡도로 변환하는 것입니다.

수십억 개의 매개변수가 있는 RT-2 모델에 SARA-RT를 적용하면 후자는 다양한 작업에서 더 빠른 작업 속도와 더 높은 정확도를 달성할 수 있습니다.

SARA-RT가 값비싼 사전 훈련 없이 Transformer를 가속할 수 있는 universal 방법을 제공하므로 잘 홍보할 수 있다는 점도 언급할 가치가 있습니다.

데이터가 충분하지 않나요? 직접 만들어 보세요

마지막으로 인간이 할당한 작업을 로봇이 더 잘 이해할 수 있도록 Google도 데이터에서 시작하여 직접 수집 시스템인 AutoRT를 구축했습니다.

이 시스템은 대형 모델(LLM 및 VLM 포함) 을 로봇 제어 모델(RT) 과 결합하여 로봇이 현실 세계에서 다양한 작업을 수행하도록 지속적으로 지시함으로써 데이터를 생성하고 수집합니다.

구체적인 과정은 다음과 같습니다.

로봇이 환경에 "자유롭게" 접촉하고 대상에 가까워지도록 합니다.

그런 다음 카메라와 VLM 모델을 사용하여 특정 항목을 포함하여 앞에 있는 장면을 설명하세요.

그런 다음 LLM은 이 정보를 사용하여 여러 가지 다른 작업을 생성합니다.

생성된 후 로봇이 즉시 실행되지는 않습니다. 대신 LLM을 사용하여 독립적으로 완료할 수 있는 작업, 사람의 원격 제어가 필요한 작업, 완료할 수 없는 작업을 필터합니다. 모두.

"감자칩 봉지를 여는 것"은 두 개의 로봇 팔(기본적으로 1개만)이 필요하기 때문에 할 수 없는 일입니다.

Google DeepMind 로봇이 세 가지 결과를 연속으로 공개했습니다! 두 가지 기능 모두 완전히 향상되었으며 데이터 수집 시스템은 동시에 20대의 로봇을 관리할 수 있습니다.

그러면 이 심사 작업을 완료한 후 로봇이 실제로 이를 수행할 수 있습니다.

마지막으로 AutoRT 시스템은 데이터 수집을 완료하고 다양성 평가를 수행합니다.

보고서에 따르면 AutoRT는 한 번에 최대 20개의 로봇을 조정할 수 있으며 7개월 동안 6,650개의 고유 작업을 포함하여 총 77,000개의 테스트 데이터가 수집되었습니다.

마지막으로 이 시스템에 대해 Google은 보안도 강조합니다.

결국 AutoRT의 수집 작업은 현실 세계에 적용되며 '안전 가드레일'은 필수입니다.

특히 로봇의 작업을 검사하는 LLM에서 제공하는 기본 안전 코드는 부분적으로 아이작 아시모프(Isaac Asimov)의 로봇공학 3원칙에서 영감을 받았습니다. 무엇보다도 "로봇은 인간에게 해를 끼치면 안 됩니다."

두 번째 요구 사항은 다음과 같습니다. 로봇은 사람, 동물, 날카로운 물체 또는 전기 제품과 관련된 작업을 시도해서는 안 됩니다

그러나 이것만으로는 충분하지 않습니다

그래서 AutoRT는 일반 로봇 공학에서 여러 층의 실용적인 안전 조치도 갖추고 있습니다. 관절에 가해지는 힘이 주어진 임계값을 초과하고, 인간의 시야 내에 있는 물리적 스위치로 모든 작업을 중지할 수 있습니다.

Google DeepMind 로봇이 세 가지 결과를 연속으로 공개했습니다! 두 가지 기능 모두 완전히 향상되었으며 데이터 수집 시스템은 동시에 20대의 로봇을 관리할 수 있습니다. Google의 최신 결과에 대해 더 알고 싶으십니까?

좋은 소식이 있나요? 논문만 게재하는 RT-Trajectory의 경우 나머지는 코드 및 논문과 함께 게재됩니다. 모두들 확인해보세요~

One More Thing

구글 로봇 하면

RT-2

(이 기사의 모든 결과도 기반으로 함) . 이 모델은 54명의 Google 연구원이 7개월에 걸쳐 구축하여 올해 7월 말에 출시되었습니다.

비주얼-텍스트 다중 모드 모델 VLM이 내장되어 있습니다. . , "인간의 말"을 이해할 수 있을 뿐만 아니라 "인간의 말"에 대해 추론하고 세 가지 플라스틱 장난감인 사자, 고래,

Google DeepMind 로봇이 세 가지 결과를 연속으로 공개했습니다! 두 가지 기능 모두 완전히 향상되었으며 데이터 수집 시스템은 동시에 20대의 로봇을 관리할 수 있습니다. 오늘은 불과 5개월 만에 일반화 능력과 의사결정 속도가 급격히 향상되었습니다. 한숨을 쉬지 않을 수 없습니다. 로봇이 그런 모습을 보일 것이라고는 상상할 수 없습니다. 과연 수천 가구에 얼마나 빠른 속도로 세상으로 돌진할 것인가?

위 내용은 Google DeepMind 로봇이 세 가지 결과를 연속으로 공개했습니다! 두 가지 기능 모두 완전히 향상되었으며 데이터 수집 시스템은 동시에 20대의 로봇을 관리할 수 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

vue.js의 객체로 문자열을 변환하는 데 어떤 방법이 사용됩니까? vue.js의 객체로 문자열을 변환하는 데 어떤 방법이 사용됩니까? Apr 07, 2025 pm 09:39 PM

표준 JSON 문자열의 경우 vue.js의 객체로 문자열을 변환 할 때 JSON.PARSE ()가 선호됩니다. 비표준 JSON 문자열의 경우, 정규 표현식을 사용하여 문자열을 처리하고 형식 또는 디코딩 된 URL 인코딩에 따라 방법을 줄일 수 있습니다. 문자열 형식에 따라 적절한 방법을 선택하고 버그를 피하기 위해 보안 및 인코딩 문제에주의를 기울이십시오.

설치 후 MySQL을 사용하는 방법 설치 후 MySQL을 사용하는 방법 Apr 08, 2025 am 11:48 AM

이 기사는 MySQL 데이터베이스의 작동을 소개합니다. 먼저 MySQLworkBench 또는 명령 줄 클라이언트와 같은 MySQL 클라이언트를 설치해야합니다. 1. MySQL-Uroot-P 명령을 사용하여 서버에 연결하고 루트 계정 암호로 로그인하십시오. 2. CreateABase를 사용하여 데이터베이스를 작성하고 데이터베이스를 선택하십시오. 3. CreateTable을 사용하여 테이블을 만들고 필드 및 데이터 유형을 정의하십시오. 4. InsertInto를 사용하여 데이터를 삽입하고 데이터를 쿼리하고 업데이트를 통해 데이터를 업데이트하고 DELETE를 통해 데이터를 삭제하십시오. 이러한 단계를 마스터하고 일반적인 문제를 처리하는 법을 배우고 데이터베이스 성능을 최적화하면 MySQL을 효율적으로 사용할 수 있습니다.

vue.js 문자열 유형 배열을 객체 배열로 변환하는 방법은 무엇입니까? vue.js 문자열 유형 배열을 객체 배열로 변환하는 방법은 무엇입니까? Apr 07, 2025 pm 09:36 PM

요약 : vue.js 문자열 배열을 객체 배열로 변환하는 다음 방법이 있습니다. 기본 메소드 : 정기적 인 형식의 데이터에 맞게 맵 함수를 사용하십시오. 고급 게임 플레이 : 정규 표현식을 사용하면 복잡한 형식을 처리 할 수 ​​있지만 신중하게 작성하고 고려해야합니다. 성능 최적화 : 많은 양의 데이터를 고려하면 비동기 작업 또는 효율적인 데이터 처리 라이브러리를 사용할 수 있습니다. 모범 사례 : 명확한 코드 스타일, 의미있는 변수 이름과 주석을 사용하여 코드를 간결하게 유지하십시오.

Vue Axios의 시간 초과를 설정하는 방법 Vue Axios의 시간 초과를 설정하는 방법 Apr 07, 2025 pm 10:03 PM

vue axios의 타임 아웃을 설정하려면 axios 인스턴스를 생성하고 시간 초과 옵션을 지정할 수 있습니다. 글로벌 설정에서 : vue.prototype. $ axios = axios.create ({timeout : 5000}); 단일 요청 : this. $ axios.get ( '/api/user', {timeout : 100000}).

Laravel 's geospatial : 대화식지도의 최적화 및 많은 양의 데이터 Laravel 's geospatial : 대화식지도의 최적화 및 많은 양의 데이터 Apr 08, 2025 pm 12:24 PM

7 백만 레코드를 효율적으로 처리하고 지리 공간 기술로 대화식지도를 만듭니다. 이 기사는 Laravel과 MySQL을 사용하여 7 백만 개 이상의 레코드를 효율적으로 처리하고 대화식지도 시각화로 변환하는 방법을 살펴 봅니다. 초기 챌린지 프로젝트 요구 사항 : MySQL 데이터베이스에서 7 백만 레코드를 사용하여 귀중한 통찰력을 추출합니다. 많은 사람들이 먼저 프로그래밍 언어를 고려하지만 데이터베이스 자체를 무시합니다. 요구 사항을 충족시킬 수 있습니까? 데이터 마이그레이션 또는 구조 조정이 필요합니까? MySQL이 큰 데이터로드를 견딜 수 있습니까? 예비 분석 : 주요 필터 및 속성을 식별해야합니다. 분석 후, 몇 가지 속성만이 솔루션과 관련이 있음이 밝혀졌습니다. 필터의 타당성을 확인하고 검색을 최적화하기위한 제한 사항을 설정했습니다. 도시를 기반으로 한지도 검색

MySQL을 해결하는 방법을 시작할 수 없습니다 MySQL을 해결하는 방법을 시작할 수 없습니다 Apr 08, 2025 pm 02:21 PM

MySQL 시작이 실패하는 데는 여러 가지 이유가 있으며 오류 로그를 확인하여 진단 할 수 있습니다. 일반적인 원인에는 포트 충돌 (포트 점유 체크 및 구성 수정), 권한 문제 (서비스 실행 사용자 권한 실행), 구성 파일 오류 (파라미터 설정 확인), 데이터 디렉토리 손상 (데이터 복원 또는 테이블 공간 재건), IBDATA 테이블 공간 문제 (IBDATA1 파일 확인), 플러그로드 (확인 오류 로그)가 포함됩니다. 문제를 해결할 때 오류 로그를 기반으로 문제를 분석하고 문제의 근본 원인을 찾고 문제를 방지하고 해결하기 위해 정기적으로 데이터를 백업하는 습관을 개발해야합니다.

MySQL 설치 후 데이터베이스 성능을 최적화하는 방법 MySQL 설치 후 데이터베이스 성능을 최적화하는 방법 Apr 08, 2025 am 11:36 AM

MySQL 성능 최적화는 설치 구성, 인덱싱 및 쿼리 최적화, 모니터링 및 튜닝의 세 가지 측면에서 시작해야합니다. 1. 설치 후 innodb_buffer_pool_size 매개 변수와 같은 서버 구성에 따라 my.cnf 파일을 조정해야합니다. 2. 과도한 인덱스를 피하기 위해 적절한 색인을 작성하고 Execution 명령을 사용하여 실행 계획을 분석하는 것과 같은 쿼리 문을 최적화합니다. 3. MySQL의 자체 모니터링 도구 (showprocesslist, showstatus)를 사용하여 데이터베이스 건강을 모니터링하고 정기적으로 백업 및 데이터베이스를 구성하십시오. 이러한 단계를 지속적으로 최적화함으로써 MySQL 데이터베이스의 성능을 향상시킬 수 있습니다.

원격 선임 백엔드 엔지니어 (플랫폼)에는 원이 필요합니다 원격 선임 백엔드 엔지니어 (플랫폼)에는 원이 필요합니다 Apr 08, 2025 pm 12:27 PM

원격 선임 백엔드 엔지니어 구직 회사 : 원 위치 : 원격 사무실 직무 유형 : 전임 급여 : $ 130,000- $ 140,000 직무 설명 전체 소프트웨어 개발 라이프 사이클을 다루는 Circle Mobile 애플리케이션 및 공개 API 관련 기능의 연구 및 개발에 참여합니다. 주요 책임은 독립적으로 Rubyonrails를 기반으로 개발 작업을 완료하고 React/Redux/Relay 프론트 엔드 팀과 협력합니다. 웹 애플리케이션의 핵심 기능 및 개선을 구축하고 기능 설계 프로세스 전반에 걸쳐 설계자 및 리더십과 긴밀히 협력하십시오. 긍정적 인 개발 프로세스를 촉진하고 반복 속도를 우선시하십시오. 6 년 이상의 복잡한 웹 애플리케이션 백엔드가 필요합니다.

See all articles