기술 주변기기 일체 포함 요가볼 위의 '개'를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.

요가볼 위의 '개'를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.

May 05, 2024 pm 01:01 PM
git 프로젝트 dreureka

로봇 개는 요가 볼 위를 꾸준하게 걷고 균형이 꽤 좋습니다.

요가볼 위의 개를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.

평평한 보도든 까다로운 잔디밭이든 다양한 장면을 처리할 수 있습니다.

요가볼 위의 개를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.

심지어 연구자들이 요가 공을 찼을 때 로봇 개는 넘어지지 않았습니다.

요가볼 위의 개를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.

로봇 개는 풍선을 수축할 때 균형을 유지할 수도 있었습니다.

요가볼 위의 개를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.

위 시연은 가속 처리 없이 모두 1배속입니다.
요가볼 위의 개를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.
  • 논문 주소: https://eureka-research.github.io/dr-eureka/assets/dreureka-paper.pdf
  • 프로젝트 홈페이지: https://github.com/eureka- 연구/DrEureka
  • 논문 제목: DrEureka: Language Model Guided Sim-To-Real Transfer

이 연구는 University of Pennsylvania, NVIDIA 및 University of Texas at Austin의 연구원들이 공동으로 작성했습니다. 이며 완전히 오픈 소스입니다. 그들은 LLM을 활용하여 보상 설계와 도메인 무작위 매개변수 구성을 구현하는 새로운 알고리즘인 DrEureka(Domain Randomized Eureka)를 제안했으며, 이는 시뮬레이션에서 현실로의 전환을 동시에 달성할 수 있습니다. 이 연구는 DrEureka 알고리즘이 반복적인 수동 설계 없이도 네 발 달린 로봇 균형 잡기, 요가 공 위 걷기 등 새로운 로봇 작업을 해결할 수 있는 능력을 보여줍니다.

DrEureka는 2023년 NVIDIA 프로젝트 상위 10개 중 하나로 선정된 Eureka를 기반으로 합니다. 유레카에 대한 자세한 내용은 "GPT-4를 통해 로봇이 펜 돌리기와 호두 접시 돌리기"를 참조하세요.

논문의 추상 부분에서 연구자들은 시뮬레이션에서 학습한 전략을 현실 세계에 적용하는 것이 로봇 기술의 대규모 습득을 위한 유망한 전략이라고 밝혔습니다. 그러나 시뮬레이션에서 현실로의 접근 방식은 작업 보상 기능과 시뮬레이션 물리적 매개변수를 수동으로 설계하고 조정하는 경우가 많아 프로세스가 느리고 노동 집약적입니다. 이 문서에서는 시뮬레이션에서 현실적인 설계까지 자동화하고 가속화하기 위해 LLM(대형 언어 모델)을 사용하는 방법을 조사합니다.

논문 저자 중 한 명이자 NVIDIA의 수석 과학자인 Jim Fan도 이 연구에 참여했습니다. 이전에 엔비디아는 구체화된 지능을 전문으로 하는 짐 팬(Jim Fan)이 이끄는 AI 연구소를 설립했습니다. Jim Fan은 다음과 같이 말했습니다.

"우리는 요가 공 위에서 균형을 잡고 걷기 위해 로봇 개를 훈련시켰습니다. 이것은 완전히 시뮬레이션으로 수행되었으며, 그런 다음 미세 조정 없이 샘플 없이 현실 세계로 전송되어 직접 달렸습니다.

요가 공을 걷는 작업은 탄력있는 공의 표면을 정확하게 시뮬레이션할 수 없기 때문에 로봇 강아지에게 특히 어렵습니다. 그러나 DrEureka는 시뮬레이션된 수많은 실제 구성을 쉽게 검색하여 로봇 강아지를 허용할 수 있습니다.

일반적으로 시뮬레이션에서 현실로의 전환은 도메인 무작위화를 통해 이루어집니다. 이는 로봇 전문가가 각 매개변수를 관찰하고 수동으로 수행해야 하는 지루한 과정입니다. 4 이러한 최첨단 LLM에는 마찰, 감쇠, 강성, 중력 등을 포함한 많은 물리적 직관이 내장되어 있습니다. GPT-4를 사용하면 DrEureka는 이러한 매개변수를 능숙하게 조정하고 추론을 잘 설명할 수 있습니다 》

요가볼 위의 개를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.

논문 소개

DrEureka 프로세스는 다음과 같습니다. 작업 및 안전 지침과 환경 소스 코드를 수용하고 Eureka를 실행하여 정규화된 보상 기능과 정책을 생성합니다. 그런 다음 다양한 시뮬레이션 조건에서 전략을 테스트하여 보상 인식 물리적 사전을 구성합니다. 이는 도메인 무작위화(DR) 매개변수 세트를 생성하기 위해 LLM에 공급됩니다. 마지막으로 실제 배포를 위해 합성된 보상과 DR 매개변수를 사용하여 정책을 학습합니다.
요가볼 위의 개를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.
유레카 보상 디자인. 보상 디자인 구성 요소는 단순성과 표현성 때문에 Eureka를 기반으로 하지만, 본 논문에서는 시뮬레이션에서 실제 환경으로의 적용성을 높이기 위해 몇 가지 개선 사항을 소개합니다. 의사코드는 다음과 같습니다:
요가볼 위의 개를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.
Reward recognition 물리 사전(RAPP, 보상 인식 물리 사전). 보안 보상 기능은 환경 선택을 수정하기 위해 정책 행동을 규제할 수 있지만 그 자체로는 시뮬레이션에서 현실로의 전환을 달성하기에는 충분하지 않습니다. 따라서 본 논문에서는 LLM의 기본 범위를 제한하기 위해 간단한 RAPP 메커니즘을 소개합니다.
요가볼 위의 개를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.
LLM은 도메인 무작위화에 사용됩니다. 각 DR 매개변수에 대한 RAPP 범위가 주어지면 DrEureka의 마지막 단계에서는 LLM에 RAPP 범위 제한 내에서 도메인 무작위 구성을 생성하도록 지시합니다. 구체적인 프로세스는 그림 3을 참조하세요.
요가볼 위의 개를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.
이 연구에서는 실험에 Unitree Go1을 사용합니다. Go1은 네 다리의 자유도가 12인 소형 4족 로봇입니다. 4족 보행 작업에서 이 논문은 또한 여러 실제 지형에서 DrEureka 정책의 성능을 체계적으로 평가하고 인간이 설계한 보상 및 DR 구성을 사용하여 훈련된 정책보다 강력하고 뛰어난 성능을 유지한다는 사실을 발견했습니다.
요가볼 위의 개를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.
자세한 내용은 원문을 참고해주세요.

위 내용은 요가볼 위의 '개'를 산책시키세요! 엔비디아의 10대 프로젝트 중 하나로 선정된 유레카(Eureka)는 새로운 돌파구를 마련했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Grayscale 암호화 신탁 기금은 무엇입니까? Grayscale 암호화 신탁 기금은 무엇입니까? Mar 05, 2025 pm 12:33 PM

Grayscale Investment : Grayscale Investment Company는 기관 및 투자자에게 디지털 통화 투자 서비스를 제공합니다. 이 회사는 몇 가지 암호화 신탁을 출시했으며, 이는 시장의 광범위한 시장의 관심을 끌었지만, 이러한 자금이 토큰 가격에 미치는 영향은 크게 다릅니다. 이 기사는 Grayscale의 주요 Crypto Trust Funds 중 일부를 자세히 소개합니다. Grayscale Major Crypto Trust Fund는 Glance Grayscale Investment (2013 년 DigitalCurrencygroup이 설립 한)에서 제공되는 다양한 암호화 자산 신탁 기금을 관리하여 기관 투자자와 고격한 개인에게 준수 투자 채널을 제공합니다. 주요 자금에는 다음이 포함됩니다 : Zcash (Zec), Sol,

비트 : 비즈니스는 비트 코인을 무시한 큰 추세를 구매합니다 비트 : 비즈니스는 비트 코인을 무시한 큰 추세를 구매합니다 Mar 05, 2025 pm 02:42 PM

주간 관찰 : 비트 코인을 비축하는 비즈니스 - 양조 변화는 종종 주간 메모에서 간과 된 시장 동향을 지적합니다. Microstrategy의 움직임은 뚜렷한 예입니다. 많은 사람들이 "Microstrategy와 Michaelsaylor는 이미 잘 알려져 있습니다. 이것은 무엇에주의를 기울일 것인가?" 이보기는 일방적입니다. 최근 몇 달 동안 비트 코인을 예비 자산으로 채택한 것에 대한 심층적 인 연구에 따르면 이것은 고립 된 사례가 아니라 가장 큰 추세임을 보여줍니다. 나는 향후 12-18 개월 동안 수백 개의 회사가 소송을 따르고 대량의 비트 코인을 구매할 것이라고 예측합니다.

SFT를 상당히 능가하는 O1/DeepSeek-R1의 비밀은 멀티 모달 대형 모델에서도 사용할 수 있습니다. SFT를 상당히 능가하는 O1/DeepSeek-R1의 비밀은 멀티 모달 대형 모델에서도 사용할 수 있습니다. Mar 12, 2025 pm 01:03 PM

상하이 Jiaotong University, Shanghai Ailab 및 Chinese University of Hong Kong의 연구원들은 Visual-RFT (Visual Enhancement Fine Tuning) 오픈 소스 프로젝트를 시작했으며, 이는 LVLM (Language Big Model)의 성능을 크게 향상시키기 위해 소량의 데이터 만 필요합니다. Visual-Rft는 영리하게 DeepSeek-R1의 규칙 기반 강화 학습 접근 방식을 OpenAI의 RFT (Rencement Fine Tuning) 패러다임과 결합 하여이 접근법을 텍스트 필드에서 시야로 성공적으로 확장합니다. Visual-RFT는 시각적 하위 분류 및 객체 감지와 같은 작업에 대한 해당 규칙 보상을 설계함으로써 텍스트, 수학적 추론 및 기타 필드로 제한되는 DeepSeek-R1 메소드의 한계를 극복하여 LVLM 교육을위한 새로운 방법을 제공합니다. Vis

GO에서 플로팅 포인트 번호 작업에 어떤 라이브러리가 사용됩니까? GO에서 플로팅 포인트 번호 작업에 어떤 라이브러리가 사용됩니까? Apr 02, 2025 pm 02:06 PM

Go Language의 부동 소수점 번호 작동에 사용되는 라이브러리는 정확도를 보장하는 방법을 소개합니다.

GO의 어떤 라이브러리가 대기업에서 개발하거나 잘 알려진 오픈 소스 프로젝트에서 제공합니까? GO의 어떤 라이브러리가 대기업에서 개발하거나 잘 알려진 오픈 소스 프로젝트에서 제공합니까? Apr 02, 2025 pm 04:12 PM

GO의 어떤 라이브러리가 대기업이나 잘 알려진 오픈 소스 프로젝트에서 개발 했습니까? GO에 프로그래밍 할 때 개발자는 종종 몇 가지 일반적인 요구를 만납니다.

Binance 런치 풀 란 무엇입니까? Binance 런치 풀에 참여하는 방법은 무엇입니까? Binance 런치 풀 란 무엇입니까? Binance 런치 풀에 참여하는 방법은 무엇입니까? Mar 05, 2025 pm 03:06 PM

BINANCE LANCHPOOL 심층 분석 : 고수익 마이닝 가이드 및 바이오 프로젝트에 대한 자세한 설명은 Binance LaunchPool에 대한 심층적 인 토론을 수행하고 참여 방법을 자세히 설명하며 최신 프로젝트 Bio Coin (BIOL)을 소개하는 데 집중할 것입니다. Binance는 세계 최대의 cryptocurrency 거래소로서 LaunchPool과 함께 고품질 프로젝트를 선택하여 투자자에게 쉬운 광업과 새로운 토큰을 얻을 수있는 기회를 제공했습니다. Binance 런치 풀 란 무엇입니까? Binance Launchpool은 지정된 통화를 맹세하여 무료로 새로운 토큰을 얻는 플랫폼입니다. 이는 주식 시장의 새로운 주식 가입과 유사하지만 참가자는 적고 경쟁이 적고 소규모 투자도 높은 수익을 얻을 수 있습니다.

해외 버전의 배송 지역 데이터를 얻는 방법은 무엇입니까? 기성품 리소스는 무엇입니까? 해외 버전의 배송 지역 데이터를 얻는 방법은 무엇입니까? 기성품 리소스는 무엇입니까? Apr 01, 2025 am 08:15 AM

질문 설명 : 해외 버전의 배송 지역 데이터를 얻는 방법은 무엇입니까? 기성품 자원이 있습니까? 국경 간 전자 상거래 또는 세계화 된 비즈니스에서 정확하게 ...

Gitee Pages 정적 웹 사이트 배포 실패 : 단일 파일 문제를 해결하고 해결하는 방법 404 오류? Gitee Pages 정적 웹 사이트 배포 실패 : 단일 파일 문제를 해결하고 해결하는 방법 404 오류? Apr 04, 2025 pm 11:54 PM

GiteEpages 정적 웹 사이트 배포 실패 : 404 오류 문제 해결 및 해결시 Gitee ...

See all articles