목차
문제 설정
다양한 경험에서 배우기
분류 성능
결론 및 향후 작업 전망
기술 주변기기 일체 포함 구글이 강화 학습을 사용해 쓰레기 분류를 돕는 로봇 23대를 만드는 데 2년이 걸렸습니다.

구글이 강화 학습을 사용해 쓰레기 분류를 돕는 로봇 23대를 만드는 데 2년이 걸렸습니다.

May 09, 2023 pm 03:01 PM
ai 쓰레기 분류

강화 학습(RL)을 통해 로봇은 시행착오를 통해 상호 작용하고, 복잡한 행동을 학습하며, 시간이 지남에 따라 점점 더 좋아질 수 있습니다. Google의 이전 연구에서는 RL을 통해 로봇이 쥐기, 다중 작업 학습, 심지어 탁구와 같은 복잡한 기술을 습득할 수 있는 방법을 탐구했습니다. 로봇의 강화 학습이 큰 진전을 이루었지만 일상 환경에서 강화 학습을 수행하는 로봇은 아직 보이지 않습니다. 현실 세계는 복잡하고 다양하며 시간이 지남에 따라 끊임없이 변화하기 때문에 이는 로봇 시스템에 큰 과제를 안겨줍니다. 그러나 강화 학습은 이러한 과제를 해결하기 위한 훌륭한 도구여야 합니다. 로봇은 현장에서 연습하고, 개선하고, 학습함으로써 끊임없이 변화하는 세상에 적응할 수 있어야 합니다.

Google 논문 "Deep RL at Scale: Sorting Waste in Office Buildings with a Fleet of Mobile Manipulators"에서 연구원들은 2년에 걸쳐 진행한 최신 대규모 실험을 통해 이 문제를 해결하는 방법을 탐구합니다. 23개의 RL 지원 로봇 그룹이 Google 사무실 건물의 쓰레기 분류 및 재활용에 사용됩니다. 사용된 로봇 시스템은 실제 데이터의 확장 가능한 심층 강화 학습과 시뮬레이션 훈련의 안내 및 보조 객체 인식 입력을 결합하여 일반화를 개선하는 동시에 검증을 위한 4800회의 평가 시험 이점을 유지합니다.

구글이 강화 학습을 사용해 쓰레기 분류를 돕는 로봇 23대를 만드는 데 2년이 걸렸습니다.

문서 주소: https://rl-at-scale.github.io/assets/rl_at_scale.pdf

문제 설정

사람들이 쓰레기를 올바르게 분류하지 않으면, 재활용품이 오염될 수 있고 퇴비가 매립지에 부적절하게 폐기될 수 있습니다. Google의 실험에서 로봇은 "쓰레기통"(재활용 쓰레기통, 퇴비통 및 기타 쓰레기통)을 찾기 위해 사무실 건물 주변을 돌아 다녔습니다. 로봇의 임무는 각 쓰레기 처리장에 도착하여 쓰레기를 분류하고, 모든 재활용 품목(캔, 병)을 재활용 쓰레기통에 넣고 모든 퇴비화 가능 품목(판지 용기, 종이컵)을 퇴비통에 넣기 위해 여러 쓰레기통 간에 물품을 운반하는 것입니다. 다른 쓰레기통에 있는 다른 모든 것.

사실 이 작업은 생각보다 쉽지 않습니다. 사람들이 쓰레기통에 버리는 다양한 물건을 줍는 하위 작업은 이미 큰 도전입니다. 로봇은 또한 각 물체에 적합한 상자를 식별하고 가능한 한 빠르고 효율적으로 분류해야 합니다. 현실 세계에서 로봇은 다음과 같은 실제 사무실 건물의 예와 같이 다양하고 독특한 상황에 직면합니다.

다양한 경험에서 배우기

직장에서 지속적인 학습이 도움이 되지만, 이 지점에 도달하기 전에 이전에는 로봇을 안내하려면 기본 기술이 필요했습니다. 이를 위해 Google은 네 가지 경험 소스를 사용합니다. (1) 성공률은 낮지만 초기 경험을 제공하는 데 도움이 되는 간단한 수작업 설계 전략 (2) 시뮬레이션에서 실제로의 전환을 사용하여 일부를 제공하는 시뮬레이션 교육 프레임워크 예비 경험, 쓰레기 분류 전략; (3) 로봇이 대표적인 쓰레기 처리장을 사용하여 지속적으로 연습하는 "로봇 교실", (4) 로봇이 실제 쓰레기가 있는 사무실 건물에서 연습하는 실제 배치 환경.

구글이 강화 학습을 사용해 쓰레기 분류를 돕는 로봇 23대를 만드는 데 2년이 걸렸습니다.

이 대규모 애플리케이션에서 강화 학습의 개략도. 스크립트 생성 데이터를 사용하여 정책 실행을 안내합니다(왼쪽 상단). 그런 다음 시뮬레이션-실제 모델이 훈련되어 시뮬레이션 환경(오른쪽 상단)에서 추가 데이터를 생성합니다. 각 배포 주기 동안 '로봇 교실'(오른쪽 하단)에서 수집된 데이터를 추가합니다. 사무실 건물에 데이터 배포 및 수집(왼쪽 하단).

여기에 사용된 강화 학습 프레임워크는 QT-Opt를 기반으로 하며, 실험실 환경에서 다양한 쓰레기를 포착하는 데에도 사용되며 일련의 기타 기술도 사용됩니다. 시뮬레이션 환경을 안내하는 간단한 스크립팅 전략으로 시작하고, 강화 학습을 적용하고, RetinaGAN을 사용하여 CycleGAN 기반 전송 방법을 사용하여 시뮬레이션 이미지를 더욱 현실적으로 보이게 만듭니다.

여기서 "로봇 교실"에 입장하기 시작합니다. 실제 사무실 건물은 가장 현실적인 경험을 제공하지만 데이터 수집 처리량은 제한되어 있습니다. 어떤 날에는 분류해야 할 쓰레기가 많을 것이고 어떤 날에는 그렇지 않을 것입니다. 로봇은 '로봇교실'에서 대부분의 경험을 쌓아왔다. 아래의 "로봇 교실"에는 20대의 로봇이 쓰레기 분류 작업을 연습하고 있습니다.

구글이 강화 학습을 사용해 쓰레기 분류를 돕는 로봇 23대를 만드는 데 2년이 걸렸습니다.

이 로봇들이 "로봇 교실"에서 훈련을 받는 동안, 다른 로봇들은 3개의 사무실 건물에서 30개의 쓰레기를 분류하고 있습니다. 서있는 동안.

분류 성능

최종적으로 연구진은 '로봇 교실'에서 540,000개의 실험 데이터를, 실제 배포 환경에서 325,000개의 실험 데이터를 수집했습니다. 데이터가 지속적으로 증가함에 따라 전체 시스템의 성능이 향상됩니다. 연구원들은 제어된 비교가 가능하도록 "로봇 교실"의 최종 시스템을 평가하고 로봇이 실제 배포에서 볼 수 있는 내용을 기반으로 시나리오를 설정했습니다. 최종 시스템은 약 84%의 평균 정확도를 달성했으며, 데이터가 추가됨에 따라 성능이 꾸준히 향상되었습니다. 실제로 연구원들은 2021년부터 2022년까지 실제 배포에 대한 통계를 문서화했으며 이 시스템이 쓰레기통의 오염 물질을 중량 기준으로 40~50% 줄일 수 있다는 사실을 발견했습니다. Google 연구원들은 논문에서 기술 설계에 대한 더 깊은 통찰력, 다양한 설계 결정의 감쇠에 대한 연구, 실험에서 얻은 더 자세한 통계를 제공합니다.

결론 및 향후 작업 전망

실험 결과는 강화 학습 기반 시스템을 통해 로봇이 실제 사무실 환경에서 실제 작업을 처리할 수 있음을 보여줍니다. 오프라인과 온라인 데이터의 결합을 통해 로봇은 현실 세계의 매우 다양한 상황에 적응할 수 있습니다. 동시에 시뮬레이션 환경과 실제 환경을 포함하여 보다 통제된 "교실" 환경에서 학습하면 강화 학습의 "플라이휠"이 회전을 시작하여 적응성을 달성할 수 있는 강력한 시작 메커니즘을 제공할 수 있습니다.

중요한 결과를 얻었지만 아직 해야 할 일이 많습니다. 최종 강화 학습 전략이 항상 성공적인 것은 아니며, 성능을 개선하고 더 넓은 범위의 작업 범위로 확장하려면 더 강력한 모델이 필요합니다. . 또한 다른 작업, 다른 로봇, 심지어 인터넷 비디오를 포함한 다른 경험 소스도 시뮬레이션과 "교실"에서 얻은 시작 경험을 더욱 보완할 수 있습니다. 앞으로 해결해야 할 문제들입니다.

위 내용은 구글이 강화 학습을 사용해 쓰레기 분류를 돕는 로봇 23대를 만드는 데 2년이 걸렸습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. 크로스 플레이가 있습니까?
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Centos Shutdown 명령 줄 Centos Shutdown 명령 줄 Apr 14, 2025 pm 09:12 PM

CentOS 종료 명령은 종료이며 구문은 종료 [옵션] 시간 [정보]입니다. 옵션은 다음과 같습니다. -H 시스템 중지 즉시 옵션; -P 종료 후 전원을 끕니다. -R 다시 시작; -대기 시간. 시간은 즉시 (현재), 분 (분) 또는 특정 시간 (HH : MM)으로 지정할 수 있습니다. 추가 정보는 시스템 메시지에 표시 될 수 있습니다.

Centos에서 Gitlab의 백업 방법은 무엇입니까? Centos에서 Gitlab의 백업 방법은 무엇입니까? Apr 14, 2025 pm 05:33 PM

CentOS 시스템 하에서 Gitlab의 백업 및 복구 정책 데이터 보안 및 복구 가능성을 보장하기 위해 CentOS의 Gitlab은 다양한 백업 방법을 제공합니다. 이 기사는 완전한 GITLAB 백업 및 복구 전략을 설정하는 데 도움이되는 몇 가지 일반적인 백업 방법, 구성 매개 변수 및 복구 프로세스를 자세히 소개합니다. 1. 수동 백업 gitlab-rakegitlab : 백업 : 명령을 작성하여 수동 백업을 실행하십시오. 이 명령은 gitlab 저장소, 데이터베이스, 사용자, 사용자 그룹, 키 및 권한과 같은 주요 정보를 백업합니다. 기본 백업 파일은/var/opt/gitlab/backups 디렉토리에 저장됩니다. /etc /gitlab을 수정할 수 있습니다

Centos HDFS 구성을 확인하는 방법 Centos HDFS 구성을 확인하는 방법 Apr 14, 2025 pm 07:21 PM

CentOS 시스템에서 HDFS 구성 확인에 대한 완전한 안내서이 기사에서는 CentOS 시스템에서 HDF의 구성 및 실행 상태를 효과적으로 확인하는 방법을 안내합니다. 다음 단계는 HDF의 설정 및 작동을 완전히 이해하는 데 도움이됩니다. Hadoop 환경 변수 확인 : 먼저 Hadoop 환경 변수가 올바르게 설정되어 있는지 확인하십시오. 터미널에서 다음 명령을 실행하여 Hadoop이 올바르게 설치되고 구성되었는지 확인하십시오. Hadoopversion Check HDFS 구성 파일 : HDFS의 Core 구성 파일은/etc/hadoop/conf/directory에 있으며 Core-Site.xml 및 HDFS-Site.xml이 중요합니다. 사용

Centos에서 Zookeeper의 성능을 조정하는 방법은 무엇입니까? Centos에서 Zookeeper의 성능을 조정하는 방법은 무엇입니까? Apr 14, 2025 pm 03:18 PM

CentOS에 대한 Zookeeper Performance Tuning은 하드웨어 구성, 운영 체제 최적화, 구성 매개 변수 조정, 모니터링 및 유지 관리 등 여러 측면에서 시작할 수 있습니다. 특정 튜닝 방법은 다음과 같습니다. SSD는 하드웨어 구성에 권장됩니다. Zookeeper의 데이터는 디스크에 작성되므로 SSD를 사용하여 I/O 성능을 향상시키는 것이 좋습니다. 충분한 메모리 : 자주 디스크 읽기 및 쓰기를 피하기 위해 충분한 메모리 리소스를 동물원에 충분한 메모리 자원을 할당하십시오. 멀티 코어 CPU : 멀티 코어 CPU를 사용하여 Zookeeper가이를 병렬로 처리 할 수 ​​있도록하십시오.

Centos에서 Pytorch에 대한 GPU 지원은 어떻습니까? Centos에서 Pytorch에 대한 GPU 지원은 어떻습니까? Apr 14, 2025 pm 06:48 PM

CentOS 시스템에서 Pytorch GPU 가속도를 활성화하려면 Cuda, Cudnn 및 GPU 버전의 Pytorch를 설치해야합니다. 다음 단계는 프로세스를 안내합니다. CUDA 및 CUDNN 설치 CUDA 버전 호환성 결정 : NVIDIA-SMI 명령을 사용하여 NVIDIA 그래픽 카드에서 지원하는 CUDA 버전을보십시오. 예를 들어, MX450 그래픽 카드는 CUDA11.1 이상을 지원할 수 있습니다. Cudatoolkit 다운로드 및 설치 : NVIDIACUDATOOLKIT의 공식 웹 사이트를 방문하여 그래픽 카드에서 지원하는 가장 높은 CUDA 버전에 따라 해당 버전을 다운로드하여 설치하십시오. CUDNN 라이브러리 설치 :

Docker 원리에 대한 자세한 설명 Docker 원리에 대한 자세한 설명 Apr 14, 2025 pm 11:57 PM

Docker는 Linux 커널 기능을 사용하여 효율적이고 고립 된 응용 프로그램 실행 환경을 제공합니다. 작동 원리는 다음과 같습니다. 1. 거울은 읽기 전용 템플릿으로 사용되며, 여기에는 응용 프로그램을 실행하는 데 필요한 모든 것을 포함합니다. 2. Union 파일 시스템 (Unionfs)은 여러 파일 시스템을 스택하고 차이점 만 저장하고 공간을 절약하고 속도를 높입니다. 3. 데몬은 거울과 컨테이너를 관리하고 클라이언트는 상호 작용을 위해 사용합니다. 4. 네임 스페이스 및 CGroup은 컨테이너 격리 및 자원 제한을 구현합니다. 5. 다중 네트워크 모드는 컨테이너 상호 연결을 지원합니다. 이러한 핵심 개념을 이해 함으로써만 Docker를 더 잘 활용할 수 있습니다.

Centos 설치 MySQL Centos 설치 MySQL Apr 14, 2025 pm 08:09 PM

Centos에 MySQL을 설치하려면 다음 단계가 필요합니다. 적절한 MySQL Yum 소스 추가. mysql 서버를 설치하려면 yum install mysql-server 명령을 실행하십시오. mysql_secure_installation 명령을 사용하여 루트 사용자 비밀번호 설정과 같은 보안 설정을 작성하십시오. 필요에 따라 MySQL 구성 파일을 사용자 정의하십시오. MySQL 매개 변수를 조정하고 성능을 위해 데이터베이스를 최적화하십시오.

CentOS8은 ssh를 다시 시작합니다 CentOS8은 ssh를 다시 시작합니다 Apr 14, 2025 pm 09:00 PM

SSH 서비스를 다시 시작하라는 명령은 SystemCTL SSHD를 다시 시작합니다. 자세한 단계 : 1. 터미널에 액세스하고 서버에 연결; 2. 명령을 입력하십시오 : SystemCTL SSHD 재시작; 3. 서비스 상태를 확인하십시오 : SystemCTL 상태 SSHD.

See all articles