연구진, 영어 명령 이해하고 집안일도 할 수 있는 로봇 개발
프린스턴대학교, 스탠포드대학교, Google 연구팀은 OpenAI의 GPT-3 Davinci 모델을 사용하여 영어 지시를 이해하고 집안일을 수행할 수 있는 로봇 TidyBot을 개발했습니다. 이 로봇은 사용자의 취향에 따라 세탁물 분류, 바닥 쓰레기 줍기, 장난감 줍기 등의 작업을 자동으로 완료할 수 있다.
GPT-3 Davinci 모델은 GPT 모델 계열의 일부인 딥 러닝 모델로, 자연어를 이해하고 생성할 수 있습니다. 이 모델은 강력한 요약 기능을 갖추고 있으며 대량의 텍스트 데이터로부터 복잡한 개체 속성과 관계를 학습할 수 있습니다. 연구원들은 이 기능을 사용하여 "서랍 속의 노란색 셔츠, 옷장 속의 진한 보라색 셔츠, 서랍 속의 흰색 양말"과 같이 사용자가 제공한 몇 가지 예시 개체를 기반으로 로봇이 개체를 배치한 다음 모델이 결론을 내리도록 했습니다. 사용자의 일반적인 기본 설정 규칙을 적용하고 향후 상호 작용에 적용합니다.
연구원들은 논문에서 다음과 같이 썼습니다. "우리의 기본 통찰력은 LLM(대형 언어 모델)의 요약 기능이 맞춤형 로봇의 일반화 요구와 잘 일치한다는 것입니다. LLM은 Complex를 사용하여 요약을 통해 일반화를 달성하는 놀라운 능력을 보여줍니다. 대규모 텍스트 데이터 세트에서 학습된 개체 속성 및 관계”
그들은 또한 다음과 같이 썼습니다. “비용이 많이 드는 데이터 수집 및 모델 교육이 필요한 기존 방법과 달리 LLM은 로봇 공학 도메인에서 바로 구현될 수 있음을 보여줍니다. 연구진은 방대한 양의 텍스트 데이터에서 학습한 강력한 요약 기능을 통해 세탁물을 밝은 색상과 어두운 색상으로 분류하고, 음료수 캔을 재활용하고, 쓰레기를 버리고, 가방과 접시를 포장하고, 정리할 수 있는 로봇을 시연했습니다. 물건은 제자리로 돌려놓고, 장난감은 서랍에 넣어두세요.
연구원들은 먼저 사용자 선호도를 입력하고 모델에 항목 속성을 결정하기 위한 개인화 규칙을 생성하도록 요청하는 텍스트 기반 벤치마크 데이터 세트를 테스트했습니다. 모델은 예제를 일반 규칙으로 요약하고 요약을 사용하여 새 항목을 배치할 위치를 결정합니다. 기본 장면은 각 방에 24개의 장면이 있는 4개의 방으로 정의됩니다. 각 장면에는 객체를 배치할 수 있는 장소가 2~5개 포함되어 있으며, 모델이 분류할 수 있는 보이는 객체와 보이지 않는 객체의 수가 동일합니다. 이 테스트에서는 보이지 않는 항목에 대해 91.2%의 정확도를 달성했다고 밝혔습니다.
이 접근 방식을 실제 로봇인 TidyBot에 적용했을 때, 물체의 85%를 성공적으로 집어들 수 있다는 것을 발견했습니다. TidyBot은 각각 10개의 개체 세트로 구성된 8개의 실제 시나리오에서 테스트되었으며 로봇은 각 시나리오에서 3번 실행되었습니다. IT House에 따르면 TidyBot은 LLM 외에도 CLIP이라는 이미지 분류기와 OWL-ViT라는 개체 감지기를 사용합니다.
Georgia Institute of Technology 산하 인터랙티브 컴퓨팅 학교의 조교수인 Danfei Xu는 Google의 PaLM-E 모델에 관해 이야기하면서 LLM이 로봇에게 더 많은 문제 해결 능력을 제공한다고 말했습니다. "대부분의 이전 임무 계획 시스템은 유연성이 떨어지고 구축하기 어려운 어떤 형태의 검색 또는 최적화 알고리즘에 의존했습니다. LLM 및 다중 모드 LLM을 통해 이러한 시스템은 인터넷 규모 데이터의 이점을 활용하고 새로운 문제를 해결하는 데 쉽게 사용할 수 있습니다."라고 그는 말했습니다. .
위 내용은 연구진, 영어 명령 이해하고 집안일도 할 수 있는 로봇 개발의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











이전에 작성했던 오늘은 딥 러닝 기술이 복잡한 환경에서 비전 기반 SLAM(동시 위치 파악 및 매핑)의 성능을 향상할 수 있는 방법에 대해 논의합니다. 심층 특징 추출과 깊이 일치 방법을 결합하여 저조도 조건, 동적 조명, 질감이 약한 영역 및 심한 지터와 같은 까다로운 시나리오에서 적응을 향상하도록 설계된 다목적 하이브리드 시각적 SLAM 시스템을 소개합니다. 우리 시스템은 확장 단안, 스테레오, 단안 관성 및 스테레오 관성 구성을 포함한 여러 모드를 지원합니다. 또한 시각적 SLAM을 딥러닝 방법과 결합하여 다른 연구에 영감을 주는 방법도 분석합니다. 공개 데이터 세트 및 자체 샘플링 데이터에 대한 광범위한 실험을 통해 위치 정확도 및 추적 견고성 측면에서 SL-SLAM의 우수성을 입증합니다.

휴머노이드 로봇 아메카가 2세대로 업그레이드 되었습니다! 최근 세계이동통신학회(MWC2024)에서 세계 최고 수준의 로봇 아메카(Ameca)가 다시 등장했다. 행사장 주변에는 아메카가 많은 관중을 끌어 모았습니다. GPT-4의 축복으로 Ameca는 다양한 문제에 실시간으로 대응할 수 있습니다. "춤을 추자." 감정이 있느냐는 질문에 아메카는 매우 생생해 보이는 일련의 표정으로 대답했습니다. 불과 며칠 전, Ameca의 뒤를 잇는 영국 로봇 회사인 EngineeredArts는 팀의 최신 개발 결과를 시연했습니다. 영상 속 로봇 아메카는 시각 능력을 갖고 있어 방 전체와 특정 사물을 보고 묘사할 수 있다. 가장 놀라운 점은 그녀도 할 수 있다는 것입니다.

산업자동화 기술 분야에서 최근 무시하기 어려운 두 핫스팟이 있는데 바로 인공지능(AI)과 엔비디아다. 원본 콘텐츠의 의미를 바꾸지 말고, 콘텐츠를 미세 조정하고, 콘텐츠를 다시 작성하고, 계속하지 마세요. “그뿐만 아니라 Nvidia가 원래 그래픽 처리 장치(GPU)에만 국한되지 않기 때문에 둘은 밀접하게 관련되어 있습니다. 엔비디아는 최근 GPU를 확장해 디지털 트윈 분야까지 확장하고 있으며, 최근 떠오르는 AI 기술과도 긴밀하게 연결돼 있다”고 말했다. Schneider Electric, Teradyne Robotics, MiR 및 Universal Robots 회사도 포함됩니다. 최근 엔비디아(Nvidia)는

기계력 보고서 편집자: 우신(Wu Xin) 국내판 휴머노이드 로봇+대형 모델팀이 옷 접기 등 복잡하고 유연한 재료의 작업 작업을 처음으로 완료했습니다. OpenAI 멀티모달 대형 모델을 접목한 Figure01이 공개되면서 국내 동종업체들의 관련 진전이 주목받고 있다. 바로 어제, 중국의 "1위 휴머노이드 로봇 주식"인 UBTECH는 Baidu Wenxin의 대형 모델과 긴밀하게 통합되어 몇 가지 흥미로운 새로운 기능을 보여주는 휴머노이드 로봇 WalkerS의 첫 번째 데모를 출시했습니다. 이제 Baidu Wenxin의 대형 모델 역량을 활용한 WalkerS의 모습은 이렇습니다. Figure01과 마찬가지로 WalkerS는 움직이지 않고 책상 뒤에 서서 일련의 작업을 완료합니다. 인간의 명령을 따르고 옷을 접을 수 있습니다.

이번 주, 오픈AI(OpenAI), 마이크로소프트(Microsoft), 베조스(Bezos), 엔비디아(Nvidia)가 투자한 로봇 회사인 FigureAI는 약 7억 달러의 자금 조달을 받았으며 내년 내에 독립적으로 걸을 수 있는 휴머노이드 로봇을 개발할 계획이라고 발표했습니다. 그리고 Tesla의 Optimus Prime은 계속해서 좋은 소식을 받았습니다. 올해가 휴머노이드 로봇이 폭발하는 해가 될 것이라는 데는 누구도 의심하지 않는다. 캐나다에 본사를 둔 로봇 회사인 SanctuaryAI는 최근 새로운 휴머노이드 로봇인 Phoenix를 출시했습니다. 관계자들은 이 로봇이 인간과 같은 속도로 자율적으로 많은 작업을 완료할 수 있다고 주장한다. 인간의 속도로 자동으로 작업을 완료할 수 있는 세계 최초의 로봇인 Pheonix는 각 물체를 부드럽게 잡고 움직이며 우아하게 왼쪽과 오른쪽에 배치할 수 있습니다. 자동으로 물체를 식별할 수 있습니다.

오늘날 급속한 기술 변화의 물결 속에서 인공지능(AI), 머신러닝(ML), 딥러닝(DL)은 정보기술의 새로운 물결을 이끄는 밝은 별과도 같습니다. 이 세 단어는 다양한 최첨단 토론과 실제 적용에 자주 등장하지만, 이 분야를 처음 접하는 많은 탐험가들에게는 그 구체적인 의미와 내부 연관성이 여전히 수수께끼에 싸여 있을 수 있습니다. 그럼 먼저 이 사진을 보시죠. 딥러닝, 머신러닝, 인공지능 사이에는 밀접한 상관관계와 진보적인 관계가 있음을 알 수 있습니다. 딥러닝은 머신러닝의 특정 분야이며, 머신러닝은

2006년 딥러닝이라는 개념이 제안된 지 거의 20년이 지났습니다. 딥러닝은 인공지능 분야의 혁명으로 많은 영향력 있는 알고리즘을 탄생시켰습니다. 그렇다면 딥러닝을 위한 상위 10가지 알고리즘은 무엇이라고 생각하시나요? 다음은 제가 생각하는 딥 러닝을 위한 최고의 알고리즘입니다. 이들은 모두 혁신, 애플리케이션 가치 및 영향력 측면에서 중요한 위치를 차지하고 있습니다. 1. 심층 신경망(DNN) 배경: 다층 퍼셉트론이라고도 불리는 심층 신경망(DNN)은 가장 일반적인 딥 러닝 알고리즘으로 처음 발명되었을 때 최근까지 컴퓨팅 성능 병목 현상으로 인해 의문을 제기했습니다. 20년, 컴퓨팅 파워, 데이터의 폭발적인 증가로 돌파구가 찾아왔습니다. DNN은 여러 개의 숨겨진 레이어를 포함하는 신경망 모델입니다. 이 모델에서 각 레이어는 입력을 다음 레이어로 전달하고

눈 깜짝할 사이에 로봇이 마법을 배웠다고? 먼저 테이블 위의 물숟가락을 집어서 관객들에게 아무것도 없다는 것을 증명하는 모습이 보였고... 그리고 달걀 같은 물체를 손에 쥐고 다시 물숟가락을 테이블 위에 올려 놓았습니다. 그리고 "주문을 걸기" 시작했습니다... ...다시 물숟가락을 집었을 때 기적이 일어났습니다. 원래 넣었던 알은 사라지고, 튀어나온 것은 농구공으로 변해버렸는데... 연속적인 동작을 다시 살펴보자: △ 이 애니메이션은 2배속으로 일련의 동작을 보여주며, 보기만 해도 부드럽게 흘러간다. 0.5배속으로 반복해서 영상을 보면, 마침내 단서를 발견했습니다. 내 손의 속도가 더 빨랐다면 적에게 숨길 수도 있었을 것입니다. 일부 네티즌들은 로봇의 마법 실력이 자신보다 훨씬 높다고 한탄했습니다. 이 마법을 우리를 위해 수행한 사람은 매그였습니다.
