Tencent의 로봇 개 진화: 딥 러닝을 통해 자율적 의사 결정 능력 습득
6월 14일, Tencent Robotics가 크게 개선되었습니다.
로봇 개를 인간이나 동물처럼 유연하고 안정적으로 만드는 것은 로봇공학 연구 분야의 장기적인 목표였습니다. 딥 러닝 기술의 지속적인 발전을 통해 기계는 '학습'을 통해 관련 능력을 습득하고 복잡하고 복잡한 문제에 대처하는 방법을 배울 수 있습니다. 변화하는 환경이 가능해집니다.
사전 훈련 및 강화 학습 소개: 로봇 개를 더 민첩하게 만들기
Tencent Robotics 다시 학습할 필요는 없지만, 이미 배운 자세, 환경 인식, 전략 기획 등 다단계 지식을 재사용하고 하나의 사례에서 추론을 도출하여 복잡한 환경에 유연하게 대처할 수 있습니다
이 일련의 학습은 세 단계로 구분됩니다.
첫 번째 단계에서는 게임 기술에서 자주 사용되는 모션 캡처 시스템을 통해 연구원은 걷기, 달리기, 점프, 서기 및 기타 동작을 포함한 실제 개들의 움직임 자세 데이터를 수집하고 이 데이터를 사용하여 모방 학습 과제를 구성했습니다. 그런 다음 이 데이터의 정보는 심층 신경망 모델로 추상화되고 압축됩니다. 이러한 모델은 수집된 동물의 움직임 자세 정보를 정확하게 포괄할 수 있을 뿐만 아니라 해석 가능성도 높습니다.
텐센트 로봇공학 이러한 기술과 데이터는 물리적 시뮬레이션 기반 에이전트 교육 및 실제 로봇 전략 배포에서 일정한 보조 역할을 합니다.
신경망 모델은 로봇개의 고유 감각 정보(예: 운동 상태)만 입력으로 받아들이고 모방 학습 방식으로 훈련됩니다. 다음 단계에서 모델은 다른 센서를 사용하여 발 밑의 장애물을 감지하는 등 주변 환경의 감각 데이터를 통합합니다.
2단계에서는 추가 네트워크 매개변수를 사용하여 1단계에서 마스터한 로봇개의 스마트 자세를 외부 인식과 연결하고, 로봇개가 학습한 스마트 자세를 통해 외부 환경에 반응할 수 있도록 합니다. 로봇개가 다양하고 복잡한 환경에 적응하게 되면 스마트한 자세와 외부 인식을 연결하는 지식도 신경망 구조에 굳어져 저장될 것이다.
세 번째 단계에서는 위의 두 가지 사전 훈련 단계에서 얻은 신경망을 활용하여 로봇개는 최상위 수준의 정책 학습 문제를 해결하는 데 집중할 수 있는 전제 조건과 기회를 갖게 되며, 최종적으로 복잡한 작업을 해결할 수 있는 능력을 갖추게 됩니다. -끝으로. 세 번째 단계에서는 게임 내 상대 및 깃발에 대한 정보를 얻는 등 복잡한 작업과 관련된 데이터를 수집하기 위해 추가 네트워크가 추가됩니다. 또한, 모든 정보를 종합적으로 분석하여 전략 학습을 담당하는 신경망은 어느 방향으로 달릴지, 상대의 행동을 예측하여 계속 추격할지 결정하는 등 작업에 대한 높은 수준의 전략을 학습하게 됩니다.
위의 각 단계에서 학습한 지식은 재학습 없이 확장, 조정이 가능하므로 지속적으로 축적, 학습이 가능합니다.
로봇개 장애물 추적 대회: 자율적인 의사결정 및 제어 능력 보유
맥스가 습득한 이러한 새로운 기술을 테스트하기 위해 연구원은 장애물 추적 게임 "World Chase Tag"에서 영감을 받아 두 마리의 개 장애물 추적 게임을 디자인했습니다. 월드 체이스 태그(World Chase Tag)는 2014년 영국에서 설립된 장애물 추적 경쟁 단체입니다. 민속 어린이 추적 게임을 표준화한 것입니다. 일반적으로 장애물 추격 경기의 각 라운드에는 두 명의 선수가 서로 경쟁합니다. 한 선수는 공격자라고 하며 다른 선수는 다저(수비자라고 함)입니다. 추격 라운드(즉, 20초) 동안 상대를 성공적으로 회피하면(즉, 접촉이 발생하지 않을 때) 1점. 미리 정해진 횟수의 추격 라운드에서 가장 많은 점수를 얻은 팀이 게임에서 승리합니다.
로봇개 장애물 추적 대회의 경기장 크기는 4.5m x 4.5m이며, 그 위에 일부 장애물이 흩어져 있습니다. 게임 시작 시 MAX 로봇견 2마리가 필드 내 무작위 위치에 배치되며, 로봇견 1마리는 추적자 역할, 다른 로봇견은 회피자 역할을 무작위로 할당하는 동시에 깃발이 배치됩니다. 필드의 무작위 위치에서.
다저스의 목표는 추격자에게 잡히지 않고 깃발에 최대한 가까이 다가가는 것입니다. 추적자의 임무는 회피자를 잡는 것입니다. 다저스가 잡히기 전에 깃발에 성공적으로 닿으면 두 로봇견의 역할이 즉시 바뀌고 깃발은 다른 무작위 위치에 다시 나타납니다. 현재 추적자에게 다저가 잡히고 추적자 역할을 하는 로봇개가 승리하면 게임이 종료됩니다. 모든 게임에서 두 로봇견의 평균 전진 속도는 0.5m/s로 제한됩니다.
이 게임에서 사전 훈련된 모델을 기반으로 하는 로봇 개는 이미 심층 강화 학습을 통해 특정 추론 및 의사 결정 능력을 갖추고 있습니다.
예를 들어, 추적자가 깃발에 닿기 전에 더 이상 따라잡을 수 없다는 것을 알게 되면 추적자는 추적을 포기하고 대신 다음 재설정을 기다리기 위해 다저에게서 멀어지게 됩니다. .
또한, 추적자가 마지막 순간에 다저를 잡으려고 할 때 뛰어올라 다저를 향해 '덤벼드는' 행동을 하는 것을 좋아하는데, 이는 먹이를 잡을 때나, 다저스를 잡을 때의 동물의 행동과 매우 유사합니다. 다저도 깃발을 건드리려고 하면 같은 행동을 보일 것입니다. 이는 모두 로봇 개가 승리를 보장하기 위해 취하는 적극적인 가속 조치입니다.
보고에 따르면 게임 속 로봇 개들의 모든 제어 전략은 시뮬레이션과 제로샷 전달(Zero-Adjustment Transfer)을 통해 학습되며, 신경망이 인간의 추론 방법을 시뮬레이션하여 식별할 수 있습니다. 지금까지 본 적 없는 새로운 것을 발견하고, 이 지식을 실제 로봇개에게 적용해보세요. 예를 들어, 아래 그림과 같이 Chase Tag Game의 가상 세계에서는 장애물이 있는 장면을 훈련하지 않더라도 사전 훈련 모델에서 로봇견이 학습한 장애물 회피 지식을 게임에 활용하게 된다. 가상 세계에서만 평지에서 게임 장면을 훈련한 후 로봇 개도 작업을 성공적으로 완료할 수 있습니다.
Tencent Robotics 로봇 분야에 이를 도입하면 로봇의 제어 능력이 향상되고 유연성이 향상됩니다. 이는 또한 로봇이 실생활에 진출하여 인간에게 봉사할 수 있는 견고한 기반을 마련합니다.
위 내용은 Tencent의 로봇 개 진화: 딥 러닝을 통해 자율적 의사 결정 능력 습득의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











5월 30일, Tencent는 Hunyuan 모델의 포괄적인 업그레이드를 발표했습니다. Hunyuan 모델을 기반으로 하는 앱 "Tencent Yuanbao"가 공식 출시되었으며 Apple 및 Android 앱 스토어에서 다운로드할 수 있습니다. 이전 테스트 단계의 Hunyuan 애플릿 버전과 비교하여 Tencent Yuanbao는 일상 생활 시나리오를 위한 작업 효율성 시나리오를 위한 AI 검색, AI 요약 및 AI 작성과 같은 핵심 기능을 제공하며 Yuanbao의 게임 플레이도 더욱 풍부해지고 다양한 기능을 제공합니다. , 개인 에이전트 생성과 같은 새로운 게임 플레이 방법이 추가됩니다. Tencent Cloud 부사장이자 Tencent Hunyuan 대형 모델 책임자인 Liu Yuhong은 "Tencent는 먼저 대형 모델을 만들기 위해 노력하지 않을 것입니다."라고 말했습니다. Tencent Hunyuan 대형 모델 비즈니스 시나리오에서 풍부하고 방대한 폴란드 기술을 활용하면서 사용자의 실제 요구 사항에 대한 통찰력을 얻습니다.

이전에 작성했던 오늘은 딥 러닝 기술이 복잡한 환경에서 비전 기반 SLAM(동시 위치 파악 및 매핑)의 성능을 향상할 수 있는 방법에 대해 논의합니다. 심층 특징 추출과 깊이 일치 방법을 결합하여 저조도 조건, 동적 조명, 질감이 약한 영역 및 심한 지터와 같은 까다로운 시나리오에서 적응을 향상하도록 설계된 다목적 하이브리드 시각적 SLAM 시스템을 소개합니다. 우리 시스템은 확장 단안, 스테레오, 단안 관성 및 스테레오 관성 구성을 포함한 여러 모드를 지원합니다. 또한 시각적 SLAM을 딥러닝 방법과 결합하여 다른 연구에 영감을 주는 방법도 분석합니다. 공개 데이터 세트 및 자체 샘플링 데이터에 대한 광범위한 실험을 통해 위치 정확도 및 추적 견고성 측면에서 SL-SLAM의 우수성을 입증합니다.

오늘날 급속한 기술 변화의 물결 속에서 인공지능(AI), 머신러닝(ML), 딥러닝(DL)은 정보기술의 새로운 물결을 이끄는 밝은 별과도 같습니다. 이 세 단어는 다양한 최첨단 토론과 실제 적용에 자주 등장하지만, 이 분야를 처음 접하는 많은 탐험가들에게는 그 구체적인 의미와 내부 연관성이 여전히 수수께끼에 싸여 있을 수 있습니다. 그럼 먼저 이 사진을 보시죠. 딥러닝, 머신러닝, 인공지능 사이에는 밀접한 상관관계와 진보적인 관계가 있음을 알 수 있습니다. 딥러닝은 머신러닝의 특정 분야이며, 머신러닝은

2006년 딥러닝이라는 개념이 제안된 지 거의 20년이 지났습니다. 딥러닝은 인공지능 분야의 혁명으로 많은 영향력 있는 알고리즘을 탄생시켰습니다. 그렇다면 딥러닝을 위한 상위 10가지 알고리즘은 무엇이라고 생각하시나요? 다음은 제가 생각하는 딥 러닝을 위한 최고의 알고리즘입니다. 이들은 모두 혁신, 애플리케이션 가치 및 영향력 측면에서 중요한 위치를 차지하고 있습니다. 1. 심층 신경망(DNN) 배경: 다층 퍼셉트론이라고도 불리는 심층 신경망(DNN)은 가장 일반적인 딥 러닝 알고리즘으로 처음 발명되었을 때 최근까지 컴퓨팅 성능 병목 현상으로 인해 의문을 제기했습니다. 20년, 컴퓨팅 파워, 데이터의 폭발적인 증가로 돌파구가 찾아왔습니다. DNN은 여러 개의 숨겨진 레이어를 포함하는 신경망 모델입니다. 이 모델에서 각 레이어는 입력을 다음 레이어로 전달하고

Tencent QQ 데스크톱 클라이언트는 일련의 과감한 개혁을 거친 것으로 이해됩니다. 높은 메모리 사용량, 과도한 설치 패키지 및 느린 시작과 같은 사용자 문제에 대응하여 QQ 기술 팀은 메모리에 대한 특별한 최적화를 수행하고 단계적인 발전을 이루었습니다. 최근 QQ 기술팀은 InfoQ 플랫폼에 대한 소개 기사를 게재하여 메모리의 특수 최적화에 대한 단계별 진행 상황을 공유했습니다. 보고서에 따르면 QQ 새 버전의 메모리 문제는 주로 다음 네 가지 측면에 반영됩니다. 제품 형태: 복잡한 대형 패널(다양한 복잡성을 지닌 100개 이상의 모듈)과 일련의 독립적인 기능 창으로 구성됩니다. 창과 렌더링 프로세스 사이에는 일대일 대응이 있습니다. 창 프로세스 수는 Electron의 메모리 사용량에 큰 영향을 미칩니다. 그 복잡한 대형 패널의 경우 일단

최근 Tencent Interactive Entertainment Recruitment는 Photon H Studio가 컨텐츠가 풍부한 AAA 수준 오픈 월드 RPG 프로젝트 개발에 전념하고 있음을 나타내는 채용 정보를 공개했습니다. 채용 중인 직위는 UE5 엔지니어, 백엔드, 레벨 디자인, 액션 장면 디자인, 캐릭터 모델링, 특수 효과 및 배포 등 다양한 분야를 포괄합니다. 이러한 직책의 근무 대상 위치는 NetEase의 본사가 있는 항저우입니다.

Editor | Radish Skin 2021년 강력한 AlphaFold2가 출시된 이후 과학자들은 단백질 구조 예측 모델을 사용하여 세포 내 다양한 단백질 구조를 매핑하고 약물을 발견하며 알려진 모든 단백질 상호 작용에 대한 "우주 지도"를 그려 왔습니다. 방금 Google DeepMind는 단백질, 핵산, 소분자, 이온 및 변형된 잔기를 포함한 복합체에 대한 결합 구조 예측을 수행할 수 있는 AlphaFold3 모델을 출시했습니다. AlphaFold3의 정확도는 과거의 많은 전용 도구(단백질-리간드 상호작용, 단백질-핵산 상호작용, 항체-항원 예측)에 비해 크게 향상되었습니다. 이는 단일 통합 딥러닝 프레임워크 내에서 다음을 달성할 수 있음을 보여줍니다.

AniPortrait 모델은 오픈 소스이며 자유롭게 사용할 수 있습니다. "샤오포잔 고스트 존(Xiaopozhan Ghost Zone)을 위한 새로운 생산성 도구입니다." 최근 텐센트 오픈 소스(Tencent Open Source)가 발표한 새 프로젝트가 트위터에서 이런 평가를 받았습니다. 이 프로젝트는 오디오와 참조 이미지를 기반으로 고품질 애니메이션 인물 사진을 생성하는 AniPortrait입니다. 더 이상 고민하지 말고 변호사의 편지로 경고할 수 있는 데모를 살펴보겠습니다. 애니메이션 이미지도 쉽게 말할 수 있습니다. 이 프로젝트는 출시된 지 불과 며칠 만에 이미 광범위한 칭찬을 받았습니다. GitHub Stars의 수가 2,800명을 돌파했습니다. AniPortrait의 혁신을 살펴보겠습니다. 논문 제목: AniPortrait:Audio-Driven Synthesisof
