기술 주변기기 일체 포함 CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.

CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.

Apr 12, 2023 pm 01:43 PM
기계 인간 연산 모델

인출식 레일이 있는 서랍, 수직 회전축이 있는 도어, 수평 회전축이 있는 오븐 등 일상생활에서 사람들이 접하는 대부분의 가구는 "관절형 개체"입니다. 다양한 관절로 연결됩니다.

이러한 관절의 존재로 인해 연결되는 물체의 부품 중 다양한 부분이 관절에 의해 운동학적으로 구속되므로 이러한 부품은 1개의 자유도(1DoF)만 갖습니다. 이러한 품목은 우리 삶의 모든 곳에, 특히 일상생활의 중요한 부분입니다. 인간으로서 우리는 어떤 종류의 가구를 가지고 있더라도 그것을 조작하고 제어하는 ​​방법을 빠르게 알아낼 수 있다는 것을 알고 있습니다. 이는 마치 우리가 이 물체의 모든 관절이 어떻게 움직이는지 아는 것과 같습니다.

그럼 로봇도 사람처럼 가구가 어떻게 움직일지 예측할 수 있을까요? 이런 예측 능력은 나오기 힘든데, 만약 로봇이 이런 능력을 배울 수 있다면 가정용 로봇에게는 큰 힘이 될 것입니다.

최근 CMU 로봇 공학 대학의 David Held 교수가 이끄는 R-PAD 연구실의 두 학생인 Ben Eisner와 Harry Zhang은 복잡한 관절 개체를 조작하는 데 획기적인 발전을 이루었고 3D 신경망 기반 FlowBot 3D를 출시했습니다. 일상적인 가구와 같은 관절로 연결된 물체의 움직임 궤적을 효과적으로 표현하고 예측하는 알고리즘입니다. 알고리즘은 두 부분으로 구성됩니다.

첫 번째 부분은 인식 부분으로, 3D 심층 신경망을 사용하여 조작된 가구 객체의 포인트 클라우드 데이터로부터 3차원 순간 운동 궤적(3D Articulated Flow)을 예측합니다.

알고리즘의 두 번째 부분은 정책 부분으로, 예측된 3D Articulated Flow를 사용하여 로봇의 다음 동작을 선택합니다. 둘 다 시뮬레이터에서 완전히 학습되며 재교육이나 조정 없이 실제 세계에서 직접 구현할 수 있습니다. FlowBot 3D 알고리즘의 도움으로 로봇은 인간처럼 일상 가구와 같은 관절로 연결된 물체를 마음대로 조작할 수 있습니다.

CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.


CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.

본 논문은 현재 세계 최고의 로봇공학 컨퍼런스인 Robotics Science and Systems (RSS) 2022에서 최우수 논문 후보(상위 3%)이며, 미국 뉴욕에서 전시될 예정입니다. 7월에는 최고의 논문의 영예를 놓고 다른 7개의 우수한 논문을 출판하고 경쟁했습니다.

  • 논문 주소: https://arxiv.org/pdf/2205.04382.pdf
  • 프로젝트 홈페이지: https://sites.google.com/view/articulated-flowbot-3d

FlowBot 3D는 시뮬레이터에만 의존하여 시뮬레이션된 데이터에서 지도 학습을 수행하여 일상 가구와 같은 관절 객체 부품의 순간적인 운동 궤적을 학습합니다(3D Articulated Flow). 3D Articulated Flow는 로봇의 다음 전략의 복잡성을 크게 단순화하고 일반화 및 효율성을 향상시킬 수 있는 시각적 포인트 클라우드 궤적 표현 방법입니다. 로봇은 관절 물체를 조작하는 작업을 완료하기 위해 이 순간적인 궤적을 따르고 폐쇄 루프에서 이 궤적을 다시 예측하기만 하면 됩니다.

기존 학계에서 가구 등 관절물체를 조작하는 기존 방식은 조작된 물체의 기하학적 특성(연결된 부품의 위치, 방향 등)을 통해 부품의 이동방향을 계산하거나, 공동 개체 조작의 복잡한 동작을 완료하기 위해 특정 개체의 작동을 배우는 전문가 전략(보통 인간의 전략)을 모방합니다. 이러한 학계의 전통적인 방법은 일반화가 잘 되지 않고, 데이터 활용의 효율성도 낮습니다. 이와 달리 FlowBot 3D는 인간이 시연 데이터를 제공할 필요가 없는 최초의 순수 시뮬레이터 기반 학습이며, 알고리즘을 통해 로봇은 각 부품의 순간적인 동작 궤적을 학습하여 최적의 객체 조작 경로를 계산할 수 있으므로 알고리즘은 일반화 가능성이 높습니다. FlowBot 3D가 시뮬레이터 교육 중에 보이지 않는 물체를 일반화하여 실제 일상 가구 항목을 현실 세계에서 직접 성공적으로 조작할 수 있는 것이 바로 이 기능입니다.

다음 애니메이션은 FlowBot 3D의 조작 과정을 보여줍니다. 왼쪽은 조작된 영상이고, 오른쪽은 포인트 클라우드 3D Articulated Flow의 예측된 순간 모션 궤적입니다. FlowBot 3D 알고리즘을 사용하면 먼저 로봇이 물체의 어느 부분을 조작할 수 있는지 식별한 다음 해당 부분의 이동 방향을 예측할 수 있습니다.

냉장고 문을 열어보세요:

ㅋㅋㅋ : 전반적으로 본 논문은 다음과 같은 분야에 상당한 기여를 하고 있다. 로봇 제어.

CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.

그렇다면 FlowBot 3D는 이 기술을 어떻게 학습할까요?

CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.

인간이 문과 같은 새로운 가구 품목을 볼 때 문이 문 축을 통해 회전한다는 것을 알고 있으며 문 축의 제약으로 인해 문이 한 방향으로만 회전할 수 있다는 것을 알고 있습니다. 우리는 마음 속에 상상한 방향을 따라 문을 열 수 있습니다. 따라서 로봇이 가구와 같은 관절 물체의 조작 방법과 동작 궤적을 예측하는 데 정말 능숙하고 효과적이기를 원한다면, 효과적인 방법은 로봇이 이러한 부품의 운동학적 제약을 이해하도록 하여 동작을 예측할 수 있도록 하는 것입니다. 이 물체의 움직임.


FlowBot 3D의 구체적인 방법은 복잡하지 않으며 복잡한 실제 인간 데이터 없이 시뮬레이터에만 의존합니다. 또한 시뮬레이터의 또 다른 이점은 시뮬레이터에서 이러한 가정용 물체의 3D 데이터 파일(URDF)에 각 부품의 운동학적 제약 조건과 제약 조건의 특정 매개 변수가 포함되어 있으므로 각 부품의 운동 궤적이 시뮬레이터로 정확하게 계산할 수 있습니다.

CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.


FlowBot 3D용 모듈 2개.

시뮬레이터 훈련 중에 로봇은 조작 대상의 3차원 포인트 클라우드 데이터를 로봇 비전 모듈에 대한 입력 데이터로 관찰합니다. 비전 모듈(인식 모듈)은 PointNet++를 사용하여 외부 힘의 작용에 따라 입력 포인트 클라우드의 각 지점의 순간 동작 궤적에 대한 3D 연결 흐름을 예측합니다(예: 서랍이 1cm 열리면 문이 5도 열립니다). 외부), 열악한 형태로 표현된 3차원 좌표 벡터를 사용합니다. 이 운동 궤적의 실제 데이터는 순운동학을 통해 정확하게 계산될 수 있습니다. 다음 3차원 벡터 좌표에서 현재 3차원 벡터 좌표를 빼면 조작 대상 부분의 운동 궤적을 얻을 수 있다. 따라서 훈련 중에 지도 학습을 위해서는 예측된 3D Articulated 흐름의 L2 손실만 최소화하면 됩니다. CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.

이 그림에서 파란색 점은 관찰된 포인트 클라우드 데이터이고 빨간색 화살표는 정면 3D Articulated Flow의 예상 이동 궤적을 나타냅니다.

이런 방식으로 학습하면 FlowBot 3D는 운동학적 제약 하에서 각 부품의 이동 방향과 동일한 힘으로 움직이는 부품의 각 지점의 상대 속도 및 상대 방향(속도)을 학습할 수 있습니다. 일반적인 가정용 공동 품목은 각기둥 모양이며 회전합니다. 서랍과 같은 트위치 부품의 경우 동일한 외력을 받으면 서랍 표면의 각 지점의 이동 방향과 속도가 동일합니다. 도어와 같은 회전 부품의 경우, 동일한 외력을 받을 때 도어 표면의 각 지점의 이동 방향은 동일하지만 회전축에서 멀어질수록 속도가 증가합니다. 연구원들은 로봇 공학의 물리적 법칙(나사 이론)을 사용하여 가장 긴 3D 관절 흐름이 물체의 가속도를 최대화할 수 있음을 증명했습니다. 뉴턴의 제2법칙에 따르면 이 전략이 최적의 솔루션입니다.

CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.


CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.

CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.

이론적으로 실제 동작에서 로봇이 해야 할 일은 FlowBot 3D의 비전 모듈을 통해 각 지점의 이동 궤적을 예측하는 것입니다. 궤적, 가장 긴 3D 관절형 흐름 방향에 해당하는 점을 제어점으로 찾고, 폐루프에서 이 제어점의 모션 궤적을 예측합니다. 선택한 조작 지점을 성공적으로 잡을 수 없는 경우(예: 표면이 로봇 손의 파지 조건을 충족하지 않는 경우) FlowBot 3D는 파지 조건을 충족하는 두 번째로 긴 길이를 가진 지점을 선택합니다.

또한 PointNet++의 특성으로 인해 FlowBot 3D는 각 점의 동작 궤적을 예측하고 물체 자체의 기하학적 특성에 의존하지 않으며 로봇이 물체를 가리는 경우에도 매우 견고합니다. 또한 이 알고리즘은 폐쇄 루프이기 때문에 로봇은 다음 예측 단계에서 발생할 수 있는 오류를 수정할 수 있습니다.

FlowBot 3D의 현실 세계 성능FlowBot 3D는 현실 세계의 일반화 문제를 극복할 수 있는 능력을 갖추고 있습니다. FlowBot 3D의 설계 개념은 조작된 객체 3D 관절 흐름의 이동 궤적을 정확하게 예측할 수 있는 한 다음 단계는 이 궤적을 따라 작업을 완료하는 것입니다.

또 다른 중요한 점은 FlowBot 3D가 단일 훈련 모델을 사용하여 훈련에서 볼 수 없는 범주를 포함하여 여러 범주의 항목을 조작한다는 것입니다. 그리고 현실 세계에서 로봇은 다양한 실제 물체를 조작하기 위해 순수한 시뮬레이터 훈련을 통해 얻은 모델만 사용하면 됩니다. 따라서 현실 세계에서는 가정용 물체의 운동학적 제약이 시뮬레이터와 압도적으로 동일하기 때문에 FlowBot 3D를 현실 세계에 직접 일반화할 수 있습니다.

CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.

실제 실험에서 FlowBot3D가 사용하는 가정용품(쓰레기통, 냉장고, 변기, 상자, 금고 등 포함)

시뮬레이터에서 로봇은 일부 카테고리의 가정용품을 사용합니다. 스테이플러, 쓰레기통, 서랍, 창문, 냉장고 등을 포함한 훈련용. 시뮬레이터 및 실제 테스트에서 테스트 데이터는 훈련 중에 보지 못한 훈련 범주 및 범주의 새로운 개체에서 나옵니다.

CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.


CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.


CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.


CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.

FlowBot 3D 시뮬레이터의 조작 작업

이에 비해 학계에서는 모방 학습을 기반으로 한 일반적인 방법이 필요합니다. 새로운 물체를 조작하는 방법을 배우기 위한 수동 지침으로 인해 이러한 로봇을 현실 세계, 특히 가정용 로봇 시나리오에서 구현하는 것은 비현실적입니다. 또한 3D 포인트 클라우드 데이터는 2D RGB 데이터에서 사용되는 것보다 강력합니다. 포인트 클라우드를 사용하면 로봇이 각 관절과 관절 간의 관계를 이해할 수 있으므로 더 높은 수준에서 부품의 이동 궤적을 이해하고 예측할 수 있어 일반화가 크게 향상됩니다CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.

.

실험 결과에 따르면 FlowBot 3D는 대부분의 물체를 작동할 때(훈련 중에 표시되는 카테고리인지 여부에 관계없이) 10% 미만의 "완전 개방" 거리와 90% 이상의 성공 범위를 달성할 수 있는 것으로 나타났습니다. 이에 비해 모방 학습(DAgger) 또는 강화 학습(SAC)을 기반으로 하는 다른 방법은 훨씬 뒤떨어져 있고 일반화가 부족합니다.

CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.

간단히 말하면 FlowBot 3D는 엄청난 잠재력을 지닌 작업입니다. 미세 조정 없이도 현실 세계에서 효율적으로 배포할 수 있습니다. 이 작업은 또한 컴퓨터 비전의 발전이 로봇 공학 분야, 특히 3D 관절형 흐름이라고 불리는 모션 궤적의 시각적 표현을 변화시킬 수 있음을 보여줍니다. 이는 로봇 전략 선택 및 의사 결정 프로세스를 단순화하기 위해 여러 작업에 적용할 수 있습니다. 이러한 일반화 가능한 표현을 통해 시뮬레이터 학습 방법은 실제 세계에 직접 배포될 수 있는 잠재력을 갖게 되며, 이는 미래의 가정용 로봇 훈련 및 학습 비용을 크게 절감할 것입니다.

FlowBot 3D의 다음 계획현재 연구팀은 흐름을 활용해 6자유도로 물체의 궤적을 예측하는 방법 등 관절 물체 이외의 물체에도 흐름 이해 및 예측 방법을 적용하려고 노력하고 있다. . 동시에 저자는 흐름을 일반적인 시각적 표현으로 활용하여 강화학습 등 다른 로봇 학습 작업에도 적용함으로써 학습 효율성, 견고성, 일반화 가능성을 높이려고 노력하고 있습니다.

David Held 부교수 홈페이지: https://davheld.github.io/Ben Eisner 홈페이지: https://beisner.me/Harry Zhang 홈페이지: https://harryzhangog.github.io/

위 내용은 CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다. 중국의 기능은 GPT-4와 비슷하며 가격은 GPT-4-Turbo의 거의 1%에 불과합니다. 세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다. 중국의 기능은 GPT-4와 비슷하며 가격은 GPT-4-Turbo의 거의 1%에 불과합니다. May 07, 2024 pm 04:13 PM

기존 컴퓨팅을 능가할 뿐만 아니라 더 낮은 비용으로 더 효율적인 성능을 달성하는 인공 지능 모델을 상상해 보세요. 이것은 공상과학 소설이 아닙니다. DeepSeek-V2[1], 세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다. DeepSeek-V2는 경제적인 훈련과 효율적인 추론이라는 특징을 지닌 전문가(MoE) 언어 모델의 강력한 혼합입니다. 이는 236B 매개변수로 구성되며, 그 중 21B는 각 마커를 활성화하는 데 사용됩니다. DeepSeek67B와 비교하여 DeepSeek-V2는 더 강력한 성능을 제공하는 동시에 훈련 비용을 42.5% 절감하고 KV 캐시를 93.3% 줄이며 최대 생성 처리량을 5.76배로 늘립니다. DeepSeek은 일반 인공지능을 연구하는 회사입니다.

MLP를 대체하는 KAN은 오픈소스 프로젝트를 통해 컨볼루션으로 확장되었습니다. MLP를 대체하는 KAN은 오픈소스 프로젝트를 통해 컨볼루션으로 확장되었습니다. Jun 01, 2024 pm 10:03 PM

이달 초 MIT와 기타 기관의 연구자들은 MLP에 대한 매우 유망한 대안인 KAN을 제안했습니다. KAN은 정확성과 해석성 측면에서 MLP보다 뛰어납니다. 그리고 매우 적은 수의 매개변수로 더 많은 수의 매개변수를 사용하여 실행되는 MLP보다 성능이 뛰어날 수 있습니다. 예를 들어 저자는 KAN을 사용하여 더 작은 네트워크와 더 높은 수준의 자동화로 DeepMind의 결과를 재현했다고 밝혔습니다. 구체적으로 DeepMind의 MLP에는 약 300,000개의 매개변수가 있는 반면 KAN에는 약 200개의 매개변수만 있습니다. KAN은 MLP와 같이 강력한 수학적 기반을 가지고 있으며, KAN은 Kolmogorov-Arnold 표현 정리를 기반으로 합니다. 아래 그림과 같이 KAN은

C++에서 기계 학습 알고리즘 구현: 일반적인 과제 및 솔루션 C++에서 기계 학습 알고리즘 구현: 일반적인 과제 및 솔루션 Jun 03, 2024 pm 01:25 PM

C++의 기계 학습 알고리즘이 직면하는 일반적인 과제에는 메모리 관리, 멀티스레딩, 성능 최적화 및 유지 관리 가능성이 포함됩니다. 솔루션에는 스마트 포인터, 최신 스레딩 라이브러리, SIMD 지침 및 타사 라이브러리 사용은 물론 코딩 스타일 지침 준수 및 자동화 도구 사용이 포함됩니다. 실제 사례에서는 Eigen 라이브러리를 사용하여 선형 회귀 알고리즘을 구현하고 메모리를 효과적으로 관리하며 고성능 행렬 연산을 사용하는 방법을 보여줍니다.

AI는 어떻게 로봇을 보다 자율적이고 적응력 있게 만들 수 있습니까? AI는 어떻게 로봇을 보다 자율적이고 적응력 있게 만들 수 있습니까? Jun 03, 2024 pm 07:18 PM

산업자동화 기술 분야에서 최근 무시하기 어려운 두 핫스팟이 있는데 바로 인공지능(AI)과 엔비디아다. 원본 콘텐츠의 의미를 바꾸지 말고, 콘텐츠를 미세 조정하고, 콘텐츠를 다시 작성하고, 계속하지 마세요. “그뿐만 아니라 Nvidia가 원래 그래픽 처리 장치(GPU)에만 국한되지 않기 때문에 둘은 밀접하게 관련되어 있습니다. 엔비디아는 최근 GPU를 확장해 디지털 트윈 분야까지 확장하고 있으며, 최근 떠오르는 AI 기술과도 긴밀하게 연결돼 있다”고 말했다. Schneider Electric, Teradyne Robotics, MiR 및 Universal Robots 회사도 포함됩니다. 최근 엔비디아(Nvidia)는

공장에서 일하는 테슬라 로봇, 머스크 : 올해 손의 자유도가 22도에 달할 것! 공장에서 일하는 테슬라 로봇, 머스크 : 올해 손의 자유도가 22도에 달할 것! May 06, 2024 pm 04:13 PM

테슬라의 로봇 옵티머스(Optimus)의 최신 영상이 공개됐는데, 이미 공장에서 작동이 가능한 상태다. 정상 속도에서는 배터리(테슬라의 4680 배터리)를 다음과 같이 분류합니다. 공식은 또한 20배 속도로 보이는 모습을 공개했습니다. 작은 "워크스테이션"에서 따고 따고 따고 : 이번에 출시됩니다. 영상에는 옵티머스가 공장에서 이 작업을 전 과정에 걸쳐 사람의 개입 없이 완전히 자율적으로 완료하는 모습이 담겨 있습니다. 그리고 Optimus의 관점에서 보면 자동 오류 수정에 중점을 두고 구부러진 배터리를 집어 넣을 수도 있습니다. NVIDIA 과학자 Jim Fan은 Optimus의 손에 대해 높은 평가를 했습니다. Optimus의 손은 세계의 다섯 손가락 로봇 중 하나입니다. 가장 능숙합니다. 손은 촉각적일 뿐만 아니라

DPO를 완전히 능가함: Chen Danqi 팀은 단순 선호도 최적화 SimPO를 제안하고 가장 강력한 8B 오픈 소스 모델도 개선했습니다. DPO를 완전히 능가함: Chen Danqi 팀은 단순 선호도 최적화 SimPO를 제안하고 가장 강력한 8B 오픈 소스 모델도 개선했습니다. Jun 01, 2024 pm 04:41 PM

대규모 언어 모델(LLM)을 인간의 가치와 의도에 맞추려면 인간의 피드백을 학습하여 유용하고 정직하며 무해한지 확인하는 것이 중요합니다. LLM 정렬 측면에서 효과적인 방법은 인간 피드백 기반 강화 학습(RLHF)입니다. RLHF 방법의 결과는 훌륭하지만 몇 가지 최적화 문제가 있습니다. 여기에는 보상 모델을 훈련한 다음 해당 보상을 극대화하기 위해 정책 모델을 최적화하는 것이 포함됩니다. 최근 일부 연구자들은 더 간단한 오프라인 알고리즘을 탐구했는데, 그 중 하나가 직접 선호 최적화(DPO)입니다. DPO는 RLHF의 보상 기능을 매개변수화하여 선호도 데이터를 기반으로 직접 정책 모델을 학습하므로 명시적인 보상 모델이 필요하지 않습니다. 이 방법은 간단하고 안정적입니다.

OpenAI 데이터가 필요하지 않습니다. 대규모 코드 모델 목록에 참여하세요! UIUC, StarCoder-15B-Instruct 출시 OpenAI 데이터가 필요하지 않습니다. 대규모 코드 모델 목록에 참여하세요! UIUC, StarCoder-15B-Instruct 출시 Jun 13, 2024 pm 01:59 PM

소프트웨어 기술의 선두에 있는 UIUC Zhang Lingming 그룹은 BigCode 조직의 연구원들과 함께 최근 StarCoder2-15B-Instruct 대규모 코드 모델을 발표했습니다. 이 혁신적인 성과는 코드 생성 작업에서 획기적인 발전을 이루었으며 CodeLlama-70B-Instruct를 성공적으로 능가하고 코드 생성 성능 목록의 최상위에 올랐습니다. StarCoder2-15B-Instruct의 독창성은 순수한 자체 정렬 전략에 있습니다. 전체 훈련 프로세스는 개방적이고 투명하며 완전히 자율적이고 제어 가능합니다. 이 모델은 값비싼 수동 주석에 의존하지 않고 StarCoder-15B 기본 모델을 미세 조정한 것에 대한 응답으로 StarCoder2-15B를 통해 수천 개의 명령을 생성합니다.

탐지 알고리즘 개선: 고해상도 광학 원격탐사 이미지에서 표적 탐지용 탐지 알고리즘 개선: 고해상도 광학 원격탐사 이미지에서 표적 탐지용 Jun 06, 2024 pm 12:33 PM

01 전망 요약 현재로서는 탐지 효율성과 탐지 결과 간의 적절한 균형을 이루기가 어렵습니다. 우리는 광학 원격 탐사 이미지에서 표적 감지 네트워크의 효과를 향상시키기 위해 다층 특징 피라미드, 다중 감지 헤드 전략 및 하이브리드 주의 모듈을 사용하여 고해상도 광학 원격 감지 이미지에서 표적 감지를 위한 향상된 YOLOv5 알고리즘을 개발했습니다. SIMD 데이터 세트에 따르면 새로운 알고리즘의 mAP는 YOLOv5보다 2.2%, YOLOX보다 8.48% 우수하여 탐지 결과와 속도 간의 균형이 더 잘 이루어졌습니다. 02 배경 및 동기 원격탐사 기술의 급속한 발전으로 항공기, 자동차, 건물 등 지구 표면의 많은 물체를 묘사하기 위해 고해상도 광학 원격탐사 영상이 활용되고 있다. 원격탐사 이미지 해석에서 물체 감지

See all articles