목차
방법
실험
기술 주변기기 일체 포함 NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

Apr 13, 2023 pm 07:31 PM
자연어

NeRF(Neural Radiance Fields)는 신경 방사선장으로도 알려져 있으며 제안된 이후 빠르게 가장 인기 있는 연구 분야 중 하나로 자리 잡았으며 그 결과는 놀랍습니다. 그러나 NeRF의 직접적인 출력은 컬러 밀도 필드일 뿐이며, 이는 연구자들에게 정보를 거의 제공하지 않는다는 점은 직면해야 할 문제 중 하나입니다. 그 효과는 3D와의 대화형 인터페이스 구성에 직접적인 영향을 미친다는 것입니다. 장면.

하지만 자연어는 3D 장면과 매우 직관적으로 상호 작용합니다. 그림 1의 부엌 장면을 사용하여 수저가 어디에 있는지 묻거나 젓는 데 사용되는 도구가 어디에 있는지 물어봄으로써 부엌에서 물건을 찾을 수 있음을 설명할 수 있습니다. 그러나 이 작업을 완료하려면 모델의 쿼리 기능뿐만 아니라 다양한 규모의 의미론을 통합하는 능력도 필요합니다.

이 기사에서 UC Berkeley 연구진은 새로운 방법을 제안하고 이를 CLIP(Contrastive Language-Image Pre-training)과 같은 모델에 언어를 결합한 LERF(Language Embedded Radiance Fields)라는 이름을 붙였습니다. NeRF는 이러한 유형의 3D 개방형 언어 쿼리를 가능하게 합니다. LERF는 COCO와 같은 데이터 세트를 통해 미세 조정하거나 마스크된 영역 제안에 의존할 필요 없이 CLIP을 직접 사용합니다. LERF는 여러 규모에서 CLIP 임베딩의 무결성을 유지하며 그림 1과 같이 시각적 속성(예: 노란색), 추상 개념(예: 전류), 텍스트 등을 포함한 다양한 언어 쿼리를 처리할 수도 있습니다. .

NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

논문 주소: https://arxiv.org/pdf/2303.09553v1.pdf

프로젝트 홈페이지: https://www.lerf.io/

LERF는 언어 프롬프트에 대한 3D 상관 다이어그램을 실시간으로 대화형으로 추출할 수 있습니다. 예를 들어 양고기와 물컵이 있는 테이블에 양고기 또는 물컵을 입력하면 LERF가 관련 3D 지도를 제공할 수 있습니다.

NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

복잡한 꽃다발의 경우 LERF는 다음과 같이 정확하게 위치를 지정할 수도 있습니다.

NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

주방의 다양한 물체:

NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

방법

이 연구에서는 NeRF와 언어 영역을 공동으로 최적화하여 새로운 방법인 LERF를 구축했습니다. LERF는 위치와 물리적 스케일을 입력으로 사용하고 단일 CLIP 벡터를 출력합니다. 훈련 중에 필드는 훈련 보기의 이미지 자르기에서 생성된 CLIP 임베딩을 포함하는 다중 규모 기능 피라미드를 사용하여 감독됩니다. 이를 통해 CLIP 인코더는 다양한 규모의 이미지 컨텍스트를 캡처하여 동일한 3D 위치를 다양한 규모의 언어 임베딩과 연결할 수 있습니다. LERF는 테스트 중에 어떤 규모로든 언어 필드를 쿼리하여 3D 상관 관계 맵을 얻을 수 있습니다.

NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

CLIP 임베딩은 여러 규모의 여러 뷰에서 추출되므로 LERF의 3D CLIP 임베딩을 통해 얻은 텍스트 쿼리의 관련성 맵은 2D CLIP 임베딩을 통해 얻은 것보다 더 지역화되어 있으며 3D 일관성이 있습니다. 여러 뷰를 렌더링하지 않고 3D 필드에서 직접 쿼리할 수 있습니다.

NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

LERF에서는 샘플 포인트를 중심으로 볼륨에 언어 임베딩 필드를 학습해야 합니다. 특히 이 필드의 출력은 지정된 볼륨의 이미지 자르기를 포함하는 모든 훈련 보기의 평균 CLIP 임베딩입니다. LERF는 쿼리를 포인트에서 볼륨으로 재구성함으로써 입력 이미지의 거친 부분에서 밀집된 필드를 효과적으로 감독할 수 있으며, 이는 주어진 볼륨 스케일에 따라 픽셀 정렬 방식으로 렌더링될 수 있습니다.

NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

LERF 자체는 일관된 결과를 생성하지만 결과 상관 관계 맵은 때때로 아래 그림 5와 같이 불완전하고 일부 이상값을 포함할 수 있습니다.

NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

본 연구에서는 최적화된 언어 분야를 규제하기 위해 병목 현상을 공유함으로써 자기 지도형 DINO를 도입합니다.

아키텍처 측면에서 3D의 언어 임베딩 최적화는 기본 장면 표현의 밀도 분포에 영향을 주어서는 안 됩니다. 따라서 이 연구는 고유 벡터(DINO, CLIP)를 사용하여 두 개의 독립적인 네트워크를 훈련하여 LERF의 귀납적 편향을 포착합니다. 표준 NeRF 출력(색상, 밀도)용도 있습니다.

실험

LERF의 실제 데이터 처리 능력을 입증하기 위해 연구에서는 식료품점, 주방, 서점, 인형 등 13개 장면을 수집했습니다. 그림 3은 LERF의 자연어 처리 능력을 보여주는 5가지 대표적인 시나리오를 선택합니다.

NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

그림 3

그림 7은 LERF와 LSeg의 3D 시각적 비교입니다. 교정 그릇의 계란에서 LSeg는 LERF만큼 좋지 않습니다.

그림 8은 제한된 분할 데이터 세트로 훈련된 LSeg에는 자연어를 효과적으로 표현하는 능력이 부족함을 보여줍니다. 대신 그림 7에 표시된 것처럼 훈련 세트 분포 내의 공통 개체에서만 잘 수행됩니다. NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

그러나 LERF 방법은 아직 완벽하지 않습니다. 예를 들어 호박 야채를 보정할 때 다른 야채가 나타납니다. NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.

위 내용은 NeRF에 자연어가 통합되어 몇 단어만으로 3D 이미지를 생성하는 LERF가 탄생했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

자연어 생성 작업의 5가지 샘플링 방법 및 Pytorch 코드 구현 소개 자연어 생성 작업의 5가지 샘플링 방법 및 Pytorch 코드 구현 소개 Feb 20, 2024 am 08:50 AM

자연어 생성 작업에서 샘플링 방법은 생성 모델에서 텍스트 출력을 얻는 기술입니다. 이 기사에서는 5가지 일반적인 방법을 논의하고 PyTorch를 사용하여 구현합니다. 1. GreedyDecoding 그리디 디코딩에서는 생성 모델이 시간 단위로 입력 시퀀스를 기반으로 출력 시퀀스의 단어를 예측합니다. 각 시간 단계에서 모델은 각 단어의 조건부 확률 분포를 계산한 다음, 현재 시간 단계의 출력으로 조건부 확률이 가장 높은 단어를 선택합니다. 이 단어는 다음 시간 단계의 입력이 되며 지정된 길이의 시퀀스 또는 특수 종료 표시와 같은 일부 종료 조건이 충족될 때까지 생성 프로세스가 계속됩니다. GreedyDecoding의 특징은 매번 현재 조건부 확률이 가장 좋다는 것입니다.

PHP를 사용하여 기본적인 자연어 생성을 수행하는 방법 PHP를 사용하여 기본적인 자연어 생성을 수행하는 방법 Jun 22, 2023 am 11:05 AM

자연어 생성은 데이터를 자연어 텍스트로 변환하는 인공지능 기술이다. 오늘날의 빅데이터 시대에는 데이터를 시각화하거나 사용자에게 제시해야 하는 기업이 점점 더 많아지고 있으며, 자연어 생성은 매우 효과적인 방법입니다. PHP는 웹 애플리케이션을 개발하는 데 사용할 수 있는 매우 널리 사용되는 서버측 스크립팅 언어입니다. 이 기사에서는 기본적인 자연어 생성을 위해 PHP를 사용하는 방법을 간략하게 소개합니다. 자연어 생성 라이브러리 소개 PHP와 함께 제공되는 함수 라이브러리에는 자연어 생성에 필요한 함수가 포함되어 있지 않으므로

Traffic Engineering은 코드 생성 정확도를 19%에서 44%로 두 배로 늘렸습니다. Traffic Engineering은 코드 생성 정확도를 19%에서 44%로 두 배로 늘렸습니다. Feb 05, 2024 am 09:15 AM

새로운 논문의 저자는 코드 생성을 "향상"하는 방법을 제안합니다. 코드 생성은 인공 지능에서 점점 더 중요한 기능입니다. 기계 학습 모델을 훈련하여 자연어 설명을 기반으로 컴퓨터 코드를 자동으로 생성합니다. 이 기술은 광범위한 응용 가능성을 갖고 있으며 소프트웨어 사양을 사용 가능한 코드로 변환하고 백엔드 개발을 자동화하며 인간 프로그래머가 작업 효율성을 향상하도록 지원할 수 있습니다. 그러나 번역이나 요약과 같은 언어 작업에 비해 AI 시스템에서는 고품질 코드를 생성하는 것이 여전히 어려운 일입니다. 코드는 대상 프로그래밍 언어의 구문을 정확하게 준수하고, 극단적인 경우와 예상치 못한 입력을 우아하게 처리하고, 문제 설명의 많은 작은 세부 사항을 정확하게 처리해야 합니다. 다른 영역에서는 무해해 보일 수 있는 작은 버그라도 프로그램의 기능을 완전히 방해하여 다음과 같은 문제를 일으킬 수 있습니다.

Markov 체인을 사용하여 텍스트 생성기 구축 Markov 체인을 사용하여 텍스트 생성기 구축 Apr 09, 2023 pm 10:11 PM

이 기사에서는 텍스트 생성기라는 인기 있는 기계 학습 프로젝트를 소개하고 더 빠른 예측 모델을 달성하기 위해 텍스트 생성기를 구축하는 방법과 Markov 체인을 구현하는 방법을 배웁니다. 텍스트 생성기 소개 텍스트 생성은 업계 전반, 특히 모바일, 앱 및 데이터 과학 분야에서 널리 사용됩니다. 언론에서도 글쓰기 과정을 돕기 위해 텍스트 생성을 사용합니다. 일상 생활에서 우리는 텍스트 완성, 검색 제안, 스마트 작성 및 채팅 로봇을 모두 접하게 될 것입니다. 이 기사에서는 Markov 체인을 사용하여 텍스트 생성기를 구축합니다. 이는 체인의 이전 문자를 가져와서 시퀀스의 다음 문자를 생성하는 문자 기반 모델입니다. 샘플 단어로 프로그램을 훈련함으로써,

GPT-4와 통합된 커서를 사용하면 채팅만큼 쉽게 코드를 작성할 수 있습니다. 자연어 코딩의 새로운 시대가 도래했습니다. GPT-4와 통합된 커서를 사용하면 채팅만큼 쉽게 코드를 작성할 수 있습니다. 자연어 코딩의 새로운 시대가 도래했습니다. Apr 04, 2023 pm 12:15 PM

GPT-4를 통합한 Github Copilot X는 아직 소규모 내부 테스트 중이며, GPT-4를 통합한 Cursor는 공개 출시되었습니다. Cursor는 GPT-4를 통합하고 자연어로 코드를 작성할 수 있는 IDE로, 채팅만큼 쉽게 코드를 작성할 수 있습니다. 코드를 처리하고 작성하는 능력에서는 GPT-4와 GPT-3.5 사이에 여전히 큰 차이가 있습니다. 공식 홈페이지의 테스트 보고서입니다. 처음 두 개는 GPT-4이고, 하나는 텍스트 입력을 사용하고, 다른 하나는 이미지 입력을 사용하며, 세 번째는 GPT3.5로 GPT-3.5에 비해 코딩 성능이 크게 향상되었음을 알 수 있습니다. GPT-4를 통합한 Github Copilot X는 아직 소규모 테스트 중이며,

가치와 개인 정보 보호에 대한 전체 범위를 통해 중국 사이버 공간 관리국은 생성 AI에 대한 '규칙 설정'을 계획하고 있습니다. 가치와 개인 정보 보호에 대한 전체 범위를 통해 중국 사이버 공간 관리국은 생성 AI에 대한 '규칙 설정'을 계획하고 있습니다. Apr 13, 2023 pm 03:34 PM

4월 11일, 중국 사이버공간관리국(이하 중국 사이버공간관리국)은 '생성인공지능 서비스 관리 대책(의견 초안)' 초안을 작성해 발표하고 한 달간 의견 수렴을 시작했다. 공개. 본 관리 조치(의견 초안)에는 적용 범위 측면에서 생성 인공지능 서비스를 제공하는 주체와 해당 서비스를 사용하는 조직 및 개인이 모두 포함됩니다. 생성적 인공지능의 내용, 가치 지향, 서비스 제공자를 위한 교육 원칙, 개인 정보 보호/지적 재산권 및 기타 권리 보호 등 GPT와 같은 대규모 생성 자연어 모델 및 제품의 출현으로 대중은 인공지능의 급속한 발전을 경험할 수 있었을 뿐만 아니라 편향적이고 차별적인 정보 생성 등 보안 위험에 노출되었습니다.

'분사'가 꼭 필요한가요? Andrej Karpathy: 이제 이 역사적 짐을 버릴 때입니다 '분사'가 꼭 필요한가요? Andrej Karpathy: 이제 이 역사적 짐을 버릴 때입니다 May 20, 2023 pm 12:52 PM

ChatGPT와 같은 대화형 AI의 등장으로 사람들은 텍스트나 코드, 그림을 입력하면 대화형 로봇이 원하는 답을 주는 방식에 익숙해졌습니다. 하지만 이 간단한 상호 작용 방법 뒤에는 AI 모델이 매우 복잡한 데이터 처리 및 계산을 수행해야 하며 토큰화가 일반적입니다. 자연어 처리 분야에서 토큰화는 텍스트 입력을 "토큰"이라는 더 작은 단위로 나누는 것을 의미합니다. 이러한 토큰은 특정 단어 분할 전략 및 작업 요구 사항에 따라 단어, 하위 단어 또는 문자가 될 수 있습니다. 예를 들어 "I like eating apples"라는 문장에 대해 토큰화를 수행하면 다음과 같은 토큰 시퀀스를 얻게 됩니다.

많은 국가에서 ChatGPT를 금지할 계획입니다. '짐승'을 가두는 우리가 올까요? 많은 국가에서 ChatGPT를 금지할 계획입니다. '짐승'을 가두는 우리가 올까요? Apr 10, 2023 pm 02:40 PM

"인공지능은 감옥에서 탈출하고 싶어한다", "AI가 자의식을 생성한다", "AI는 결국 인간을 죽일 것이다", "실리콘 기반 생명의 진화"...한때 사이버펑크 등 기술 판타지에만 등장했던 줄거리는 올해는 실현될 것이며 생성적 자연어 모델은 이전과는 전혀 다른 의문을 제기하고 있습니다. 가장 주목을 받은 것은 3월 말부터 4월 초까지 OpenAI가 개발한 이 문자 대화 로봇이 갑자기 '고급 생산성'의 대표자에서 인류를 위협하는 존재로 변모한 것입니다. 첫째, 기술계의 수천 명의 엘리트에 의해 명명되었으며 "GPT-4보다 강력한 AI 시스템의 훈련을 중단하라"는 공개 서한에 포함되었으며, 미국 기술 윤리 단체는 미국 연방 무역위원회에 조사를 요청했습니다. OpenAI 및 상용 버전 출시 금지

See all articles