Deepfake를 대체할 것으로 예상되나요? 올해 가장 인기 있는 NeRF 기술이 얼마나 멋진지 공개합니다
아직 NeRF를 모르시나요?
올해 컴퓨터 비전 분야에서 가장 핫한 AI 기술인 NeRF는 널리 활용되고 있다고 할 수 있으며 미래가 밝습니다.
사이트 B의 친구들은 이 기술을 새로운 방식으로 적용했습니다.
소개
그렇다면 NeRF란 정확히 무엇일까요?
NeRF(Neural Radiance Fields)는 2020 ECCV 컨퍼런스의 최우수 논문에서 처음 제안된 개념으로, 암시적 표현을 새로운 차원으로 끌어올려 복잡한 3D 장면을 2D 포즈 이미지만으로 표현할 수 있습니다.
하나의 돌이 천개의 파도를 일으켰습니다. 이후 NeRF는 급속도로 발전하여 "새로운 관점 합성, 3차원 재구성" 등 다양한 기술 방향에 적용되었습니다.
NeRF는 훈련을 위해 포즈가 포함된 희박한 다중 각도 이미지를 입력하고 신경 방사선장 모델을 얻습니다. 이 모델에 따르면 아래 그림과 같이 어떤 시야각에서도 선명한 사진을 렌더링할 수 있습니다. MLP를 사용하여 3차원 장면을 암시적으로 학습하는 것으로 간단히 요약할 수도 있습니다.
네티즌들은 자연스럽게 NeRF와 똑같이 인기 있는 Deepfake를 비교할 것입니다.
MetaPhysics가 최근 발표한 기사에서는 NeRF의 진화 역사, 과제 및 장점을 살펴보고 NeRF가 결국 Deepfake를 대체할 것이라고 예측했습니다.
딥페이크 기술에 관해 눈길을 끄는 주제의 대부분은 2017년 딥페이크가 대중의 의식에 등장한 이후 인기를 얻은 두 가지 오픈 소스 소프트웨어 패키지인 DeepFaceLab(DFL)과 FaceSwap에 관한 것입니다.
두 패키지 모두 광범위한 사용자 기반과 활발한 개발자 커뮤니티를 보유하고 있지만 두 프로젝트 모두 GitHub 코드에서 크게 벗어나지 않습니다.
물론, DFL과 FaceSwap의 개발자들은 가만히 있지 않았습니다. 이제 더 비싼 GPU가 필요하지만 더 큰 입력 이미지를 사용하여 딥페이크 모델을 훈련하는 것이 가능합니다.
그러나 사실 지난 3년 동안 언론에서 홍보한 딥페이크 이미지 품질의 향상은 주로 최종 사용자 덕분이었습니다.
그들은 모델을 훈련하는 가장 좋은 방법인 데이터 수집에 대한 시간 절약적이고 드문 경험을 축적했으며(때로는 단일 실험에 몇 주가 걸릴 수 있음) 원본 2017 코드의 가장 바깥쪽 한계를 활용하고 확장하는 방법을 배웠습니다.
VFX 및 ML 연구 커뮤니티의 일부에서는 기계 학습 모델이 최대 1024×1024의 이미지에 대해 학습할 수 있도록 아키텍처를 확장하여 인기 있는 deepfake 패키지의 "엄격한 한계"를 극복하려고 노력하고 있습니다.
픽셀은 DeepFaceLab 또는 FaceSwap의 현재 실제 범위의 두 배로, 영화 및 TV 제작에 유용한 해상도에 더 가깝습니다.
다음으로 NeRF에 대해 알아볼까요~
Unveiling
2020년에 등장한 NeRF(Neural Radiance Fields)는 신경망 내에서 여러 시점의 사진을 엮어 사물과 환경을 재구성하는 방식입니다.
희소 입력 뷰 세트를 사용하여 기본 연속 볼륨 장면 기능을 최적화하여 복잡한 장면 뷰를 합성하는 데 최상의 결과를 얻습니다.
알고리즘은 장면을 표현하기 위해 완전히 연결된 심층 네트워크를 사용합니다. 장면의 입력은 단일 연속 5D 좌표(공간 위치(x, y, z) 및 보기 방향(θ, ψ))이고 출력은 볼륨입니다. 공간 위치 밀도 및 관련 방출 진폭 밝기.
카메라 광선을 따라 5D 좌표를 쿼리하여 뷰를 합성하고 고전적인 볼륨 렌더링 기술을 사용하여 출력 색상과 밀도를 이미지에 투영합니다.
구현 과정:
먼저, 연속적인 장면은 5D 벡터 값 함수로 표현됩니다. 입력은 3D 위치와 2D 보기 방향이고 해당 출력은 방출 색상 c와 볼륨 밀도 σ입니다.
실제로는 3D 데카르트 단위 벡터 d가 방향을 나타내는 데 사용됩니다. 이 연속적인 5D 장면 표현은 MLP 네트워크로 근사화되고 가중치가 최적화됩니다.
또한 위치 x의 함수로 체적 밀도 σ를 예측하도록 네트워크를 제한하고 RGB 색상 c를 위치 및 보기 방향의 함수로 예측할 수 있도록 하여 표현이 여러 보기에서 일관되게 표시되도록 권장됩니다.
이를 달성하기 위해 MLP는 먼저 8개의 완전히 연결된 레이어(ReLU 활성화 및 레이어당 256개 채널 사용)로 입력 3D 좌표 x를 처리하고 σ 및 256차원 특징 벡터를 출력합니다.
이 특징 벡터는 카메라 광선의 시야 방향과 연결되어 보기와 관련된 RGB 색상을 출력하는 완전히 연결된 추가 레이어로 전달됩니다.
또한 NeRF는 고해상도의 복잡한 장면을 표현하기 위해 두 가지 개선 사항을 도입했습니다. 첫 번째는 MLP가 고주파수 기능을 나타내는 데 도움이 되는 위치 인코딩이고, 두 번째는 고주파수 표현을 효율적으로 샘플링할 수 있도록 하는 계층화된 샘플링 프로세스입니다.
우리 모두 알고 있듯이 Transformer 아키텍처의 위치 인코딩은 전체 아키텍처의 입력으로 시퀀스에서 마커의 개별 위치를 제공할 수 있습니다. NeRF는 위치 코딩을 사용하여 연속 입력 좌표를 더 높은 차원 공간에 매핑하므로 MLP가 더 높은 주파수 함수를 더 쉽게 근사화할 수 있습니다.
그림에서 볼 수 있듯이 위치 인코딩을 제거하면 고주파 기하학과 질감을 표현하는 모델의 능력이 크게 감소하여 결과적으로 지나치게 부드러운 모양이 됩니다.
각 카메라 광선을 따라 N개의 쿼리 지점에서 신경 방사선 필드 네트워크를 조밀하게 평가하는 렌더링 전략은 매우 비효율적이므로 NeRF는 최종 렌더링의 예상 효과에 비례하여 샘플을 할당하여 개선하는 계층적 표현을 마침내 채택합니다. 렌더링 효율성.
간단히 말하면, NeRF는 장면을 표현하기 위해 더 이상 하나의 네트워크만 사용하지 않고 "대략적인" 네트워크와 "세밀한" 네트워크라는 두 개의 네트워크를 동시에 최적화합니다.
미래를 기대합니다
NeRF는 MLP를 사용해 사물과 장면을 연속함수로 표현한다는 점에서 과거의 단점을 해결했습니다. 이전 방법과 비교하여 NeRF는 더 나은 렌더링 효과를 생성할 수 있습니다.
그러나 NeRF는 또한 많은 기술적 병목 현상에 직면해 있습니다. 예를 들어 NeRF의 가속기는 낮은 대기 시간, 더 많은 대화형 환경 및 더 적은 훈련 시간을 달성하기 위해 상대적으로 유용한 다른 기능(예: 유연성)을 희생합니다.
그래서 NeRF가 획기적인 발전을 이루었지만 완벽한 결과를 얻으려면 여전히 일정 시간이 걸립니다.
기술은 발전하고 있으며 미래는 여전히 유망합니다!
위 내용은 Deepfake를 대체할 것으로 예상되나요? 올해 가장 인기 있는 NeRF 기술이 얼마나 멋진지 공개합니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











안녕하세요 여러분 카슨입니다. 많은 프로그래머 친구들은 자신의 AI 제품 개발에 참여하고 싶어합니다. '프로세스 자동화 정도'와 'AI 적용 정도'를 기준으로 제품 형태를 4개 사분면으로 나눌 수 있습니다. 그 중 프로세스 자동화 정도는 '제품의 서비스 프로세스 중 수동 개입이 얼마나 필요한지'를 측정하고, AI 적용 정도는 '제품에서 AI가 적용되는 비율'을 측정한다. AI 사진 애플리케이션과 사용자가 이를 애플리케이션을 통해 전달하는 방식으로 UI와의 상호작용을 통해 완전한 서비스 프로세스를 완료할 수 있어 자동화 수준이 높다. 동시에 'AI 영상처리'는 AI 역량에 크게 의존하기 때문에 AI 활용도가 높다. 두 번째 사분면은 지식 관리 애플리케이션, 시간 관리 애플리케이션 및 높은 프로세스 자동화 개발과 같은 기존 애플리케이션 개발 분야입니다.

인공지능을 4차 산업혁명에 비유한다면 대형 모델은 4차 산업혁명의 식량 비축량이다. 애플리케이션 수준에서는 이를 통해 업계는 1956년 미국 다트머스 회의의 비전을 재검토하고 공식적으로 세상을 재편하는 과정을 시작할 수 있습니다. 주요 제조사의 정의에 따르면 AI 가전제품은 상호연결, 인간-컴퓨터 상호작용, 능동적 의사결정 능력을 갖춘 가전제품이다. 하지만 현재 시중에 나와 있는 AI 기반 집 전체 스마트 모델이 미래 산업의 주인공이 될 수 있을까? 가전업계에 새로운 경쟁 패턴이 나타날 것인가? 본 글에서는 이를 세 가지 측면에서 분석해 본다. 집 전체 지능을 사용할 때 천둥소리는 크고 빗방울 소리는 부드러운 이유는 무엇입니까? 출처: Statista, Zhongan.com, iResearch Consulting, Luotu Technology, 국가 자물쇠 산업 정보 센터

2023년에는 생성적 인공지능(Artificial Intelligence 생성 콘텐츠, 줄여서 AIGC)이 기술 분야에서 가장 뜨거운 주제가 되었습니다. 제조 업계에서는 생성적 AI라는 새로운 기술을 어떻게 활용해야 할까요? 디지털 트랜스포메이션을 추진하는 대다수 중소기업은 여기서 어떤 영감을 얻을 수 있을까? 최근 Amazon Cloud Technology는 제조 업계 대표들과 협력하여 중국 제조 산업의 현재 개발 동향, 전통 제조의 디지털 전환이 직면한 과제와 기회, 생성 인공 지능을 통한 제조의 혁신적인 재구성에 대해 논의했습니다. -제조업계에서의 생성적 AI 적용 현황에 대해 심도 있게 논의합니다. 중국의 제조업에 대해 언급합니다.

IMAX China의 AI 아트 블록버스터가 극장을 클래식 랜드마크인 Lijiang으로 옮깁니다. Time News 최근 IMAX는 AI 기술의 도움으로 중국 최초의 AI 아트 블록버스터를 만들었습니다. IMAX 극장은 만리장성, Dunhuang, Guilin Lijiang 및 Zhangye Danxia에 '상륙'했습니다. 이 지역에는 고전적인 국내 랜드마크가 많이 있습니다. 이 AI 아트 블록버스터는 IMAX가 디지털 아티스트 @kefan404 및 NEO Digital과 공동으로 제작한 4개의 그림으로 구성됩니다. 풍부한 문화유산을 지닌 도시 둔황은 계림의 리강 풍경과 조화를 이루거나 산 사이에 장엄한 만리장성을 내려다보며 사람들의 상상이 실현되는 날을 기대하지 않을 수 없습니다. 실현 될거야. 2008년부터 일본 도쿄에서

올해부터 360그룹 창업주 저우훙이(周洪伯)는 모든 공개 연설에서 한 가지 주제를 빼놓을 수 없었다. 바로 인공지능 대형 모델이다. 그는 한때 자신을 "GPT 전도사"라고 불렀으며 ChatGPT가 달성한 혁신에 대해 칭찬을 아끼지 않았으며 AI 기술 반복의 결과에 대해 확고히 낙관했습니다. 자신을 표현하는 데 능숙한 유명 기업가인 Zhou Hongyi의 연설은 종종 재치 있는 발언으로 가득 차 있기 때문에 그의 '설교'도 많은 화제를 불러일으켰고 실제로 대형 AI 모델의 불씨에 연료를 추가했습니다. 그러나 Zhou Hongyi에게는 오피니언 리더가 되는 것만으로는 충분하지 않습니다. 외부 세계는 그가 운영하는 회사인 360이 이러한 새로운 AI 물결에 어떻게 대응하는지에 더 관심을 갖고 있습니다. 실제로 Zhou Hongyi는 360 내에서 이미 모든 직원을 대상으로 변화를 시작했으며 지난 4월 모든 직원과 360의 모든 직원을 요청하는 내부 서신을 발행했습니다.

Yu Chengdong Huawei 상무이사는 오늘 Weibo에 HDC 컨퍼런스 초대장을 게시하여 Hongmeng이 AI 대형 모델 역량을 보유할 수 있음을 시사했습니다. 그의 후속 웨이보 콘텐츠에 따르면 초대 텍스트는 스마트 음성 비서 샤오이(Xiaoyi)에 의해 생성됐다. Yu Chengdong은 Hongmeng World가 곧 더 스마트하고 사려 깊은 새로운 경험을 가져올 것이라고 말했습니다. 이전에 노출된 정보에 따르면 Hongmeng 4는 올해 AI 기능에서 상당한 진전을 이루어 AI를 Hongmeng 시스템의 핵심 기능으로 더욱 통합할 것으로 예상됩니다.

수동 콜센터 시대부터 IVR 프로세스 설계, 온라인 고객 서비스 시스템 등의 적용을 경험하며 오늘날의 인공지능(AI) 고객 서비스로 발전했다. 고객에게 서비스를 제공하는 중요한 창구로서 고객 서비스 산업은 항상 시대의 선두에 서서 끊임없이 새로운 기술을 사용하여 새로운 생산성을 개발하고 고효율, 고품질, 고 서비스 및 개인화 된 전천후 고객을 향해 나아가고 있습니다. 서비스. 고객 수가 증가하고 인건비 비용이 급격히 증가하는 상황에서 인공 지능, 빅 데이터 등 차세대 정보 기술을 활용하여 노동 집약적에서 지능형, 세련되고 세련된 산업까지 다양한 산업 분야의 고객 서비스 센터를 홍보하는 방법은 무엇입니까? 기술 혁신과 업그레이드는 많은 산업이 직면한 중요한 문제가 되었습니다. 인공지능 기술의 지속적인 발전과 시나리오 기반 애플리케이션의 급속한 발전에 힘입어,

미래 기술이 넘쳐나는 세상에서 인공지능은 인간의 삶에 없어서는 안 될 조력자가 되었습니다. 그러나 인공지능은 우리의 삶을 편리하게 할 뿐만 아니라, 조용히 인간 사회의 구조와 운영을 변화시키고 있습니다. 가장 중요한 긍정적 의미 중 하나는 정보 평등이 디지털 격차를 해소하여 모든 사람이 기술이 제공하는 편리함을 동등하게 누릴 수 있다는 점입니다. 현재 디지털 시대에 정보화는 사회 발전을 촉진하는 중요한 힘이 되었습니다. 그러나 우리는 또한 현실적 문제에 직면해 있습니다. 즉, 일부 사람들이 기술이 제공하는 편리함을 누리지 못하게 하는 디지털 격차가 있다는 것입니다. 따라서 정보화에 있어 평등한 권리는 특히 중요하며, 이를 통해 정보 격차를 해소하고 과학기술 발전의 성과를 모두가 평등하게 공유하며 전반적인 사회 발전을 이룰 수 있습니다.
