다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Aug 22, 2023 pm 01:49 PM

영상 연구

최근 몇 년 동안 이미지 생성 기술은 많은 중요한 혁신을 이루었습니다. 특히 DALLE2 및 Stable Diffusion과 같은 대형 모델이 출시된 이후 텍스트 생성 이미지 기술이 점차 성숙해졌으며 고품질 이미지 생성에는 광범위한 실제 시나리오가 있습니다. 그러나 기존 이미지의 세부 편집은 여전히 어려운 문제입니다

한편으로는 텍스트 설명의 한계로 인해 기존 고품질 텍스트 이미지 모델은 이미지를 설명적으로 편집하기 위해 텍스트만 사용할 수 있으며 일부 특정 반면, 실제 적용 시나리오에서는 이미지 개선 편집 작업에 소수의 참조 이미지만 있는 경우가 많습니다. 이로 인해 학습을 위해 많은 양의 데이터가 필요한 많은 솔루션이 소규모로 만들어집니다. 특히 참조 이미지가 하나만 있는 경우에는 데이터 양이 많아 작업하기가 어렵습니다.

최근 NetEase Interactive Entertainment AI Lab의 연구원들은 단일 이미지 안내를 기반으로 하는 이미지 간 편집 솔루션을 제안했습니다. 단일 참조 이미지가 주어지면 참조 이미지의 개체나 스타일을 변경하지 않고 원본 이미지로 마이그레이션할 수 있습니다. 소스 이미지의 전체 구조.

연구 논문이 ICCV 2023에 승인되었으며 관련 코드가 오픈 소스로 공개되었습니다. 주소 주소 : https://arxiv.org/abs/2307.14352 코드 주소 : https://github.com/crystalneuro/visual-concept-translator

논문 렌더링: 각 사진 세트의 왼쪽 상단은 원본 이미지, 왼쪽 하단은 참조 이미지, 오른쪽은 생성된 결과 이미지입니다메인 프레임

논문의 저자는 Inversion-Fusion - VCT(시각 개념 변환기, 시각적 개념 변환기)를 기반으로 하는 이미지 편집 프레임워크를 제안했습니다.

아래 그림과 같이 VCT의 전체 프레임워크는 콘텐츠-개념 반전 프로세스(Content-concept Inversion)와 콘텐츠-개념 융합 프로세스(Content-concept Fusion)의 두 가지 프로세스로 구성됩니다. 콘텐츠-개념 반전 프로세스는 두 가지 다른 반전 알고리즘을 사용하여 원본 이미지의 구조 정보와 참조 이미지의 의미 정보의 잠재 벡터를 각각 학습하고 표현합니다. 콘텐츠-개념 융합 프로세스는 구조 정보의 잠재 벡터를 사용합니다. 최종 결과를 생성하기 위한 의미 정보를 융합합니다.

다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

다시 작성해야 하는 내용은 논문의 주요 프레임워크입니다.

최근 GAN(Generative Adversarial Networks) 분야에서는 반전 방법이 사용되었다는 점을 언급할 가치가 있습니다. 이미지 생성 작업에서 널리 사용되고 많은 놀라운 결과를 얻었습니다 [1]. GAN이 콘텐츠를 다시 작성할 때 원본 텍스트를 중국어로 다시 작성해야 하며, 학습된 GAN 생성기의 숨겨진 공간에 그림을 매핑할 수 있으며, 편집 목적을 제어할 수 있습니다. 숨겨진 공간. 이 반전 방식은 사전 훈련된 생성 모델의 생성 능력을 완전히 활용할 수 있습니다. 본 연구에서는 실제로 GAN으로 내용을 다시 작성해야 하며, 확산 모델을 우선적으로 적용한 이미지 안내 기반의 이미지 편집 작업에는 원문을 중국어로 다시 작성해야 합니다.

다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

내용을 다시 작성할 때 원문을 중국어로 다시 작성해야 하며 원문은 나올 필요가 없습니다

방법 소개

역전의 아이디어를 바탕으로, VCT는 콘텐츠 재구성 분기 B*와 편집용 마스터 분기 B를 포함하는 2개 분기 확산 프로세스를 설계했습니다. 이는 콘텐츠 재구성 및 콘텐츠 편집을 위해 각각 확산 모델을 사용하여 이미지의 노이즈를 계산하는 알고리즘인 DDIM Inversion

【2】 다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

에서 얻은 동일한 노이즈 xT에서 시작합니다. 본 논문에서 사용된 사전 훈련 모델은 잠재 벡터 공간 z 공간에서 확산 프로세스가 발생하는 잠재 확산 모델(Latent Diffusion Models, LDM)입니다. 이중 분기 프로세스는 다음과 같이 표현될 수 있습니다.

이중 분기 확산 프로세스

콘텐츠 재구성 분기 B*는 원본 이미지의 구조적 정보를 복원하는 데 사용되는 T 콘텐츠 특징 벡터 다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다. 를 학습하고 소프트 어텐션 제어 방식을 통해 구조 정보 마스터 브랜치 B의 편집자에게 전달됩니다. 소프트 어텐션 제어 방식은 Google의 프롬프트2프롬프트[3] 작업을 기반으로 합니다. 공식은 다음과 같습니다.

다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

즉, 확산 모델의 실행 단계 수가 특정 범위 내에 있을 때의 어텐션 특징 맵은 다음과 같습니다. 기본 분기 편집은 생성된 이미지의 구조적 제어를 달성하기 위해 콘텐츠 재구성 분기 기능 맵으로 대체됩니다. 편집 메인 브랜치 B는 원본 이미지에서 학습한 콘텐츠 특징 벡터 다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다. 와 참조 이미지에서 학습한 개념 특징 벡터 를 결합하여 편집된 그림을 생성합니다.

다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

노이즈 공간( 다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다. space) fusion

확산 모델의 각 단계마다 특징 벡터의 융합이 노이즈 공간 공간에서 발생하는데, 이는 확산 이후 예측된 노이즈의 가중치입니다. 특징 벡터는 확산 모델에 입력됩니다. 콘텐츠 재구성 분기의 특징 혼합은 콘텐츠 특징 벡터 다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다. 및 빈 텍스트 벡터에서 발생하며 분류자 없는 확산 지침 [4]의 형태와 일치합니다.

다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

편집 혼합 main Branch 콘텐츠 특징 벡터 다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다. 와 개념 특징 벡터 가 혼합된

다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

이때 연구의 핵심은 구조 정보의 특징 벡터를 어떻게 구하는가이다. 단일 소스 이미지 다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다. 및 단일 소스 이미지에서 개념 정보의 특징 벡터 를 얻기 위한 참조 사진. 이 기사는 두 가지 다른 반전 방식을 통해 이 목적을 달성합니다.

원본 이미지를 복원하기 위해 기사에서는 NULL-text[5] 최적화 방식을 참조하고 T 단계의 특징 벡터를 학습하여 소스 이미지를 일치시키고 적합시킵니다. 그러나 DDIM 경로에 맞게 빈 텍스트 벡터를 최적화하는 NULL 텍스트와 달리 이 기사에서는 소스 이미지 특징 벡터를 최적화하여 추정된 순수 특징 벡터를 직접 맞춥니다. 피팅 공식은

다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

구조적 정보 학습과 달리 참조 이미지의 개념 정보는 고도로 일반화된 단일 특징 벡터로 표현되어야 합니다. 확산 모델의 T 단계는 개념 특징 벡터 다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다. 를 공유합니다. 이 기사는 기존 반전 방식인 Textual Inversion [6] 및 DreamArtist [7]을 최적화합니다. 손실 함수에는 확산 모델의 잡음 추정 항과 잠재 벡터 공간의 추정 재구성 손실 항이 포함됩니다.

다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

실험 결과

이 기사에서는 원본 이미지의 구조적 정보를 더 잘 유지하면서 내용을 참조 이미지의 주제나 스타일로 변경할 수 있는 주제 교체 및 스타일화 작업에 대한 실험을 수행합니다. REWRITTEN 컨텐츠 : 실험 효과에 관한 논문 aid 이전 솔루션과 비교 하여이 기사에서 제안 된 VCT 프레임 워크에는 다음과 같은 장점이 있습니다. : 이미지 안내를 기반으로 한 이전 이미지 편집 작업에 비해 VCT는 훈련에 많은 양의 데이터가 필요하지 않으며 생성 품질과 일반화가 더 좋습니다. 반전 아이디어를 기반으로 하며 오픈 월드 데이터에 대해 사전 훈련된 고품질 Vincentian 그래프 모델을 기반으로 합니다. 실제 적용에서는 더 나은 이미지 편집 효과를 얻기 위해 하나의 입력 이미지와 하나의 참조 이미지만 필요합니다.

(2) 시각적 정확도: 다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다. 최근 텍스트 편집 이미지 솔루션과 비교하여 VCT는 참조 지침으로 그림을 사용합니다. 그림 참조를 사용하면 텍스트 설명보다 더 정확하게 그림을 편집할 수 있습니다. 다음 그림은 VCT와 다른 솔루션 간의 비교 결과를 보여줍니다.

과목 대체 작업의 효과 비교

스타일 이전 작업 비교

(3) 추가 정보가 필요하지 않습니다. 안내 제어를 위해 추가 제어 정보(예: 마스크 맵 또는 깊이 맵)를 추가해야 하는 일부 최신 솔루션과 비교하여 VCT는 소스 이미지와 참조 이미지에서 구조적 정보와 의미 정보를 직접 학습합니다. 다음 그림은 몇 가지 비교 결과를 보여줍니다. 그 중 Paint-by-example은 소스 이미지의 마스크 맵을 제공하여 해당 객체를 참조 이미지의 객체로 대체합니다. Controlnet은 생성된 결과를 선 그리기, 깊이 맵 등을 통해 제어하고 VCT는 소스에서 직접 그립니다. 이미지와 참조 이미지를 학습하여, 추가적인 제한 없이 대상 이미지에 융합될 구조 정보와 콘텐츠 정보를 학습합니다.

다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

이미지 안내 기반 이미지 편집 솔루션의 대비 효과

다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

NetEase Interactive Entertainment AI Lab

NetEase Interactive Entertainment AI Lab은 2017년에 설립되었으며 NetEase Interactive Entertainment Business Group에 속해 있습니다. 게임업계 최고의 인공지능 연구실입니다. 연구실에서는 컴퓨터 비전, 음성 및 자연어 처리, 게임 시나리오의 강화 학습에 대한 연구 및 응용에 중점을 두고 있습니다. AI 기술을 통해 넷이즈 인터랙티브 엔터테인먼트의 인기 게임과 제품의 기술 수준을 향상시키는 것을 목표로 합니다. 현재 이 기술은 "Fantasy Westward Journey", "Harry Potter: Magic Awakening", "음양사", "Westward Journey" 등 많은 인기 게임에 사용되었습니다.

위 내용은 다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7530

Cakephp 튜토리얼

1378

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

Windows Spotlight 바탕화면 이미지 PC 어떻게 다운로드? Aug 23, 2023 pm 02:06 PM

Windows는 결코 미학을 무시하는 제품이 아닙니다. XP의 목가적인 녹색 들판부터 Windows 11의 푸른 소용돌이 디자인까지, 기본 바탕 화면 배경화면은 수년간 사용자 즐거움의 원천이었습니다. 이제 Windows 추천을 사용하면 매일 잠금 화면과 바탕 화면 배경 무늬에 사용할 아름답고 경외감을 불러일으키는 이미지에 직접 액세스할 수 있습니다. 불행히도 이러한 이미지는 어울리지 않습니다. Windows 스포트라이트 이미지 중 하나가 마음에 든다면 한동안 배경으로 유지할 수 있도록 해당 이미지를 다운로드하는 방법을 알고 싶을 것입니다. 여기에 당신이 알아야 할 모든 것이 있습니다. WindowsSpotlight란 무엇입니까? Window Spotlight는 설정 앱의 개인 설정 &gt에서 사용할 수 있는 자동 배경화면 업데이트 프로그램입니다.

모델, 데이터 및 프레임워크에 대한 심층 분석: 효율적인 대규모 언어 모델에 대한 철저한 54페이지 검토 Jan 14, 2024 pm 07:48 PM

대규모 언어 모델(LLM)은 자연어 이해, 언어 생성, 복잡한 추론을 비롯한 여러 중요한 작업에서 강력한 기능을 입증했으며 사회에 지대한 영향을 미쳤습니다. 그러나 이러한 뛰어난 기능을 사용하려면 상당한 교육 리소스(왼쪽 참조)와 긴 추론 시간(오른쪽 참조)이 필요합니다. 따라서 연구자들은 효율성 문제를 해결하기 위한 효과적인 기술적 수단을 개발해야 합니다. 또한 그림의 오른쪽에서 볼 수 있듯이 Mistral-7B와 같은 일부 효율적인 LLM(LanguageModel)이 LLM의 설계 및 배포에 성공적으로 사용되었습니다. 이러한 효율적인 LLM은 LLaMA1-33B와 유사한 정확도를 유지하면서 추론 메모리를 크게 줄일 수 있습니다.

Python에서 이미지 의미 분할 기술을 사용하는 방법은 무엇입니까? Jun 06, 2023 am 08:03 AM

인공지능 기술이 지속적으로 발전하면서 이미지 의미분할 기술은 이미지 분석 분야에서 인기 있는 연구 방향이 되었다. 이미지 의미론적 분할에서는 이미지의 다양한 영역을 분할하고 각 영역을 분류하여 이미지에 대한 포괄적인 이해를 얻습니다. Python은 잘 알려진 프로그래밍 언어입니다. 강력한 데이터 분석 및 데이터 시각화 기능으로 인해 인공 지능 기술 연구 분야에서 가장 먼저 선택됩니다. 이 기사에서는 Python에서 이미지 의미 분할 기술을 사용하는 방법을 소개합니다. 1. 전제 지식이 심화되고 있습니다.

Nvidia의 차세대 GPU, H100을 깨다 공개! 2024년에 공개된 최초의 3nm 멀티칩 모듈 디자인 Sep 30, 2023 pm 12:49 PM

3nm 공정, H100을 능가하는 성능! 최근 외신 디지타임스는 엔비디아가 차세대 GPU인 B100(코드명 '블랙웰')을 인공지능(AI)과 고성능컴퓨팅(HPC) 애플리케이션용 제품으로 개발 중이라는 소식을 전했다. B100은 TSMC의 3nm 공정 공정과 더욱 복잡한 MCM(멀티 칩 모듈) 설계를 사용하며 2024년 4분기에 출시될 예정입니다. 인공지능 GPU 시장의 80% 이상을 독점하고 있는 엔비디아의 경우, B100을 이용해 철이 뜨거울 때 공격할 수 있고, 이번 AI 배치 물결에서 AMD, 인텔 등 도전자들을 더욱 공격할 수 있다. NVIDIA 추정에 따르면, 2027년까지 이 분야의 출력 가치는 대략적으로 도달할 것으로 예상됩니다.

iOS 17: 사진에서 원클릭 자르기를 사용하는 방법 Sep 20, 2023 pm 08:45 PM

Apple은 iOS 17 사진 앱을 통해 원하는 대로 사진을 더 쉽게 자를 수 있습니다. 방법을 알아보려면 계속 읽어보세요. 이전 iOS 16에서는 사진 앱에서 이미지를 자르는 데 여러 단계가 필요했습니다. 편집 인터페이스를 탭하고 자르기 도구를 선택한 다음 핀치 투 줌 동작을 사용하거나 자르기 도구의 모서리를 드래그하여 자르기를 조정합니다. iOS 17에서 Apple은 고맙게도 이 프로세스를 단순화하여 사진 라이브러리에서 선택한 사진을 확대하면 화면 오른쪽 상단에 새로운 자르기 버튼이 자동으로 나타납니다. 이를 클릭하면 선택한 확대/축소 수준으로 전체 자르기 인터페이스가 표시되므로 원하는 이미지 부분으로 자르기, 이미지 회전, 이미지 반전, 화면 비율 적용 또는 마커 사용이 가능합니다.

다중 모드 대형 모델에 대한 가장 포괄적인 리뷰가 여기에 있습니다! 마이크로소프트 연구원 7명 적극 협력, 5개 주요 주제, 119페이지 분량의 문서 Sep 25, 2023 pm 04:49 PM

다중 모드 대형 모델에 대한 가장 포괄적인 리뷰가 여기에 있습니다! Microsoft의 중국 연구원 7명이 집필한 이 책은 119페이지로 구성되어 있습니다. 이는 이미 완성되어 현재까지 선두에 있는 두 가지 유형의 다중 모드 대형 모델 연구 방향에서 시작하여 시각적 이해와 시각적 생성이라는 5가지 구체적인 연구 주제를 포괄적으로 요약합니다. 통합 시각적 모델 LLM이 지원하는 다중 모드 대형 모델 다중 모드 에이전트는 현상에 초점을 맞춥니다. 다중 모드 기본 모델은 전문화된 모델에서 범용 모델로 이동했습니다. Ps. 그래서 저자는 논문 서두에 도라에몽의 이미지를 직접 그렸습니다. 이 리뷰(보고서)를 누가 읽어야 합니까? Microsoft의 원래 말로: 전문 연구원이든 학생이든 다중 모달 기본 모델의 기본 지식과 최신 진행 상황을 배우는 데 관심이 있는 한 이 콘텐츠는 함께 모이는 데 매우 적합합니다.

Windows에서 PowerToys를 사용하여 이미지 크기를 일괄 조정하는 방법 Aug 23, 2023 pm 07:49 PM

매일 이미지 파일로 작업해야 하는 사람들은 프로젝트와 작업의 필요에 맞게 크기를 조정해야 하는 경우가 많습니다. 그러나 처리할 이미지가 너무 많으면 개별적으로 크기를 조정하는 데 많은 시간과 노력이 소요될 수 있습니다. 이 경우 PowerToys와 같은 도구는 무엇보다도 이미지 크기 조정 유틸리티를 사용하여 이미지 파일의 크기를 일괄 조정하는 데 유용할 수 있습니다. Image Resizer 설정을 지정하고 PowerToys를 사용하여 이미지 일괄 크기 조정을 시작하는 방법은 다음과 같습니다. PowerToys를 사용하여 이미지 크기를 일괄 조정하는 방법 PowerToys는 일상 작업 속도를 높이는 데 도움이 되는 다양한 유틸리티와 기능을 갖춘 올인원 프로그램입니다. 유틸리티 중 하나는 이미지입니다.

iOS 17을 사용하여 iPhone에서 사진을 편집하는 방법 Nov 30, 2023 pm 11:39 PM

모바일 사진은 우리가 삶의 순간을 포착하고 공유하는 방식을 근본적으로 변화시켰습니다. 이러한 변화에는 스마트폰, 특히 아이폰의 등장이 중요한 역할을 했습니다. 고급 카메라 기술과 사용자 친화적인 편집 기능으로 잘 알려진 iPhone은 아마추어와 숙련된 사진작가 모두에게 최고의 선택이 되었습니다. iOS 17의 출시는 이러한 여정에서 중요한 이정표가 됩니다. Apple의 최신 업데이트는 향상된 사진 편집 기능 세트를 제공하여 사용자에게 일상적인 스냅샷을 시각적으로 매력적이고 예술적으로 풍부한 이미지로 바꿀 수 있는 더욱 강력한 도구 키트를 제공합니다. 이러한 기술 발전은 사진 촬영 과정을 단순화할 뿐만 아니라 창의적인 표현을 위한 새로운 길을 열어 사용자가 사진에 전문적인 터치를 쉽게 추가할 수 있게 해줍니다.

See all articles

다양한 스타일의 VCT 안내가 모두 하나의 그림에 담겨 있어 쉽게 구현할 수 있습니다.

실험 결과

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제