GPT-3와 Stable Diffusion은 함께 작동하여 모델이 Party A의 이미지 리터칭 요구 사항을 이해하도록 돕습니다.
확산 모델이 인기를 얻은 이후 많은 사람들이 원하는 이미지를 생성하기 위해 보다 효과적인 프롬프트를 사용하는 방법에 집중했습니다. 일부 AI 그림 모델의 지속적인 시도에서 사람들은 AI 그림 그림을 잘 만들기 위한 키워드 경험을 다음과 같이 요약하기도 했습니다.
즉 올바른 AI 기술을 익히면 그림의 품질이 효과는 매우 분명할 것입니다(참조: ""농구하는 알파카"를 그리는 방법? 누군가 DALL·E 2의 진정한 실력을 보여주기 위해 13달러를 썼습니다").
또한 일부 연구자들은 단 몇 마디만으로 그림을 우리가 원하는 대로 바꾸는 방법이라는 또 다른 방향으로 연구하고 있습니다.
얼마 전 Google Research 및 기타 기관에서 진행한 연구에 대해 보고했습니다. 원하는 사진이 무엇인지 말하면 기본적으로 요구 사항이 충족되고 강아지를 앉히는 것과 같은 사실적인 이미지가 생성됩니다.
다음은 모델에 대한 입력입니다. 설명은 "a 개가 앉아 있다'라고 말하지만, 사람들의 일상적인 의사소통 습관에 따르면 가장 자연스러운 설명은 '이 개를 앉게 놔두세요'입니다. 일부 연구자들은 이것이 최적화되어야 하는 문제이며 모델이 인간의 언어 습관과 더 일치해야 한다고 믿습니다.
최근 UC Berkeley 연구팀은 인간의 지시를 기반으로 이미지를 편집하는 새로운 방법인 InstructPix2Pix를 제안했습니다. 입력 이미지와 모델에 무엇을 해야 하는지 알려주는 텍스트 설명이 주어지면 모델은 설명 지침에 따라 다음 작업을 수행할 수 있습니다. 이미지를 편집하세요.
문서 주소: https://arxiv.org/pdf/2211.09800.pdf
예를 들어 그림 속 해바라기를 장미로 바꾸려면 "Put"이라고 직접 말하면 됩니다. "장미로 대체된 해바라기 모델":
교육 데이터를 얻기 위해 연구에서는 두 가지 대규모 사전 교육 모델, 즉 언어 모델(GPT-3)과 텍스트-이미지 생성을 결합했습니다. 모델(Stable Diffusion)을 사용하여 이미지 편집 예제의 대규모 쌍별 학습 데이터 세트를 생성합니다. 연구원들은 이 대규모 데이터세트에 대해 새로운 모델인 InstructPix2Pix를 훈련하고 추론 시 실제 이미지와 사용자가 작성한 지침으로 일반화했습니다.
InstructPix2Pix는 입력 이미지와 이미지 편집을 위한 텍스트 명령이 주어지면 편집된 이미지를 생성하는 조건부 확산 모델입니다. 모델은 정방향 패스에서 직접 이미지 편집을 수행하며 추가 예시 이미지, 입력/출력 이미지에 대한 전체 설명 또는 각 예시의 미세 조정이 필요하지 않으므로 모델은 단 몇 초 만에 이미지를 빠르게 편집할 수 있습니다.
InstructPix2Pix는 합성 예제(예: GPT-3에서 생성된 텍스트 설명 및 Stable Diffusion에서 생성된 이미지)에 대해 전적으로 학습되었지만 이 모델은 임의의 실제 이미지와 사람이 작성한 텍스트에 대한 제로샷 일반화를 달성합니다. 모형은 객체 교체, 이미지 스타일 변경 등을 포함한 직관적인 이미지 편집을 지원합니다.
방법 개요
연구원들은 지침 기반 이미지 편집을 지도 학습 문제로 처리했습니다. 먼저 텍스트 편집 지침과 편집 전후의 이미지가 포함된 쌍을 이루는 훈련 데이터 세트를 생성했습니다(그림 2a-c). 그런 다음 이미지 편집 이 생성된 데이터 세트에 대해 확산 모델이 훈련되었습니다(그림 2d). 생성된 이미지와 편집 지침을 사용하여 학습했지만 모델은 여전히 사람이 작성한 임의의 지침을 사용하여 실제 이미지를 편집할 수 있습니다. 아래 그림 2는 방법의 개요입니다.
다중 모드 훈련 데이터 세트 생성
데이터 세트 생성 단계에서 연구원들은 대규모 언어 모델(GPT-3)과 텍스트-이미지 모델( Stable Diffusion(안정 확산) 기능, 텍스트 편집 지침과 편집 전후의 해당 이미지가 포함된 다중 모드 훈련 데이터 세트가 생성되었습니다. 이 프로세스는 다음 단계로 구성됩니다.
- GPT-3를 미세 조정하여 텍스트 편집 콘텐츠 모음 생성: 이미지를 설명하는 프롬프트가 제공되면 수행할 변경 사항을 설명하는 텍스트 지침과 이미지를 설명하는 프롬프트를 생성합니다. 변경된 이미지(그림 2a)
- 는 텍스트-이미지 모델을 사용하여 두 개의 텍스트 프롬프트(즉, 편집 전과 편집 후)를 해당 이미지 쌍으로 변환합니다(그림 2b). 연구원들은 생성된 훈련 데이터를 사용하여 서면 지침에 따라 이미지를 편집할 수 있는 Stable Diffusion 모델을 기반으로 조건부 확산 모델을 훈련했습니다.
확산 모델은 데이터 분포의 비율(고밀도 데이터 방향을 가리킴)을 추정하는 일련의 노이즈 제거 자동 인코더를 통해 데이터 샘플을 생성하는 방법을 학습합니다. 잠재 확산은 인코더 및 디코더
를 사용하여 사전 훈련된 Variational Autoencoder의 잠재 공간에서 작동함으로써 확산 모델의 효율성과 품질을 향상시킵니다.
이미지 x의 경우 확산 프로세스는 인코딩된 잠재 에 노이즈를 추가하며, 이는 시간 간격 t∈T에 따라 노이즈 수준이 증가하는 시끄러운 잠재 z_t를 생성합니다. 우리는 이미지 컨디셔닝 C_I와 텍스트 명령어 컨디셔닝 C_T가 주어지면 시끄러운 잠재성 z_t에 추가되는 노이즈를 예측하는 네트워크를 학습합니다. 연구원들은 다음과 같은 잠재 확산 목표를 최소화했습니다.
이전의 연구(Wang et al.)에서는 이미지 변환 작업의 경우, 특히 쌍을 이루는 훈련 데이터가 제한적일 때 미세 조정된 대형 이미지 확산 모델이 훈련보다 성능이 뛰어난 것으로 나타났습니다. 처음부터. 따라서 새로운 연구에서 저자는 사전 훈련된 Stable Diffusion 체크포인트를 사용하여 모델의 가중치를 초기화하고 강력한 텍스트-이미지 생성 기능을 활용합니다. 이미지 조절을 지원하기 위해 연구원들은 z_t와
를 연결하는 첫 번째 컨볼루셔널 레이어에 추가 입력 채널을 추가했습니다. 확산 모델의 사용 가능한 모든 가중치는 사전 훈련된 체크포인트에서 초기화되고, 새로 추가된 입력 채널에서 작동하는 가중치는 0으로 초기화됩니다. 여기서 저자는 텍스트 편집 명령 c_T를 입력으로 사용하지 않고 원래 캡션에 사용된 것과 동일한 텍스트 조정 메커니즘을 재사용합니다.
실험 결과
아래 그림에서 저자는 새로운 모델의 이미지 편집 결과를 보여줍니다. 이 결과는 실제 사진과 예술작품의 다른 세트에 대한 것입니다. 새 모델은 객체 교체, 계절 및 날씨 변경, 배경 교체, 재료 속성 수정, 아트 미디어 변환 등을 포함하여 여러 가지 까다로운 편집을 성공적으로 수행합니다.연구원들은 새로운 방법을 SDEdit, Text2Live 등과 같은 일부 최신 기술과 비교했습니다. 새로운 모델은 이미지 편집 지침을 따르는 반면, 기준 방법을 포함한 다른 방법에는 이미지 또는 편집 레이어에 대한 설명이 필요합니다. 따라서 비교할 때 작성자는 편집 지침 대신 후자에 대해 "편집된" 텍스트 주석을 제공합니다. 또한 저자는 이미지 일관성과 편집 품질을 측정하는 두 가지 측정 기준을 사용하여 새로운 방법을 SDEdit과 정량적으로 비교합니다. 마지막으로 저자는 생성된 훈련 데이터의 크기와 품질이 모델 성능의 절제 결과에 어떻게 영향을 미치는지 보여줍니다.
위 내용은 GPT-3와 Stable Diffusion은 함께 작동하여 모델이 Party A의 이미지 리터칭 요구 사항을 이해하도록 돕습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











CentOS 종료 명령은 종료이며 구문은 종료 [옵션] 시간 [정보]입니다. 옵션은 다음과 같습니다. -H 시스템 중지 즉시 옵션; -P 종료 후 전원을 끕니다. -R 다시 시작; -대기 시간. 시간은 즉시 (현재), 분 (분) 또는 특정 시간 (HH : MM)으로 지정할 수 있습니다. 추가 정보는 시스템 메시지에 표시 될 수 있습니다.

CentOS 시스템 하에서 Gitlab의 백업 및 복구 정책 데이터 보안 및 복구 가능성을 보장하기 위해 CentOS의 Gitlab은 다양한 백업 방법을 제공합니다. 이 기사는 완전한 GITLAB 백업 및 복구 전략을 설정하는 데 도움이되는 몇 가지 일반적인 백업 방법, 구성 매개 변수 및 복구 프로세스를 자세히 소개합니다. 1. 수동 백업 gitlab-rakegitlab : 백업 : 명령을 작성하여 수동 백업을 실행하십시오. 이 명령은 gitlab 저장소, 데이터베이스, 사용자, 사용자 그룹, 키 및 권한과 같은 주요 정보를 백업합니다. 기본 백업 파일은/var/opt/gitlab/backups 디렉토리에 저장됩니다. /etc /gitlab을 수정할 수 있습니다

CentOS 시스템에서 HDFS 구성 확인에 대한 완전한 안내서이 기사에서는 CentOS 시스템에서 HDF의 구성 및 실행 상태를 효과적으로 확인하는 방법을 안내합니다. 다음 단계는 HDF의 설정 및 작동을 완전히 이해하는 데 도움이됩니다. Hadoop 환경 변수 확인 : 먼저 Hadoop 환경 변수가 올바르게 설정되어 있는지 확인하십시오. 터미널에서 다음 명령을 실행하여 Hadoop이 올바르게 설치되고 구성되었는지 확인하십시오. Hadoopversion Check HDFS 구성 파일 : HDFS의 Core 구성 파일은/etc/hadoop/conf/directory에 있으며 Core-Site.xml 및 HDFS-Site.xml이 중요합니다. 사용

CentOS 시스템에서 Pytorch GPU 가속도를 활성화하려면 Cuda, Cudnn 및 GPU 버전의 Pytorch를 설치해야합니다. 다음 단계는 프로세스를 안내합니다. CUDA 및 CUDNN 설치 CUDA 버전 호환성 결정 : NVIDIA-SMI 명령을 사용하여 NVIDIA 그래픽 카드에서 지원하는 CUDA 버전을보십시오. 예를 들어, MX450 그래픽 카드는 CUDA11.1 이상을 지원할 수 있습니다. Cudatoolkit 다운로드 및 설치 : NVIDIACUDATOOLKIT의 공식 웹 사이트를 방문하여 그래픽 카드에서 지원하는 가장 높은 CUDA 버전에 따라 해당 버전을 다운로드하여 설치하십시오. CUDNN 라이브러리 설치 :

Centos에 MySQL을 설치하려면 다음 단계가 필요합니다. 적절한 MySQL Yum 소스 추가. mysql 서버를 설치하려면 yum install mysql-server 명령을 실행하십시오. mysql_secure_installation 명령을 사용하여 루트 사용자 비밀번호 설정과 같은 보안 설정을 작성하십시오. 필요에 따라 MySQL 구성 파일을 사용자 정의하십시오. MySQL 매개 변수를 조정하고 성능을 위해 데이터베이스를 최적화하십시오.

Docker는 Linux 커널 기능을 사용하여 효율적이고 고립 된 응용 프로그램 실행 환경을 제공합니다. 작동 원리는 다음과 같습니다. 1. 거울은 읽기 전용 템플릿으로 사용되며, 여기에는 응용 프로그램을 실행하는 데 필요한 모든 것을 포함합니다. 2. Union 파일 시스템 (Unionfs)은 여러 파일 시스템을 스택하고 차이점 만 저장하고 공간을 절약하고 속도를 높입니다. 3. 데몬은 거울과 컨테이너를 관리하고 클라이언트는 상호 작용을 위해 사용합니다. 4. 네임 스페이스 및 CGroup은 컨테이너 격리 및 자원 제한을 구현합니다. 5. 다중 네트워크 모드는 컨테이너 상호 연결을 지원합니다. 이러한 핵심 개념을 이해 함으로써만 Docker를 더 잘 활용할 수 있습니다.

SSH 서비스를 다시 시작하라는 명령은 SystemCTL SSHD를 다시 시작합니다. 자세한 단계 : 1. 터미널에 액세스하고 서버에 연결; 2. 명령을 입력하십시오 : SystemCTL SSHD 재시작; 3. 서비스 상태를 확인하십시오 : SystemCTL 상태 SSHD.

CentOS 시스템에 대한 Pytorch 분산 교육에는 다음 단계가 필요합니다. Pytorch 설치 : 전제는 Python과 PIP가 CentOS 시스템에 설치된다는 것입니다. CUDA 버전에 따라 Pytorch 공식 웹 사이트에서 적절한 설치 명령을 받으십시오. CPU 전용 교육의 경우 다음 명령을 사용할 수 있습니다. PipinStalltorchtorchvisiontorchaudio GPU 지원이 필요한 경우 CUDA 및 CUDNN의 해당 버전이 설치되어 있는지 확인하고 해당 PyTorch 버전을 설치하려면 설치하십시오. 분산 환경 구성 : 분산 교육에는 일반적으로 여러 기계 또는 단일 기계 다중 GPU가 필요합니다. 장소
