기술 주변기기 일체 포함 Dreambooth 및 Lora와 함께 미세 조정 안정 확산 XL

Dreambooth 및 Lora와 함께 미세 조정 안정 확산 XL

Mar 09, 2025 am 09:55 AM

이 튜토리얼은 안정적인 확산 XL (SDXL)과 DreamBooth를 탐색하여 이미지 생성 및 모델 미세 조정을 위해

라이브러리를 활용하는 방법을 보여줍니다. 개인 사진을 사용하여 SDXL을 미세 조정하고 결과를 평가할 것입니다. AI 신규 이민자들은 AI 기초 과정으로 시작하도록 권장됩니다. diffusers

안정적인 확산 이해 xl

안정성 AI의 SDXL 1.0은 AI 텍스트-이미지 생성에서 중요한 도약을 나타냅니다. 연구 전용 SDXL 0.9를 바탕으로 이제 가장 강력한 공개 이미지 생성 모델입니다. 광범위한 테스트는 다른 오픈 소스 대안에 비해 우수한 이미지 품질을 확인합니다.

arxiv.org의 이미지

이 개선 된 품질은 두 가지 모델의 앙상블에서 비롯됩니다 : 3.5 억 매개 변수 기본 생성기와 60 억 개의 매개 변수 정제소. 이 이중 접근 방식은 소비자 GPU의 효율성을 유지하면서 이미지 품질을 최적화합니다. SDXL 1.0은 이미지 생성을 단순화하여 간결한 프롬프트의 복잡한 결과를 생성합니다. 사용자 정의 데이터 세트 미세 조정도 간소화되어 이미지 구조, 스타일 및 구성을 세분화하는 제어를 제공합니다. Fine-tuning Stable Diffusion XL with DreamBooth and LoRA Dreambooth : 개인화 된 이미지 생성

Google의 Dreambooth (2022)는 생성 AI, 특히 안정적인 확산과 같은 텍스트-이미지 모델의 획기적인 것입니다. Google 연구원들이 설명하는 것처럼 : "사진 부스와 같지만 꿈을 취할 때마다 합성 할 수있는 방식으로 주제를 포착합니다."

. Dreambooth의 이미지

Dreambooth는 사용자 정의 피사체를 모델에 주입하여 특정 사람, 대상 또는 장면을위한 특수 발전기를 만듭니다. 훈련에는 몇 개의 (3-5) 이미지 만 필요합니다. 그런 다음 훈련 된 모델은 상상력에 의해서만 제한되는 다양한 설정과 포즈로 피사체를 배치합니다.

Dreambooth 응용 프로그램 Dreambooth의 사용자 정의 가능한 이미지 생성은 다양한 필드에 도움이됩니다 :

창의적 산업 : 그래픽 디자인, 광고 및 엔터테인먼트는 고유 한 시각적 컨텐츠 제작 능력의 혜택입니다. 개인화 :

는 현실 또는 순전히 가상의 설정에서 복제하기 어려운 시나리오를 만듭니다. 교육 및 연구 :

시각적 표현이 필요한 개인화 된 교육 내용 및 AIDS 연구를 생성합니다. 안정적인 확산 xl

에 액세스합니다 SDXL은 Hugging Face Space Demo (프롬프트에서 4 개의 이미지 생성) 또는 사용자 지정 프롬프트 이미지 생성을위한

Python 라이브러리를 통해 액세스 할 수 있습니다.

diffusers 가있는 설정 및 이미지 생성 CUDA 지원 GPU를 사용할 수 있는지 확인하십시오

install
!nvidia-smi
로그인 후 복사
:

모델을로드하십시오 (GPU 메모리 효율을 위해 FP16 사용) : Fine-tuning Stable Diffusion XL with DreamBooth and LoRA <:> 이미지 생성 :

헬퍼 기능을 사용하여 이미지 표시 (원본에서 제공) :

diffusers

%pip install --upgrade diffusers[torch] -q
로그인 후 복사
정유 업체로 결과 개선 품질 향상을 위해 SDXL 리파이너를 활용하십시오 :
from diffusers import DiffusionPipeline, AutoencoderKL
import torch

vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
pipe = DiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0", vae=vae, torch_dtype=torch.float16, variant="fp16", use_safetensors=True)
pipe.to("cuda");
로그인 후 복사

prompt = "A man in a spacesuit is running a marathon in the jungle."
image = pipe(prompt=prompt, num_inference_steps=25, num_images_per_prompt=4)
로그인 후 복사
autotrain advanced 를 사용한 미세 조정 sdxl autotrain advanced는 sdxl 미세 조정을 단순화합니다. 다음을 사용하여 설치하십시오

(참고 : 원본 자습서는 대체 방법으로 현재 구식 Colab 노트북을 사용합니다. 이것은 간결하게 생략됩니다.)

Dreambooth 미세 조정 (요약)
# ... (image_grid function from original code) ...
image_grid(image.images, 2, 2)
로그인 후 복사
그런 다음 튜토리얼에는 개인 데이터 세트의 AutotRain Advanced의 DreamBooth 스크립트를 사용하여 SDXL을 미세 조정하는 자세한 예제가 진행됩니다. 이 섹션에는 변수 설정, Kaggle 데이터 세트 생성 및 Autotrain 스크립트를 실행하는 것이 포함됩니다. 출력은 훈련 과정과 그 결과 로라 가중치가 포옹 얼굴에 업로드 된 것을 보여줍니다. 그런 다음 미세 조정 된 모델에 대한 추론이 시연되어 다양한 시나리오에서 지정된 주제의 생성 된 이미지를 보여줍니다. 마지막으로, 미세 조정 된 모델과 함께 정유소를 사용하는 것이 탐구됩니다. 길이 제약으로 인해이 자세한 섹션은 여기에서 크게 압축됩니다. 완전한 코드 및 설명은 원본을 참조하십시오.

결론 Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

이 튜토리얼은 SDXL과 DreamBooth에 대한 포괄적 인 개요를 제공하여

라이브러리 및 자동 트레인 고급 기능을 보여줍니다. 미세 조정 프로세스는 개인화 된 이미지 생성의 힘을 보여 주며, 정유 자와 미세 조정 모델과의 상호 작용과 같은 추가 탐색 영역을 강조합니다. 자습서는 AI 분야에서 추가 학습을위한 권장 사항으로 마무리됩니다.

위 내용은 Dreambooth 및 Lora와 함께 미세 조정 안정 확산 XL의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Meta Llama 3.2- 분석 Vidhya를 시작합니다 Meta Llama 3.2- 분석 Vidhya를 시작합니다 Apr 11, 2025 pm 12:04 PM

메타의 라마 3.2 : 멀티 모달 및 모바일 AI의 도약 Meta는 최근 AI에서 강력한 비전 기능과 모바일 장치에 최적화 된 가벼운 텍스트 모델을 특징으로하는 AI의 상당한 발전 인 Llama 3.2를 공개했습니다. 성공을 바탕으로 o

10 생성 AI 코드의 생성 AI 코딩 확장 대 코드를 탐색해야합니다. 10 생성 AI 코드의 생성 AI 코딩 확장 대 코드를 탐색해야합니다. Apr 13, 2025 am 01:14 AM

이봐, 코딩 닌자! 하루 동안 어떤 코딩 관련 작업을 계획 했습니까? 이 블로그에 더 자세히 살펴보기 전에, 나는 당신이 당신의 모든 코딩 관련 문제에 대해 생각하기를 원합니다. 완료? - &#8217

직원에게 AI 전략 판매 : Shopify CEO의 선언문 직원에게 AI 전략 판매 : Shopify CEO의 선언문 Apr 10, 2025 am 11:19 AM

Shopify CEO Tobi Lütke의 최근 메모는 AI 숙련도가 모든 직원에 대한 근본적인 기대를 대담하게 선언하여 회사 내에서 중요한 문화적 변화를 표시합니다. 이것은 도망가는 트렌드가 아닙니다. 그것은 p에 통합 된 새로운 운영 패러다임입니다

AV 바이트 : Meta ' S Llama 3.2, Google의 Gemini 1.5 등 AV 바이트 : Meta ' S Llama 3.2, Google의 Gemini 1.5 등 Apr 11, 2025 pm 12:01 PM

이번 주 AI 환경 : 발전의 회오리 바람, 윤리적 고려 사항 및 규제 토론. OpenAi, Google, Meta 및 Microsoft와 같은 주요 플레이어

GPT-4O vs Openai O1 : 새로운 OpenAI 모델은 과대 광고 가치가 있습니까? GPT-4O vs Openai O1 : 새로운 OpenAI 모델은 과대 광고 가치가 있습니까? Apr 13, 2025 am 10:18 AM

소개 OpenAi는 기대가 많은 "Strawberry"아키텍처를 기반으로 새로운 모델을 출시했습니다. O1로 알려진이 혁신적인 모델은 추론 기능을 향상시켜 문제를 통해 생각할 수 있습니다.

비전 언어 모델 (VLMS)에 대한 포괄적 인 안내서 비전 언어 모델 (VLMS)에 대한 포괄적 인 안내서 Apr 12, 2025 am 11:58 AM

소개 생생한 그림과 조각으로 둘러싸인 아트 갤러리를 걷는 것을 상상해보십시오. 이제 각 작품에 질문을하고 의미있는 대답을 얻을 수 있다면 어떨까요? “어떤 이야기를하고 있습니까?

SQL에서 열을 추가하는 방법? - 분석 Vidhya SQL에서 열을 추가하는 방법? - 분석 Vidhya Apr 17, 2025 am 11:43 AM

SQL의 Alter Table 문 : 데이터베이스에 열을 동적으로 추가 데이터 관리에서 SQL의 적응성이 중요합니다. 데이터베이스 구조를 즉시 조정해야합니까? Alter Table 문은 솔루션입니다. 이 안내서는 Colu를 추가합니다

AI Index 2025 읽기 : AI는 친구, 적 또는 부조종사입니까? AI Index 2025 읽기 : AI는 친구, 적 또는 부조종사입니까? Apr 11, 2025 pm 12:13 PM

Stanford University Institute for Human-Oriented Intificial Intelligence가 발표 한 2025 인공 지능 지수 보고서는 진행중인 인공 지능 혁명에 대한 훌륭한 개요를 제공합니다. 인식 (무슨 일이 일어나고 있는지 이해), 감사 (혜택보기), 수용 (얼굴 도전) 및 책임 (우리의 책임 찾기)의 네 가지 간단한 개념으로 해석합시다. 인지 : 인공 지능은 어디에나 있고 빠르게 발전하고 있습니다 인공 지능이 얼마나 빠르게 발전하고 확산되고 있는지 잘 알고 있어야합니다. 인공 지능 시스템은 끊임없이 개선되어 수학 및 복잡한 사고 테스트에서 우수한 결과를 얻고 있으며 1 년 전만해도 이러한 테스트에서 비참하게 실패했습니다. AI 복잡한 코딩 문제 또는 대학원 수준의 과학적 문제를 해결한다고 상상해보십시오-2023 년 이후

See all articles