1024 해상도의 가장 빠른 모델, ByteDance Vincent 그래프 오픈 모델 SDXL-Lightning 출시-일체 포함-php.cn

1. 빛처럼 빠른 이미지 생성

4. 기술적 세부 사항 정보

집

기술 주변기기

일체 포함

1024 해상도의 가장 빠른 모델, ByteDance Vincent 그래프 오픈 모델 SDXL-Lightning 출시

PHPz

Feb 24, 2024 pm 12:37 PM

생성 AI

모델｜https://www.php.cn/link/36ef259d4d9967f3a81aa326160128c7

종이｜https://www.php.cn/link/ca0525bfe5cab4c577 d169d 3343a5452

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

1. 빛처럼 빠른 이미지 생성

Generative AI는 텍스트 프롬프트를 기반으로 놀라운 이미지와 비디오까지 생성하는 능력으로 전 세계의 주목을 받고 있습니다. 현재의 최첨단 생성 모델은 노이즈를 이미지 샘플로 점진적으로 변환하는 반복 프로세스인 확산에 의존합니다. 이 프로세스에는 엄청난 컴퓨팅 리소스가 필요하고 속도가 느립니다. 고품질 이미지 샘플을 생성하는 과정에서 단일 이미지의 처리 시간은 약 5초이며, 이는 일반적으로 거대한 신경망에 대한 여러(20~40) 호출이 필요합니다. . 이 속도는 빠른 실시간 생성이 필요한 애플리케이션 시나리오를 제한합니다. 속도를 높이면서 발전 품질을 향상시키는 방법 은 현재 연구의 핵심 분야이자 우리 작업의 핵심 목표입니다.

SDXL-Lightning은 혁신적인 기술인

Progressive Adversarial Distillation을 통해 이 장벽을 돌파하여 전례 없는 생성 속도를 달성합니다. 이 모델은 단 2~4단계만으로 매우 높은 품질과 해상도의 이미지를 생성할 수 있어 계산 비용과 시간을 10분의 1로 줄여줍니다. 우리의 방법은 품질이 약간 저하되기는 하지만 시간 초과에 민감한 애플리케이션의 경우 1단계로 이미지를 생성할 수도 있습니다.

SDXL-라이트닝은 속도 우위뿐 아니라 화질에서도 뛰어나 평가에서 기존 가속 기술을 뛰어넘는다. 우수한 다양성과 이미지-텍스트 일치를 유지하면서 더 높은 해상도와 풍부한 세부 정보를 제공합니다.

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

속도 비교

원래 모델(20단계), SDXL-Lightning 모델(2단계)

2 모델 효과

SDXL-Lightning 모델을 사용할 수 있습니다. 통과 1단계, 2단계, 4단계, 8단계로 이미지를 생성합니다. 추론 단계가 많을수록 이미지 품질이 좋아집니다.

다음은 4단계의 결과입니다 -

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

웃는 소녀

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

산을 오르는 픽업트럭 지그재그

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

물고기 자전거, 다채로운 예술

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

선글라스를 낀 아시아 여성의 클로즈업

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

아름다운 컵

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

모나리자, 스케치

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

팬더 수영

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

산을 오르는 픽업트럭 지그재그

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

사막에있는 집, 초현실적 인 풍경

다음은 2 단계의 결과입니다 - 거실을위한 감독 디자인은 아기 너구리의 영화 촬영 샷을 착용합니다. 복잡한 이탈리아 신부 가운

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

아늑한 거실에서 장난감을 쫓는 부드러운 털과 밝은 눈을 가진 강아지

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

구름이 담긴 찻잔

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

가족, 미디엄 샷

🎙 이전 방법(Turbo 및 LCM)에 비해 우리의 방법으로 생성된 이미지는 세부적으로 크게 개선되었으며 원래 생성 모델의 스타일과 레이아웃에 더욱 충실합니다.

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

3. 커뮤니티에 환원, 개방형 모델

오픈 소스와 오픈 소스의 물결은 인공 지능의 급속한 발전을 촉진하는 핵심 원동력이 되었으며, Bytedance는 이러한 커뮤니티의 일부가 된 것을 자랑스럽게 생각합니다. 이 파도. 우리 모델은 현재 가장 인기 있는 텍스트 생성 이미지 개방형 모델인 SDXL을 기반으로 하며 이미 생태계가 번성하고 있습니다. 이제 우리는 SDXL-Lightning을 전 세계의 개발자, 연구원, 크리에이티브 실무자에게 공개하여 그들이 이 모델에 액세스하고 적용하여 업계 전반에 걸쳐 혁신과 협업을 더욱 촉진할 수 있도록 하기로 결정했습니다.

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布 SDXL-Lightning을 설계할 때

오픈 모델 커뮤니티와의 호환성

을 고려했습니다. 커뮤니티의 많은 아티스트와 개발자는 만화 및 애니메이션 스타일과 같은 다양한 스타일화된 이미지 생성 모델을 만들었습니다. 이러한 모델을 지원하기 위해 SDXL-Lightning을 속도 향상 플러그인으로 제공합니다. 이 플러그인은 다양한 스타일의 SDXL 모델에 원활하게 통합되어 다양한 모델의 이미지 생성 속도를 높일 수 있습니다.

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

SDXL-Lightning

이 모델은 현재 매우 인기 있는 제어 플러그인 ControlNet과 결합하여 매우 빠르고 제어 가능한 이미지 생성을 달성할 수도 있습니다. 1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布 SDXL-Lightning

이 모델은 오픈 소스 커뮤니티에서 가장 인기 있는 세대 소프트웨어인 ComfyUI도 지원합니다. 모델을 직접 로드하여 사용할 수 있습니다.

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

4. 기술적 세부 사항 정보

이론적으로 이미지 생성은 노이즈에서 선명한 이미지로 점진적으로 변환하는 과정입니다. 이 과정에서 신경망은 변환 흐름의 다양한 위치에서 기울기를 학습합니다.

이미지를 생성하는 구체적인 단계는 다음과 같습니다.

먼저 스트림 시작점에서 노이즈 샘플을 무작위로 샘플링한 다음 신경망을 사용하여 기울기를 계산합니다. 현재 위치의 그래디언트를 기반으로 샘플을 약간 조정한 다음 프로세스를 반복합니다. 반복할 때마다 샘플은 선명한 이미지를 얻을 때까지 최종 이미지 분포에 가까워집니다.

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

사진: 세대 흐름 프로세스(사진 출처: https://www.php.cn/link/5c9b5c47258cf1499c2dc64b7072e735

생성 흐름의 복잡성과 비선형성 직선, 생성 과정은 한 번만 해야 그라디언트 오류의 누적을 줄이기 위해 작은 단계만 수행하므로 신경망의 빈번한 계산이 필요하므로 계산량이 많은 이유입니다

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

사진: 곡선 과정 (사진출처: https://www.php.cn/link/d7bbb6396ce5daf19ec6cf4bb4453137

이미지 생성에 필요한 단계 수를 줄이기 위해 많은 연구가 해결책을 찾기 위해 노력해 왔습니다. 일부 연구 오류를 줄일 수 있는 샘플링 방법을 제안한 반면, 다른 사람들은 생성 흐름을 보다 선형적으로 만들기 위해 노력했습니다. 이러한 방법이 발전했지만 이미지를 생성하려면 여전히 10개 이상의 추론 단계가 필요합니다.

또 다른 방법은 모델 증류입니다. 10개 미만의 추론 단계에서 고품질 이미지를 생성할 수 있습니다. 현재 흐름 위치에서 기울기를 계산하는 것과 달리 모델 추출은 다음 더 먼 흐름 위치를 직접 예측하도록 모델 예측의 목표를 변경합니다. 학생 네트워크는 다단계 추론 결과를 완성한 후 교사 네트워크를 직접 예측합니다. 이러한 전략은 이 프로세스를 반복적으로 적용함으로써 추론 단계 수를 더욱 줄일 수 있습니다.

그림: 점진적 증류, 학생 네트워크는 여러 단계를 거친 후 교사 네트워크의 결과를 예측합니다. 8단계 미만의 추론으로 인해 모델에서 생성된 이미지가 흐려지기 시작합니다.

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布 이 문제를 해결하기 위해 우리의 전략은 학생 네트워크가 예측과 정확하게 일치하도록 강요하지 않는 것입니다. 그러나 학생 네트워크가 교사 네트워크의 예측과 확률적으로 일치하도록 합니다. 즉, 학생 네트워크는 이 위치가 완전하지 않더라도 확률적으로 가능한 위치를 예측하도록 훈련됩니다. 이 목표는 적대적 훈련을 통해 달성됩니다. 학생과 교사 네트워크 출력의 분포 일치를 달성하는 데 도움이 되는 추가적인 차별적 네트워크가 도입됩니다.

이것은 우리의 연구 방법에 대한 간략한 개요입니다(https:/ /www.php.cn/link/ca0525bfe5cab4c577d169d3343a5452).

모델에 대한 보다 심층적인 이론적 분석, 훈련 전략 및 구체적인 공식화 세부 정보를 제공합니다.

5이 연구는 주로 이미지 생성을 위해 SDXL-Lightning 기술을 사용하는 방법을 탐색합니다. 그러나 제안된 점진적 적대 증류 방법의 응용 가능성은 정적 이미지에만 국한되지 않습니다. 기타 다중 모드 콘텐츠. HuggingFace 플랫폼에서 SDXL-Lightning을 경험해 보시고 여러분의 소중한 의견과 피드백을 기다리겠습니다.

모델:

https://www.php.cn/link/36ef259d4d9967f3a81aa326160128c7

논문: https://www.php.cn/link/ca0525bfe5cab4c577d169d3343a5452

위 내용은 1024 해상도의 가장 빠른 모델, ByteDance Vincent 그래프 오픈 모델 SDXL-Lightning 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7520

Cakephp 튜토리얼

1378

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

나는 Cursor AI와 함께 Vibe 코딩을 시도했는데 놀랍습니다! Mar 20, 2025 pm 03:34 PM

Vibe Coding은 끝없는 코드 라인 대신 자연 언어를 사용하여 애플리케이션을 생성함으로써 소프트웨어 개발의 세계를 재구성하고 있습니다. Andrej Karpathy와 같은 비전가들로부터 영감을 얻은이 혁신적인 접근 방식은 Dev가

2025 년 2 월 2 일 Genai 출시 : GPT-4.5, Grok-3 & More! Mar 22, 2025 am 10:58 AM

2025 년 2 월은 Generative AI의 또 다른 게임 변화 달이었으며, 가장 기대되는 모델 업그레이드와 획기적인 새로운 기능을 제공합니다. Xai 's Grok 3 및 Anthropic's Claude 3.7 Sonnet, Openai 's G에 이르기까지

물체 감지에 Yolo V12를 사용하는 방법은 무엇입니까? Mar 22, 2025 am 11:07 AM

Yolo (한 번만 보이면)는 주요 실시간 객체 감지 프레임 워크였으며 각 반복은 이전 버전에서 개선되었습니다. 최신 버전 Yolo V12는 정확도를 크게 향상시키는 발전을 소개합니다.

chatgpt 4 o를 사용할 수 있습니까? Mar 28, 2025 pm 05:29 PM

ChatGpt 4는 현재 이용 가능하고 널리 사용되며 ChatGpt 3.5와 같은 전임자와 비교하여 상황을 이해하고 일관된 응답을 생성하는 데 상당한 개선을 보여줍니다. 향후 개발에는보다 개인화 된 인터가 포함될 수 있습니다

창의적인 프로젝트를위한 최고의 AI 아트 발전기 (무료 & amp; 유료) Apr 02, 2025 pm 06:10 PM

이 기사는 최고의 AI 아트 생성기를 검토하여 자신의 기능, 창의적인 프로젝트에 대한 적합성 및 가치에 대해 논의합니다. Midjourney를 전문가에게 최고의 가치로 강조하고 고품질의 사용자 정의 가능한 예술에 Dall-E 2를 추천합니다.

O1 대 GPT-4O : OpenAI의 새로운 모델이 GPT-4O보다 낫습니까? Mar 16, 2025 am 11:47 AM

OpenAi의 O1 : 12 일 선물 Spree는 아직 가장 강력한 모델로 시작합니다. 12 월의 도착은 세계의 일부 지역에서 전 세계적으로 속도가 저하 된 눈송이를 가져 오지만 Openai는 막 시작되었습니다. Sam Altman과 그의 팀은 12 일 선물을 시작하고 있습니다.