AI 애플리케이션 Stable Diffusion이 등장한 후 매우 짧은 시간에 빠르게 인기를 얻었으며 많은 플레이어의 입소문을 통해 "가장 아름다운 여성" 생성 도구가 되었습니다. 그러나 이 AI 컴퓨팅 및 그리기 도구가 Stable Diffusion에서 공식적으로 출시되었을 때 WEB UI 배포와 모델의 훈련 및 생성은 기본적으로 NVIDIA CUDA 가속 알고리즘을 기반으로 했기 때문에 A 카드는 공식적으로 지원되지 않았습니다. 처음에는 안정적인 확산. 다행스럽게도 Stable Diffusion은 많은 커뮤니티 플레이어의 지원으로 A 카드 GPU 가속 컴퓨팅을 지원하는 많은 지점이 등장했습니다. 예를 들어 오늘 테스트할 DirectML 기반 배포는 AMD Radeon 그래픽을 구현할 수 있습니다. 카드 안정적인 확산 AI 컴퓨팅 하드웨어 가속.
DirectML 기반 Stable Diffusion을 로컬에 배포하려는 경우 편리한 CUDA 기반 웹 UI 배포보다 상대적으로 더 복잡합니다. 그러나 플레이어가 사용할 수 있는 비교적 성숙한 통합 패키지가 이미 온라인에 있습니다. 통합 패키지를 사용하면 한 번의 클릭으로 완벽한 로컬 설치 및 배포가 가능하므로 모든 사람이 많은 시간을 절약할 수 있습니다.
▲테스트를 위해 선택한 통합 패키지가 설치된 후 자동으로 AMD GPU 가속 컴퓨팅 모드로 들어가고 로컬에서 http://127.0.0.1:7860을 열어 로컬 Stable Diffusion AI 드로잉 인터페이스를 엽니다.
▲로컬 웹 UI 인터페이스에서 관련 AI 아트 드로잉 생성 매개변수를 자유롭게 설정할 수 있습니다. "생성"을 클릭하여 드로잉을 시작할 수 있습니다. 자세한 내용은 관련 온라인 튜토리얼을 참조하세요. 여기서는 자세히 다루지 않겠습니다.
그렇다면 DirectML 기반 Stable Diffusion 배포 지점이 AMD 그래픽 카드에 대한 하드웨어 컴퓨팅 가속 지원을 구현할 수 있습니까? 얼마나 효율적인가요? 과거 A카드 플레이어는 리눅스 시스템에서만 Stable Diffusion을 실행할 수 있었고 ROCM(Radeon Open Compute)을 통해 CUDA 가속을 시뮬레이션할 수 있었다. 이제는 A카드의 AI 가속 계산을 윈도우 시스템에서 직접 구현하면 된다. , 우리는 예상한 목표를 달성할 수 있을까요? 이를 위해 AMD Radeon RX 5000 시리즈, RX 6000 시리즈 및 RX 7000 시리즈 그래픽 카드 여러 대를 선택하고 상세한 경험을 진행했습니다.
경험 플랫폼
그래픽 카드: AMD Radeon RX 5500XT(8GB), RX 5700(8GB), RX 6500XT 4GB, RX 6600(8GB), RX 6700XT(12GB), RX 6750XT(12GB), RX 6800(16GB), RX 6900XT(16GB) ) , RX 7900 XT(20GB), RX 7900 XTX(24GB)
CPU: 인텔 코어 i9-13900K
마더보드: Intel Z790
메모리: DDR5 6000 16GB×2
SSD: AORUS NVMe PCIe SSD 2TB
운영 체제: Windows 11 Pro 22H2
드라이버: AMD 소프트웨어 아드레날린 에디션 23.4.3
테스트를 통해 우리가 알고 싶은 사항:
AMD Radeon 5000 시리즈, 6000 시리즈, 7000 시리즈의 Stable Diffusion의 AI 드로잉 컴퓨팅 성능에는 얼마나 차이가 있나요?
기존 CPU AI 컴퓨팅 가속과 비교했을 때, AMD GPU의 가속 성능은 어떤가요?
▲저희가 채택한 네트워크 오픈소스 공유 배포 솔루션은 AMD 그래픽 카드의 하드웨어 가속 계산을 올바르게 구현할 수 있으며, 이미지 생성 과정에서 GPU 점유율이 100%로 유지되는 것을 확인할 수 있습니다.
모델은 Novel AI Final-runed(CKPT)입니다
첫 번째 테스트에서는 키워드를 사용하여 큰 눈과 확실한 사진 감각을 지닌 패셔너블하고 아름다운 여성을 생성했습니다. 키워드 설정은 다음과 같습니다. (일부는 인터넷상의 오픈소스 공유 키워드에서 인용했습니다.)
lora:koreanDollLikeness_v15:0.6> , 최고 품질, 초고해상도, (포토리얼리스틱:1.4), 1woman, 민소매 흰색 단추 셔츠, 검정 스커트, 검정 초커, 귀여운, (Kpop 아이돌), (애교 살:1), ( 플래티넘 블론드 머리:1), ((푹신한 눈)), 보는 사람, 전신, 정면, 패션, 프리미엄
해상도 설정: 512×512
샘플링 단계: 20
속담 단어 안내 계수: 7
배치 생성 - 배치당 수량: 1-1, 4-1
테스트에서는 대부분의 그래픽 카드의 비디오 메모리가 8GB 이상이므로 기본적으로 작동 매개변수에서 일반 하이 비디오 기본 모드를 설정했습니다. RX 6500XT의 4GB 비디오 메모리 버전만 --lowvram을 추가하여 로우 모드를 사용했습니다. .비디오 메모리 작동 모드(그렇지 않으면 작동하지 않습니다). 전반적인 테스트 결과로 볼 때, Radeon RX 5000 시리즈부터 RX 7000 시리즈까지 AMD의 그래픽 카드는 거의 모두 Stable Diffusion 애플리케이션의 AI 컴퓨팅 가속 성능을 달성했으며, 특히 Radeon RX 7000 시리즈 그래픽 카드의 성능이 향상되었습니다. RX 6000 시리즈 그래픽 카드보다 훨씬 뛰어납니다. 예를 들어, 이 설정 및 모델 알고리즘에서 RX 6900XT의 이미지 생성 속도는 초당 약 8.87장인 반면, RX 7900 XT는 초당 15.76장에 도달할 수 있어 성능이 거의 100% 향상되었습니다.
CPU와 비교하면 모든 AMD 그래픽 카드는 매우 분명한 장점을 가지고 있습니다. RX 7900 XT의 성능은 Core i9-13900K의 약 30배입니다. 심지어 처음 2세대의 보급형 그래픽 카드인 RX 5500XT도 거의 5에 가깝습니다. Core i9-13900K의 두 배입니다.
조금 특이한 점은 RX 6500XT입니다. 코어 사양에 따르면 RX 5500XT보다 더 강력해야 합니다. 하지만 비디오 메모리 구성이 4GB에 불과하기 때문에 낮은 비디오 메모리 실행 모드를 켠 후에는 말이죠. 테스트에서는 이미지 생성 속도에 큰 영향을 미치며, 일반적인 GPU 가속 성능보다 훨씬 낮고 CPU 컴퓨팅보다 약간 높은 수준에만 도달할 수 있습니다.
다음 테스트에서는 햇빛, 잔물결, 반사와 같은 효과에 대한 요구 사항과 함께 물가에 별장을 생성하기 위해 비교적 복잡한 일련의 키워드를 사용했습니다. 키워드는 다음과 같습니다.
'일몰 때 물 근처에 있는 튜더식 주택의 아름다운 렌더링, 환상의 숲. 사실적, 영화적 구성, 영화적 높은 디테일, 초현실적, 영화적 조명, 피사계 심도, 매우 세밀하고 아름다운 색상 코드, 8k'
해상도 설정: 512×512
샘플링 단계: 50
즉시 단어 안내 계수: 7.5
배치 생성 - 배치당 수량: 1-1, 2-1, 4-1
이 부분의 테스트 결과는 기본적으로 이전 테스트와 일치합니다. RX 7000 시리즈 그래픽 카드는 여전히 성능 측면에서 압도적입니다. RX 6000 시리즈 그래픽 카드에 비해 성능 향상은 CPU의 컴퓨팅 성능과 비교했을 때 GPU 가속 컴퓨팅의 성능 향상이 여전히 매우 큽니다. RX 7900 XT의 성능은 다음과 같습니다. 보급형 그래픽 카드 RX 5500XT의 성능은 Core i9-13900K의 약 5배입니다.
4GB 메모리 구성을 갖춘 RX 6500XT는 저메모리 모드에서만 실행될 수 있으므로 이미지 생성 속도는 여전히 큰 영향을 받습니다. 이는 GPU 가속의 일반 성능보다 훨씬 낮으며 Core i9-13900K와 거의 동일합니다.
이 테스트는 간단하지만 흥미로운 테스트입니다. 이 경험을 통해 플레이어가 참고할 수 있는 몇 가지 참고 사항이 있다고 생각합니다.
1. 현재 AMD 그래픽 카드는 오픈 소스 배포 솔루션을 통해 Windows 시스템에서 안정적인 확산 AI 컴퓨팅 가속을 달성할 수 있으며, 관심 있는 플레이어가 시도해 볼 수 있는 많은 통합 패키지도 있습니다.
2. 테스트 결과에 따르면 AMD 그래픽 카드는 Stable Diffusion의 AI 이미지 생성 계산에서 CPU 계산보다 훨씬 더 나은 성능 향상을 달성할 수 있습니다. GPU를 사용하여 계산을 가속화하면 절반의 노력으로 두 배의 결과를 얻을 수 있습니다.3. 테스트 상황으로 볼 때 렌더링 해상도가 512(예: 768×768)를 초과하도록 설정하면 비디오 메모리가 초과됩니다. 이는 배포 계획 및 모델과 일정한 관계가 있지만, 이는 또한 정상적인 상황에서는 8GB의 비디오 메모리가 Stable Diffusion을 위한 거의 필수 요구 사항입니다. 비디오 메모리가 8GB 미만인 경우 512×512 해상도로 렌더링하더라도 비디오 메모리가 부족하게 됩니다. 이때 --lowvram 솔루션을 실행하는 저비디오 메모리를 사용해야 하지만 속도가 크게 느려집니다. RX 6500XT 4GB 테스트에서처럼 계산 속도가 느려졌습니다. 따라서 Stable Diffusion을 원활하게 플레이하려면 그래픽 카드의 비디오 메모리가 8GB 이상인 것이 좋습니다.
4. 전반적인 결과로 볼 때, 우리는 AMD GPU가 여전히 알고리즘 최적화의 여지가 크다고 믿습니다. 신뢰할 수 없는 경험으로 볼 때, RX 7900 XTX에서 Core i9-13900K까지의 성능 격차는 충분히 크지 않습니다. 이는 우리가 배포한 알고리즘 솔루션 및 모델과 관련이 있습니다. 또한 다양한 커뮤니티의 프로그래머가 AMD 그래픽 카드를 위한 더 나은 컴퓨팅 가속 솔루션을 개발할 수 있기를 바랍니다.무슨 일이 있어도 Stable Diffusion을 위한 AMD 그래픽 카드의 하드웨어 가속 컴퓨팅 성능이 입증되었으며 그 효과는 의심할 여지 없이 AMD 그래픽 카드 사용자에게 좋은 소식입니다. 최적화로 가는 길.
위 내용은 AMD Radeon 그래픽카드 Stable Diffusion AI 드로잉 체험 테스트의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!