Soft Diffusion: Google의 새로운 프레임워크는 범용 확산 프로세스에서 올바르게 예약, 학습 및 샘플링합니다.
우리는 점수 기반 모델과 DDPM(노이즈 제거 확산 확률 모델)이 확산 과정을 반전시켜 샘플을 생성하는 두 가지 강력한 유형의 생성 모델이라는 것을 알고 있습니다. 이 두 가지 유형의 모델은 Yang Song 등의 논문 "Score-based Generative Modeling through Stochastic Differential Equations" 논문에서 하나의 프레임워크로 통합되었으며, 확산 모델(Diffusion Model)로 널리 알려져 있습니다.
현재 확산 모델은 이미지, 오디오, 비디오 생성 및 역 문제 해결을 포함한 일련의 응용 분야에서 큰 성공을 거두었습니다. "확산 기반 생성 모델의 설계 공간 설명"이라는 논문에서 Tero Karras와 같은 연구자들은 확산 모델의 설계 공간을 분석하고 i) 잡음 수준의 스케줄링 선택, ii) 네트워크 매개변수 선택의 세 단계를 식별했습니다. 화(각 매개변수화는 서로 다른 손실 함수를 생성함), iii) 샘플링 알고리즘을 설계합니다.
최근 Google Research와 UT-Austin이 공동으로 실시한 arXiv 논문 "Soft Diffusion: Score Matching for General Corruptions"에서 몇몇 연구자들은 확산 모델에 여전히 부패라는 중요한 단계가 있다고 믿고 있습니다. 일반적으로 손상은 다양한 진폭의 노이즈를 추가하는 프로세스이며 DDMP의 경우 크기 조정도 필요합니다. 확산을 위해 다양한 분포를 사용하려는 시도가 있었지만 일반적인 프레임워크는 여전히 부족합니다. 따라서 연구진은 보다 일반적인 손상 과정을 위한 확산 모델 설계 프레임워크를 제안했습니다.
구체적으로는 Soft Score Matching이라는 새로운 훈련 목표와 새로운 샘플링 방식인 Momentum Sampler를 제안했습니다. 이론적 결과에 따르면 규칙성 조건을 충족하는 손상 프로세스의 경우 Soft Score MatchIng는 확산이 모든 이미지를 가능성이 0이 아닌 이미지로 변환해야 한다는 점수(즉, 우도 기울기)를 학습할 수 있습니다.
실험 부분에서 연구원들은 CelebA와 CIFAR-10에 대해 모델을 훈련시켰습니다. CelebA에 대해 훈련된 모델은 선형 확산 모델의 SOTA FID 점수인 1.85를 달성했습니다. 동시에 연구원들이 훈련한 모델은 원래의 가우스 잡음 제거 확산을 사용하여 훈련한 모델보다 훨씬 빠릅니다.
논문 주소: https://arxiv.org/pdf/2209.05442.pdf
방법 개요
일반적으로 확산 모델은 점차 증가하는 손상 과정을 역전시켜 생성됩니다. 노이즈 이미지. 연구원들은 선형 결정론적 저하 및 확률론적 추가 노이즈와 관련된 확산을 역전시키는 방법을 학습하는 방법을 보여줍니다.
구체적으로 연구원들은 세 부분, 즉 새로운 훈련 대상 소프트 스코어 매칭, 새로운 샘플링 방법인 모멘텀 샘플러 및 스케줄링으로 구성된 보다 일반적인 손상 모델을 사용하여 확산 모델을 훈련하기 위한 프레임워크를 시연했습니다. 손상 메커니즘의 .
먼저 훈련 대상인 소프트 스코어 매칭(Soft Score Matching)을 살펴보겠습니다. 소프트 필터링(Soft Filtering)이라는 이름은 사진 용어로 미세한 부분을 제거하는 필터를 의미합니다. 이는 입증 가능한 방식으로 기존 선형 손상 프로세스의 일부를 학습하고 필터링 프로세스를 네트워크에 통합하며 확산 관찰과 일치하는 손상 후 이미지를 예측하도록 모델을 교육합니다.
이 교육 목표는 확산이 깨끗하고 손상된 이미지 쌍에 0이 아닌 확률을 할당하는 한 점수가 학습되었음을 증명할 수 있습니다. 또한, 이 조건은 손상에 부가적인 소음이 존재할 때 항상 만족됩니다.
구체적으로 연구진은 피해 과정을 다음과 같은 형태로 탐구했습니다.
이 과정에서 연구자들은 노이즈가 경험적으로(즉, 더 나은 결과를 위해) 그리고 이론적으로(즉, 분수를 학습하는 데) 중요하다는 사실을 발견했습니다. 이는 또한 결정론적 손상을 역전시키는 동시 작업인 Cold Diffusion과의 주요 차이점이 됩니다.
두 번째는 샘플링 방식인 Momentum Sampling입니다. 연구원들은 샘플러의 선택이 생성된 샘플의 품질에 중요한 영향을 미친다는 것을 입증했습니다. 그들은 보편적인 선형 손상 프로세스를 반전시키기 위해 Momentum Sampler를 제안했습니다. 샘플러는 다양한 확산 수준을 갖는 볼록한 손상 조합을 사용하며 최적화의 모멘텀 방법에서 영감을 받았습니다.
이 샘플링 방법은 위의 논문에서 제안된 확산 모델의 연속 공식에서 영감을 받았습니다. Momentum Sampler의 알고리즘은 다음과 같습니다.
아래 그림은 다양한 샘플링 방법이 생성된 샘플의 품질에 미치는 영향을 시각적으로 보여줍니다. 왼쪽의 Naive Sampler로 샘플링한 이미지는 반복적이고 세부 묘사가 부족한 것처럼 보이는 반면, 오른쪽의 Momentum Sampler는 샘플링 품질과 FID 점수를 크게 향상시킵니다.
마지막으로 일정 조정입니다. 저하 유형이 미리 정의되어 있더라도(예: 흐림) 각 확산 단계에서 손상 정도를 결정하는 것은 쉽지 않습니다. 연구원들은 손상 프로세스 설계를 안내하는 원칙적인 도구를 제안합니다. 일정을 찾기 위해 경로를 따라 분포 간의 Wasserstein 거리를 최소화합니다. 직관적으로 연구자들은 완전히 손상된 배포판에서 깨끗한 배포판으로 원활하게 전환되기를 원합니다.
실험 결과
연구원들은 이미지 생성을 위한 표준 기준선인 CelebA-64와 CIFAR-10에서 제안된 방법을 평가했습니다. 실험의 주요 목적은 손상 유형의 역할을 이해하는 것입니다.
연구원들은 먼저 블러와 낮은 진폭 노이즈를 사용하여 손상을 시도했습니다. 결과는 그들이 제안한 모델이 CelebA에서 SOTA 결과, 즉 FID 점수 1.85를 달성하여 노이즈만 추가하고 이미지 크기를 조정하는 다른 모든 방법보다 성능이 우수하다는 것을 보여줍니다. 또한 CIFAR-10에서 얻은 FID 점수는 4.64로 SOTA에는 미치지 못하더라도 경쟁력이 있는 수준이다.
또한 CIFAR-10 및 CelebA 데이터세트에서 연구원의 방법은 다른 측정항목인 샘플링 시간에서도 더 나은 성능을 보였습니다. 또 다른 추가 이점은 상당한 계산상의 이점입니다. 디블러링(노이즈가 거의 없음)은 이미지 생성 노이즈 제거 방법에 비해 더 효율적인 조작으로 보입니다.
아래 차트는 NFE(기능 평가 횟수)에 따라 FID 점수가 어떻게 변하는지 보여줍니다. 결과에서 볼 수 있듯이 우리 모델은 CIFAR-10 및 CelebA 데이터 세트에서 훨씬 적은 단계를 사용하여 표준 Gaussian 노이즈 제거 확산 모델과 동일하거나 더 나은 품질을 달성할 수 있습니다.
위 내용은 Soft Diffusion: Google의 새로운 프레임워크는 범용 확산 프로세스에서 올바르게 예약, 학습 및 샘플링합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











표준 JSON 문자열의 경우 vue.js의 객체로 문자열을 변환 할 때 JSON.PARSE ()가 선호됩니다. 비표준 JSON 문자열의 경우, 정규 표현식을 사용하여 문자열을 처리하고 형식 또는 디코딩 된 URL 인코딩에 따라 방법을 줄일 수 있습니다. 문자열 형식에 따라 적절한 방법을 선택하고 버그를 피하기 위해 보안 및 인코딩 문제에주의를 기울이십시오.

이 기사는 MySQL 데이터베이스의 작동을 소개합니다. 먼저 MySQLworkBench 또는 명령 줄 클라이언트와 같은 MySQL 클라이언트를 설치해야합니다. 1. MySQL-Uroot-P 명령을 사용하여 서버에 연결하고 루트 계정 암호로 로그인하십시오. 2. CreateABase를 사용하여 데이터베이스를 작성하고 데이터베이스를 선택하십시오. 3. CreateTable을 사용하여 테이블을 만들고 필드 및 데이터 유형을 정의하십시오. 4. InsertInto를 사용하여 데이터를 삽입하고 데이터를 쿼리하고 업데이트를 통해 데이터를 업데이트하고 DELETE를 통해 데이터를 삭제하십시오. 이러한 단계를 마스터하고 일반적인 문제를 처리하는 법을 배우고 데이터베이스 성능을 최적화하면 MySQL을 효율적으로 사용할 수 있습니다.

MySQL 시작이 실패하는 데는 여러 가지 이유가 있으며 오류 로그를 확인하여 진단 할 수 있습니다. 일반적인 원인에는 포트 충돌 (포트 점유 체크 및 구성 수정), 권한 문제 (서비스 실행 사용자 권한 실행), 구성 파일 오류 (파라미터 설정 확인), 데이터 디렉토리 손상 (데이터 복원 또는 테이블 공간 재건), IBDATA 테이블 공간 문제 (IBDATA1 파일 확인), 플러그로드 (확인 오류 로그)가 포함됩니다. 문제를 해결할 때 오류 로그를 기반으로 문제를 분석하고 문제의 근본 원인을 찾고 문제를 방지하고 해결하기 위해 정기적으로 데이터를 백업하는 습관을 개발해야합니다.

요약 : vue.js 문자열 배열을 객체 배열로 변환하는 다음 방법이 있습니다. 기본 메소드 : 정기적 인 형식의 데이터에 맞게 맵 함수를 사용하십시오. 고급 게임 플레이 : 정규 표현식을 사용하면 복잡한 형식을 처리 할 수 있지만 신중하게 작성하고 고려해야합니다. 성능 최적화 : 많은 양의 데이터를 고려하면 비동기 작업 또는 효율적인 데이터 처리 라이브러리를 사용할 수 있습니다. 모범 사례 : 명확한 코드 스타일, 의미있는 변수 이름과 주석을 사용하여 코드를 간결하게 유지하십시오.

7 백만 레코드를 효율적으로 처리하고 지리 공간 기술로 대화식지도를 만듭니다. 이 기사는 Laravel과 MySQL을 사용하여 7 백만 개 이상의 레코드를 효율적으로 처리하고 대화식지도 시각화로 변환하는 방법을 살펴 봅니다. 초기 챌린지 프로젝트 요구 사항 : MySQL 데이터베이스에서 7 백만 레코드를 사용하여 귀중한 통찰력을 추출합니다. 많은 사람들이 먼저 프로그래밍 언어를 고려하지만 데이터베이스 자체를 무시합니다. 요구 사항을 충족시킬 수 있습니까? 데이터 마이그레이션 또는 구조 조정이 필요합니까? MySQL이 큰 데이터로드를 견딜 수 있습니까? 예비 분석 : 주요 필터 및 속성을 식별해야합니다. 분석 후, 몇 가지 속성만이 솔루션과 관련이 있음이 밝혀졌습니다. 필터의 타당성을 확인하고 검색을 최적화하기위한 제한 사항을 설정했습니다. 도시를 기반으로 한지도 검색

vue axios의 타임 아웃을 설정하려면 axios 인스턴스를 생성하고 시간 초과 옵션을 지정할 수 있습니다. 글로벌 설정에서 : vue.prototype. $ axios = axios.create ({timeout : 5000}); 단일 요청 : this. $ axios.get ( '/api/user', {timeout : 100000}).

MySQL 성능 최적화는 설치 구성, 인덱싱 및 쿼리 최적화, 모니터링 및 튜닝의 세 가지 측면에서 시작해야합니다. 1. 설치 후 innodb_buffer_pool_size 매개 변수와 같은 서버 구성에 따라 my.cnf 파일을 조정해야합니다. 2. 과도한 인덱스를 피하기 위해 적절한 색인을 작성하고 Execution 명령을 사용하여 실행 계획을 분석하는 것과 같은 쿼리 문을 최적화합니다. 3. MySQL의 자체 모니터링 도구 (showprocesslist, showstatus)를 사용하여 데이터베이스 건강을 모니터링하고 정기적으로 백업 및 데이터베이스를 구성하십시오. 이러한 단계를 지속적으로 최적화함으로써 MySQL 데이터베이스의 성능을 향상시킬 수 있습니다.

원격 선임 백엔드 엔지니어 구직 회사 : 원 위치 : 원격 사무실 직무 유형 : 전임 급여 : $ 130,000- $ 140,000 직무 설명 전체 소프트웨어 개발 라이프 사이클을 다루는 Circle Mobile 애플리케이션 및 공개 API 관련 기능의 연구 및 개발에 참여합니다. 주요 책임은 독립적으로 Rubyonrails를 기반으로 개발 작업을 완료하고 React/Redux/Relay 프론트 엔드 팀과 협력합니다. 웹 애플리케이션의 핵심 기능 및 개선을 구축하고 기능 설계 프로세스 전반에 걸쳐 설계자 및 리더십과 긴밀히 협력하십시오. 긍정적 인 개발 프로세스를 촉진하고 반복 속도를 우선시하십시오. 6 년 이상의 복잡한 웹 애플리케이션 백엔드가 필요합니다.
