기존 GAN은 수정 후에도 해석이 가능하며 컨볼루션 커널의 해석 가능성과 생성된 이미지의 신뢰성을 보장합니다.-일체 포함-php.cn

연구 배경 및 연구 과제

모델링 방법

요약

집

기술 주변기기

일체 포함

기존 GAN은 수정 후에도 해석이 가능하며 컨볼루션 커널의 해석 가능성과 생성된 이미지의 신뢰성을 보장합니다.

王林

Apr 08, 2023 pm 02:21 PM

ai 영상 gan

기존 GAN은 수정 후에도 해석이 가능하며 컨볼루션 커널의 해석 가능성과 생성된 이미지의 신뢰성을 보장합니다.

논문 주소: https://www.aaai.org/AAAI22Papers/AAAI-7931.LiC.pdf
저자 소속: Institute of Computing Technology, Chinese Academy of Sciences, Shanghai Jiao Tong University, Zhijiang Laboratory

연구 배경 및 연구 과제

생성적 적대 네트워크(GAN)는 고해상도 이미지 생성에 큰 성공을 거두었으며, 최근 몇 년간 해석 가능성에 대한 연구도 폭넓은 주목을 받았습니다.

이 분야에서 GAN이 분리된 표현을 학습하도록 하는 방법은 여전히 중요한 과제입니다. 소위 GAN의 분리된 표현은 표현의 각 부분이 생성된 이미지의 특정 측면에만 영향을 미친다는 것을 의미합니다. GAN의 분리된 표현에 대한 이전 연구는 다양한 관점에 중점을 두었습니다.

예를 들어 아래 그림 1에서 방법 1은 이미지의 구조와 스타일을 분리합니다. 방법 2는 이미지에 있는 로컬 객체의 특징을 학습합니다. 방법 3은 얼굴 이미지의 연령 속성, 성별 속성 등 이미지 속 속성의 분리된 특징을 학습합니다. 그러나 이러한 연구는 다양한 시각적 개념(예: 눈, 코, 입과 같은 얼굴 부분)에 대해 GAN에서 명확하고 상징적인 표현을 제공하지 못했습니다.

기존 GAN은 수정 후에도 해석이 가능하며 컨볼루션 커널의 해석 가능성과 생성된 이미지의 신뢰성을 보장합니다.

그림 1: 다른 GAN 분리 특성화 방법과의 시각적 비교

이를 위해 연구원들은 전통적인 GAN을 해석 가능한 GAN 일반 방법으로 수정하는 방법을 제안했습니다. 이는 생성기의 중간 계층에 있는 컨볼루션 커널이 분리된 로컬 시각적 개념을 학습할 수 있도록 보장합니다. 구체적으로, 아래 그림 2에서 볼 수 있듯이 전통적인 GAN과 비교하여 해석 가능한 GAN의 중간 계층에 있는 각 컨볼루션 커널은 항상 다른 이미지를 생성할 때 특정 시각적 개념을 나타내며, 다른 컨볼루션 커널은 다른 비전을 나타냅니다.

기존 GAN은 수정 후에도 해석이 가능하며 컨볼루션 커널의 해석 가능성과 생성된 이미지의 신뢰성을 보장합니다.

그림 2: 해석 가능한 GAN과 기존 GAN 인코딩 표현의 시각적 비교

모델링 방법

해석 가능한 GAN 학습은 다음 두 가지 목표를 충족해야 합니다. Convolution 커널의 해석 가능성 및 생성된 이미지의 신뢰성 .

컨볼루션 커널의 해석성: 연구원들은 중간 계층의 컨볼루션 커널이 시각적 개념에 대한 수동 주석 없이 자동으로 의미 있는 시각적 개념을 학습할 수 있기를 바라고 있습니다. 구체적으로 각 컨볼루션 커널은 서로 다른 이미지를 생성할 때 동일한 시각적 개념에 해당하는 이미지 영역을 안정적으로 생성해야 합니다. 다양한 컨볼루션 커널은 다양한 시각적 개념에 해당하는 이미지 영역을 생성해야 합니다.

생성된 이미지의 신뢰성: 해석 가능한 GAN 생성기는 여전히 현실적인 이미지를 생성할 수 있습니다.

따라서 그들은 특정 시각적 개념을 공동으로 표현하기 위해 컨볼루션 커널 세트를 사용하고, 서로 다른 시각적 개념을 각각 표현하기 위해 서로 다른 컨볼루션 커널 세트를 사용합니다.

생성된 이미지의 신뢰성을 동시에 보장하기 위해 연구원들은 전통적인 GAN을 해석 가능한 GAN으로 수정하기 위해 다음과 같은 손실 함수를 설계했습니다.

전통적인 GAN의 손실: 이 손실은 생성된 이미지의 신뢰성을 보장하는 데 사용됩니다.
컨볼루션 커널 파티션 손실: 생성기가 주어지면 이 손실은 다음을 찾는 데 사용됩니다. 볼륨 동일한 그룹의 컨볼루션 커널이 비슷한 이미지 영역을 생성하는 방식으로 커널이 나누어집니다. 특히 GMM(Gaussian Mixture Model)을 사용하여 각 그룹의 컨볼루션 커널의 기능 맵이 유사한 신경 활성화를 갖도록 컨볼루션 커널을 나누는 방법을 학습합니다.
에너지 모델 현실 손실 대상 레이어 커널이 분할되는 방식을 고려할 때 동일한 그룹의 각 커널이 동일한 시각적 개념을 생성하도록 강제하면 결과 이미지의 품질이 저하될 수 있습니다. 생성된 이미지의 신뢰성을 더욱 보장하기 위해 에너지 모델을 사용하여 대상 레이어의 특징 맵의 신뢰성 확률을 출력하고 최대 우도 추정을 사용하여 에너지 모델의 매개변수를 학습합니다. 컨볼루션 커널 해석성 손실
: 대상 계층의 컨볼루션 커널 분할 방법을 고려할 때 이 손실은 컨볼루션 커널의 해석성을 더욱 향상시키는 데 사용됩니다. 특히 이러한 손실로 인해 동일한 그룹의 각 컨볼루션 커널은 동일한 이미지 영역을 고유하게 생성하는 반면, 서로 다른 그룹의 컨볼루션 커널은 서로 다른 이미지 영역을 생성합니다. 실험 결과

정성적 분석

을 위해 각 컨볼루션 커널의 특징 맵을 시각화하여 다양한 이미지에서 컨볼루션 커널이 나타내는 시각적 개념의 일관성을 평가했습니다. 아래 그림 3과 같이 해석 가능한 GAN에서는 각 컨볼루션 커널이 서로 다른 이미지를 생성할 때 항상 동일한 시각적 개념에 해당하는 이미지 영역을 생성하는 반면, 서로 다른 컨볼루션 커널은 서로 다른 시각적 개념에 해당하는 이미지 영역을 생성합니다. 그림 3: 해석 가능한 GAN의 특징 맵 시각화 차이점은 아래 그림 4(a)에 나와 있습니다. 그림 4(b)는 해석 가능한 GAN에서 서로 다른 시각적 개념에 해당하는 컨볼루션 커널 수의 비율을 보여줍니다. 그림 4(c)는 분할을 위해 선택된 컨볼루션 커널 그룹의 수가 다를 때 그룹이 많을수록 해석 가능한 GAN이 학습한 시각적 개념이 더 자세하게 나타남을 보여줍니다.

그림 4: 해석 가능한 GAN의 질적 평가 기존 GAN은 수정 후에도 해석이 가능하며 컨볼루션 커널의 해석 가능성과 생성된 이미지의 신뢰성을 보장합니다.

해석 가능한 GAN은 또한 생성된 이미지에 대한 특정 시각적 개념 수정을 지원합니다. 예를 들어, 이미지 간의 특정 시각적 개념의 상호 작용은 해석 가능한 레이어에서 해당 특징 맵을 교환함으로써 달성될 수 있습니다. 즉, 로컬/글로벌 얼굴 교환이 완료됩니다.

아래 그림 5는 이미지 쌍 사이에서 입, 머리카락, 코를 바꾼

결과 기존 GAN은 수정 후에도 해석이 가능하며 컨볼루션 커널의 해석 가능성과 생성된 이미지의 신뢰성을 보장합니다.

을 보여줍니다. 마지막 열은 수정된 이미지와 원본 이미지의 차이를 나타냅니다. 이 결과는 연구자의 방법이 관련 없는 다른 영역은 변경하지 않고 국소적인 시각적 개념만 수정했음을 보여줍니다.

그림 5: 생성된 이미지 교체의 구체적인 시각적 개념

또한 아래 그림 6은 얼굴 전체를 교체할 때 방법의 성능도 보여줍니다.

기존 GAN은 수정 후에도 해석이 가능하며 컨볼루션 커널의 해석 가능성과 생성된 이미지의 신뢰성을 보장합니다.

그림 6: 생성된 이미지의 전체 얼굴 바꾸기

정량 분석을 위해 연구원들은 얼굴 검증 실험을 사용하여 얼굴 교환 결과의 정확성을 평가했습니다. 구체적으로, 한 쌍의 얼굴 이미지가 주어지면 원본 이미지의 얼굴을 원본 이미지의 얼굴로 대체하여 수정된 이미지를 생성합니다. 그런 다음 수정된 이미지의 얼굴과 원본 이미지의 얼굴이 동일한 ID를 가지고 있는지 테스트합니다.

아래 표 1은 다양한 방법의 얼굴 인증 결과의 정확성을 보여줍니다. 이들 방법은 신원 보존 측면에서 다른 얼굴 교환 방법보다 우수합니다.

기존 GAN은 수정 후에도 해석이 가능하며 컨볼루션 커널의 해석 가능성과 생성된 이미지의 신뢰성을 보장합니다.

표 1: 얼굴 교환 신원의 정확성 평가

또한 실험에서는 특정 시각적 개념을 수정하는 방법의 지역성도 평가되었습니다. 구체적으로 연구진은 RGB 공간에서 원본 이미지와 수정된 이미지 간의 평균 제곱 오차(MSE)를 계산하고, 특정 시각적 개념의 영역 외 MSE와 영역 내 MSE의 비율을 실험적으로 사용했습니다. 지역성 평가를 위한 지표입니다.

결과는 아래 표 2와 같습니다. 연구원의 수정 방법이 지역성이 더 좋습니다, 즉 수정된 시각적 개념을 벗어난 이미지 영역의 변화가 적습니다.

기존 GAN은 수정 후에도 해석이 가능하며 컨볼루션 커널의 해석 가능성과 생성된 이미지의 신뢰성을 보장합니다.

표 2: 수정된 시각적 개념의 지역성 평가

더 많은 실험 결과는 논문을 참조하세요.

요약

이 연구는 시각적 개념에 대한 수동 주석 없이 전통적인 GAN을 해석 가능한 GAN으로 수정할 수 있는 일반적인 방법을 제안합니다. 해석 가능한 GAN에서는 생성기의 중간 계층에 있는 각 컨볼루션 커널이 서로 다른 이미지를 생성할 때 동일한 시각적 개념을 안정적으로 생성할 수 있습니다.

실험에 따르면 해석 가능한 GAN을 사용하면 사람들이 생성된 이미지의 특정 시각적 개념을 수정할 수 있어 GAN 생성 이미지의 제어 가능한 편집 방법에 대한 새로운 관점을 제공할 수 있습니다.

위 내용은 기존 GAN은 수정 후에도 해석이 가능하며 컨볼루션 커널의 해석 가능성과 생성된 이미지의 신뢰성을 보장합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7433

Cakephp 튜토리얼

1359

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

Related knowledge

부트 스트랩 목록의 크기를 변경하는 방법은 무엇입니까? Apr 07, 2025 am 10:45 AM

부트 스트랩 목록의 크기는 목록 자체가 아니라 목록이 포함 된 컨테이너의 크기에 따라 다릅니다. Bootstrap의 그리드 시스템 또는 Flexbox를 사용하면 컨테이너의 크기를 제어하여 목록 항목을 간접적으로 크기로 조정할 수 있습니다.

부트 스트랩 목록의 중첩을 구현하는 방법은 무엇입니까? Apr 07, 2025 am 10:27 AM

부트 스트랩의 중첩 목록은 스타일을 제어하기 위해 부트 스트랩의 그리드 시스템을 사용해야합니다. 먼저 외부 층을 사용하십시오 & lt; ul & gt; 및 & lt; li & gt; 목록을 만들려면 & lt; div class = "row & gt; & lt; div class = "col-md-6"& gt; & gt; 내부 레이어 목록에 내부 레이어 목록이 행 너비의 절반을 차지하도록 지정합니다. 이런 식으로 내부 목록은 올바른 목록을 가질 수 있습니다.

부트 스트랩 목록에 아이콘을 추가하는 방법? Apr 07, 2025 am 10:42 AM

부트 스트랩 목록에 아이콘을 추가하는 방법 : 아이콘을 목록 항목에 직접 제정하십시오. 부트 스트랩 클래스를 사용하여 아이콘과 텍스트를 정렬하십시오 (예 : d-flex, 정당화-콘텐츠 중간, 정렬 중심). 부트 스트랩 태그 구성 요소 (배지)를 사용하여 숫자 또는 상태를 표시하십시오. 아이콘 위치를 조정하십시오 (Flex Direction : Row-Reverse;), 스타일을 제어 (CSS 스타일). 일반적인 오류 : 아이콘이 표시되지 않습니다 (아닙니다

vue.js의 객체로 문자열을 변환하는 데 어떤 방법이 사용됩니까? Apr 07, 2025 pm 09:39 PM

표준 JSON 문자열의 경우 vue.js의 객체로 문자열을 변환 할 때 JSON.PARSE ()가 선호됩니다. 비표준 JSON 문자열의 경우, 정규 표현식을 사용하여 문자열을 처리하고 형식 또는 디코딩 된 URL 인코딩에 따라 방법을 줄일 수 있습니다. 문자열 형식에 따라 적절한 방법을 선택하고 버그를 피하기 위해 보안 및 인코딩 문제에주의를 기울이십시오.

부트 스트랩의 그리드 시스템을 보는 방법 Apr 07, 2025 am 09:48 AM

Bootstrap의 메쉬 시스템은 컨테이너 (컨테이너), 행 (행) 및 col (열)의 세 가지 주요 클래스로 구성된 반응 형 레이아웃을 빠르게 구축하기위한 규칙입니다. 기본적으로 12 열 그리드가 제공되며 각 열의 너비는 COL-MD-와 같은 보조 클래스를 통해 조정하여 다양한 화면 크기에 대한 레이아웃 최적화를 달성 할 수 있습니다. 오프셋 클래스와 중첩 메시를 사용하면 레이아웃 유연성을 확장 할 수 있습니다. 그리드 시스템을 사용하는 경우 각 요소에 올바른 중첩 구조가 있는지 확인하고 성능 최적화를 고려하여 페이지 로딩 속도를 향상시킵니다. 심층적 인 이해와 실습에 의해서만 부트 스트랩 그리드 시스템을 능숙하게 마스터 할 수 있습니다.

부트 스트랩 5의 목록 스타일로 어떤 변화가 있었습니까? Apr 07, 2025 am 11:09 AM

부트 스트랩 5 목록 스타일 변경은 주로 세부 사항 최적화 및 시맨틱 개선으로 인한 것입니다. 다음을 포함한 시맨틱 개선으로 인한 것입니다. 변절되지 않은 목록의 기본 마진은 단순화되고 시각적 효과는 더 깨끗하고 깔끔합니다. 목록 스타일은 의미론을 강조하여 접근성과 유지 관리를 향상시킵니다.

부트 스트랩 목록은 어떻게 수직으로 배열됩니까? Apr 07, 2025 am 11:21 AM

Bootstrap 자체는 직접 수직 목록 기능을 제공하지 않으며 메커니즘을 사용하여 영리하게 구현해야합니다. Flexbox : 목록 상위 컨테이너에 "D-Flex Flex-Column"클래스를 수직으로 목록 항목을 배열하십시오. 래스터 시스템과 결합 : 복잡한 콘텐츠가 포함 된 목록 항목의 열 폭을 설정하고 레이아웃을보다 세밀하게 제어하십시오. 플로팅 또는 포지셔닝 방법을 사용하지 않기 위해 Bootstrap의 래스터 코어 "행"및 "Col"클래스를 사용하도록주의하십시오.

VUE의 내보내기 기본값으로 내보낸 구성 요소를 등록하는 방법 Apr 07, 2025 pm 06:24 PM

질문 : 내보내기 기본값을 통해 내보낸 VUE 구성 요소를 등록하는 방법은 무엇입니까? 답변 : 세 가지 등록 방법이 있습니다 : 글로벌 등록 : vue.component () 메소드를 사용하여 글로벌 구성 요소로 등록하십시오. 로컬 등록 : 현재 구성 요소 및 하위 구성 요소에서만 사용할 수있는 구성 요소 옵션에 등록하십시오. 동적 등록 : vue.component () 메소드를 사용하여 구성 요소가로드 된 후 등록하십시오.

See all articles

기존 GAN은 수정 후에도 해석이 가능하며 컨볼루션 커널의 해석 가능성과 생성된 이미지의 신뢰성을 보장합니다.

연구 배경 및 연구 과제

모델링 방법

요약

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제