ACM MM 2023 | DiffBFR: Meitu와 중국 과학기술대학교가 공동으로 제안한 소음 억제 얼굴 복원 방법-일체 포함-php.cn

집

기술 주변기기

일체 포함

ACM MM 2023 | DiffBFR: Meitu와 중국 과학기술대학교가 공동으로 제안한 소음 억제 얼굴 복원 방법

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Sep 03, 2023 am 08:05 AM

이론 아름다운 그림

BFR(Blind Face Restoration)의 목표는 낮은 품질의 얼굴 이미지에서 고품질의 얼굴 이미지를 복원하는 것입니다. 이는 컴퓨터 비전 및 그래픽 분야에서 중요한 작업으로 감시 영상 복원, 오래된 사진 복원, 얼굴 영상 초해상도 등 다양한 시나리오에서 널리 사용됩니다. 그러나 이 작업은 결정적이지 않기 때문에 매우 어렵습니다. 품질 저하로 인해 이미지 품질이 손상되고 흐림, 노이즈, 다운샘플링 및 압축 아티팩트와 같은 이미지 정보가 손실될 수도 있습니다. 이전 BFR 방법은 일반적으로 생성적 사전확률, 참조 사전확률, 기하학적 사전확률을 포함한 다양한 얼굴별 사전확률을 설계하여 이러한 문제를 해결하기 위해 생성적 적대 네트워크(GAN)에 의존했습니다. 이러한 방법은 최첨단 수준에 도달했지만 세부 사항을 복원하면서 사실적인 질감을 얻는 목표를 완전히 달성할 수는 없습니다.

이미지 복원 과정에서 얼굴 이미지의 데이터 세트는 일반적으로 고차원 공간에 분산되어 있습니다. 및 분산 기능 차원은 롱테일 분포를 나타냅니다. 이미지 분류 작업의 롱테일 분포와 달리, 이미지 복원에서의 롱테일 지역적 특징은 점, 주름, 색조 등 정체성에 미치는 영향은 작지만 시각적 효과에 큰 영향을 미치는 속성을 말합니다.

그림 1에 따르면 원래 의미를 변경하지 않기 위해 실험 결과를 중국어로 다시 작성해야 한다는 단순성이 표시됩니다. 이전 GAN 기반 방법은 머리 및 꼬리 샘플을 처리할 때 명백한 문제가 있음을 알 수 있습니다. 동시에 롱테일 분포가 발생하며 이미지를 복구할 때 오버슈팅이 발생하고 디테일이 손실됩니다. 확산 확률 모델(DPM) 기반 방법은 롱테일 분포에 더 잘 적합하고 실제 데이터 분포에 적합하면서도 꼬리 특성을 유지할 수 있습니다

ACM MM 2023 | DiffBFR: 美图&国科大联合提出的噪音抑制人脸修复方法

다시 작성해야 하는 내용은 GAN 기반 및 DPM- 롱테일 문제에 대한 기반 테스트

Meitu 이미징 연구소(MT Lab)는 중국과학원대학교 연구진과 협력하여 새로운 맹인 얼굴 이미지 복구 방법인 DiffBFR을 제안했습니다. 이 방법은 DPM 기술을 기반으로 하며 성공적으로 달성했습니다. 눈먼 얼굴 이미지 복원, 저품질(LQ) 얼굴 이미지를 고품질(HQ) 선명한 이미지로 복구

ACM MM 2023 | DiffBFR: 美图&国科大联合提出的噪音抑制人脸修复方法 다시 작성해야 할 내용은 다음과 같습니다. 논문 링크: https://arxiv.org/ abs/2305.04517

이 연구에서는 롱테일 문제를 처리할 때 GAN(Generative Adversarial Networks)과 DPM(Deep Partial Models)이라는 두 가지 생성 모델의 적응성을 탐구합니다. 적절한 얼굴 복원 모듈을 설계하면 보다 정확한 세부 정보를 얻을 수 있으며, 이를 통해 생성 방법에서 발생할 수 있는 얼굴의 과도한 스무딩 현상을 줄이고 복원의 정밀도와 정확성을 향상시킬 수 있습니다. 이 연구 논문은 ACM MM 2023

DPM 기반 블라인드 얼굴 이미지 복구 방법 - DiffBFR

연구에서 확산 모델이 훈련 모드 붕괴를 피하고 긴 영상을 생성하는 피팅에서 GAN 방법보다 더 나은 것으로 나타났습니다. 꼬리 분포. 따라서 DiffBFR은 얼굴 사전 정보의 임베딩을 향상시키기 위해 확산 확률 모델을 선택하고 이를 기본 프레임워크로 사용하여 DPM을 솔루션으로 선택합니다. 확산 모델은 임의의 분포 범위 내에서 고품질의 이미지를 생성할 수 있는 강력한 능력을 갖고 있기 때문입니다

논문에서 발견한 얼굴 데이터셋의 특징의 롱테일 분포와 과거의 over-smoothing 문제를 해결하기 위해 GAN 기반 방법으로, 이 연구에서는 대략적인 롱테일 분포에 더 잘 맞고 수리 과정에서 과도한 평활화 문제를 극복하기 위한 합리적인 설계를 탐구했습니다. MNIST 데이터 세트(그림 1)에서 동일한 매개변수 크기를 사용하여 GAN과 DPM의 간단한 실험을 통해 DPM 방법은 롱테일 분포에 합리적으로 적합하지만 GAN은 머리 특징에 너무 많은 관심을 기울이고 무시한다는 사실을 발견했습니다. 결과적으로 꼬리 특징을 생성할 수 없습니다. 따라서 DPM은 BFR

에 대한 솔루션으로 선택되었습니다. DiffBFR은 두 가지 중간 변수를 도입하여 두 가지 특정 복구 모듈을 제안합니다. 이 디자인은 먼저 LQ 이미지에서 신원 정보를 복구한 다음 실제 얼굴 분포를 기반으로 텍스처 세부 정보를 향상시키는 2단계 접근 방식을 채택합니다. 이 디자인은 두 가지 주요 부분으로 구성됩니다.

(1) IRM(신원 복원 모듈):

이 모듈의 목적은 결과에서 얼굴 세부 정보를 보존하는 것입니다. 동시에 저품질 영상에 노이즈의 일부를 추가하여 역과정으로 순수 가우스 랜덤 분포를 사용하는 노이즈 제거 방법을 대체하는 잘린 샘플링 방법이 제안되었습니다. 이 논문은 이러한 변경이 DPM의 이론적 증거 하한(ELBO)을 축소하여 보다 원래의 세부 사항을 복원한다는 것을 이론적으로 증명합니다. 이론적 증거를 바탕으로 샘플링 효과를 향상시키고 고해상도 이미지를 직접 생성하는 훈련 난이도를 줄이기 위해 입력 크기가 다른 두 개의 계단식 조건부 확산 모델이 도입되었습니다. 동시에, 조건부 입력의 품질이 높을수록 실제 데이터 분포에 가까워지고 복원된 이미지가 더 정확하다는 것이 추가로 입증되었습니다. 이것이 DiffBFR이 저해상도 이미지를 먼저 복원하는 이유이기도 합니다

(2) 텍스처 강화 모듈(TEM):

이미지를 다듬는 데 사용되는 방법은 무조건 확산 모델을 도입하는 것입니다. 이 모델은 저품질 이미지와 완전히 독립적이므로 복원된 결과를 실제 이미지 데이터에 더 가깝게 만듭니다. 이 논문은 순전히 고품질 이미지에 대해 훈련된 무조건 확산 모델이 픽셀 수준 공간에서 출력 이미지의 올바른 분포에 기여한다는 것을 이론적으로 증명합니다. 즉, 이 모델을 사용한 후 인페인팅된 이미지의 분포는 사용 전보다 낮은 FID를 가지며 전체적으로 고품질 이미지의 분포와 더 유사합니다. 구체적으로, 샘플링의 시간 단계 절단에 의해 식별 정보가 유지되고 픽셀 수준 텍스처가 연마됩니다. DiffBFR의 샘플링 추론 단계는 그림 2에 표시되며 샘플링 추론 프로세스의 개략도는 그림 3에 표시됩니다.

다시 작성해야 할 내용은 다음과 같습니다. 그림 2는 DiffBFR 방법의 샘플링 추론 단계를 보여줍니다.

다시 작성해야 할 내용은 다음과 같습니다. 그림 3은 DiffBFR 방법의 샘플링 추론 과정의 개략도를 보여줍니다. DiffBFR 방법

원래의 의미를 바꾸지 않기 위해 실험 결과를 중국어로 다시 작성해야 합니다

GAN 기반 BFR 방법과 DPM 기반 방법의 시각화 효과를 비교하면 다음과 같습니다. 그림 4

그림 5에서 BFR에 대한 SOTA 방식의 성능을 비교합니다

그림 6에서 BFR 방식의 시각화 비교를 보여줍니다

모델에서는 시각화를 통해 IRM과 TEM의 성능을 비교할 수 있습니다.

그림 8

모델에서는 IRM과 TEM의 성능을 비교합니다. 다시 작성해야 하는 내용은 다음과 같습니다. 다양한 매개변수에서 그림 9의 IRM 성능을 비교합니다

그림 10의 경우 다양한 매개변수의 성능을 비교해야 합니다.

재작성된 내용은 다음과 같습니다. 그림 11은 DiffBFR의 각 모듈에 대한 매개변수 설정을 보여줍니다.

요약은 정보를 결합하거나 아이디어를 간결하고 명확하게 재구성하는 과정입니다. 원래의 의미를 바꾸지는 않지만, 다른 어휘와 문장 구조를 사용하여 동일한 개념을 제시합니다. 요약의 목적은 독자가 전달된 정보를 더 쉽게 이해하고 소화할 수 있도록 더 명확하고 간결한 프레젠테이션을 제공하는 것입니다. 요약은 학술 논문, 비즈니스 보고서, 일상 커뮤니케이션 등 다양한 상황에서 중요한 아이디어와 결론을 전달하는 데 유용합니다. 요약하면, 요약은 정보를 보다 효과적으로 전달하고 이해하는 데 도움을 줄 수 있는 중요한 의사소통 도구입니다.

본 논문에서는 기존 GAN 기반 훈련 방법의 문제점을 해결하기 위해 확산 모델 기반의 블라인드 저하 얼굴 이미지 복원 모델 DiffBFR을 제안합니다. 모드 충돌 및 롱테일 사라지는 문제. 확산 모델에 사전 지식을 삽입함으로써 심각하게 저하된 임의의 얼굴 이미지로부터 고품질의 선명한 복원 이미지를 생성할 수 있습니다. 구체적으로 본 연구에서는 현실 복원과 세부 복원에 각각 사용되는 IRM과 TEM이라는 두 가지 모듈을 제안합니다. 이론적 도출과 실험적 이미지 시연을 통해 모델의 우수성을 입증하고, 기존의 최첨단 방법과 정성적, 정량적 비교가 이루어집니다

다시 작성해야 할 것은: 연구팀

본 논문은 메이투 이미징 연구소(MT Lab)와 중국과학원 대학교 연구원들이 공동으로 제안한 것입니다. Meitu 이미징 연구소(MT Lab)는 2010년에 설립되었습니다. Meitu 팀은 컴퓨터 비전, 딥 러닝, 증강 현실 및 기타 분야의 알고리즘 연구, 엔지니어링 개발 및 제품 구현에 중점을 두고 있습니다. 팀은 설립 이후 컴퓨터 비전 분야의 연구를 탐구하는 데 전념해 왔으며 2013년부터 Meitu의 소프트웨어 및 하드웨어 제품에 대한 기술 지원을 제공하기 위해 딥 러닝을 배포하기 시작했습니다. 동시에 이미징 산업의 여러 수직 분야에 대한 대상 SaaS 서비스도 제공하고, 최첨단 이미징 기술을 통해 Meitu 인공 지능 제품의 생태학적 발전을 촉진합니다. CVPR, ICCV, ECCV 등 최고의 국제대회에 참가해 10회 이상의 우승과 준우승을 기록했으며, 48편 이상의 국제학술대회 논문을 발표했습니다. 메이투 이미징 연구소(MT Lab)는 오랫동안 이미징 분야의 연구 개발에 전념해 왔으며 풍부한 기술 보유량을 축적했으며 사진, 비디오, 디자인 및 디지털 피플 분야에서 풍부한 기술 구현 경험을 보유하고 있습니다

위 내용은 ACM MM 2023 | DiffBFR: Meitu와 중국 과학기술대학교가 공동으로 제안한 소음 억제 얼굴 복원 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7439

Cakephp 튜토리얼

1369

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

Related knowledge

화웨이의 Qiankun ADS3.0 지능형 운전 시스템은 8월에 출시될 예정이며 처음으로 Xiangjie S9에 출시될 예정입니다. Jul 30, 2024 pm 02:17 PM

7월 29일, AITO Wenjie의 400,000번째 신차 출시 행사에 Huawei 전무이사이자 Terminal BG 회장이자 Smart Car Solutions BU 회장인 Yu Chengdong이 참석하여 연설을 했으며 Wenjie 시리즈 모델이 출시될 것이라고 발표했습니다. 올해 출시 예정 지난 8월 Huawei Qiankun ADS 3.0 버전이 출시되었으며, 8월부터 9월까지 순차적으로 업그레이드를 추진할 계획입니다. 8월 6일 출시되는 Xiangjie S9에는 화웨이의 ADS3.0 지능형 운전 시스템이 최초로 탑재됩니다. LiDAR의 도움으로 Huawei Qiankun ADS3.0 버전은 지능형 주행 기능을 크게 향상시키고, 엔드투엔드 통합 기능을 갖추고, GOD(일반 장애물 식별)/PDP(예측)의 새로운 엔드투엔드 아키텍처를 채택합니다. 의사결정 및 제어), 주차공간부터 주차공간까지 스마트 드라이빙의 NCA 기능 제공, CAS3.0 업그레이드

또 다른 Snapdragon 8Gen3 태블릿 ~ OPPOPad3 노출 Jul 29, 2024 pm 04:26 PM

지난달 OnePlus는 Snapdragon 8 Gen3이 탑재된 첫 번째 태블릿인 OnePlus Tablet Pro를 출시했습니다. 최신 뉴스에 따르면 이 태블릿의 "유아 교체" 버전인 OPPOPad3도 곧 출시될 예정입니다. 위 사진은 OPPOPad2를 보여줍니다. Digital Chat Station에 따르면 OPPOPad3의 모양과 구성은 OnePlus Tablet Pro와 완전히 동일합니다. 색상: 금색, 파란색(OnePlus의 녹색 및 어두운 회색과 다름) /12/16GB+512GB 출시일 : 올해 4분기(10~12월) 동기간 신제품 : 찾기

'Defect Spectrum'은 기존 결함 감지의 경계를 뛰어넘어 초고정밀 및 풍부한 의미론적 산업 결함 감지를 최초로 달성합니다. Jul 26, 2024 pm 05:38 PM

현대 제조업에서 정확한 결함 검출은 제품 품질을 보장하는 열쇠일 뿐만 아니라 생산 효율성을 향상시키는 핵심이기도 합니다. 그러나 기존 결함 감지 데이터세트는 실제 적용에 필요한 정확성과 의미론적 풍부함이 부족한 경우가 많아 모델이 특정 결함 카테고리나 위치를 식별할 수 없게 됩니다. 이 문제를 해결하기 위해 광저우 과학기술대학교와 Simou Technology로 구성된 최고 연구팀은 산업 결함에 대한 상세하고 의미론적으로 풍부한 대규모 주석을 제공하는 "DefectSpectrum" 데이터 세트를 혁신적으로 개발했습니다. 표 1에서 볼 수 있듯이, 다른 산업 데이터 세트와 비교하여 "DefectSpectrum" 데이터 세트는 가장 많은 결함 주석(5438개의 결함 샘플)과 가장 상세한 결함 분류(125개의 결함 카테고리)를 제공합니다.

NVIDIA 대화 모델 ChatQA는 버전 2.0으로 발전했으며 컨텍스트 길이는 128K로 언급되었습니다. Jul 26, 2024 am 08:40 AM

오픈 LLM 커뮤니티는 백개의 꽃이 피어 경쟁하는 시대입니다. Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 등을 보실 수 있습니다. 훌륭한 연기자. 그러나 GPT-4-Turbo로 대표되는 독점 대형 모델과 비교하면 개방형 모델은 여전히 많은 분야에서 상당한 격차를 보이고 있습니다. 일반 모델 외에도 프로그래밍 및 수학을 위한 DeepSeek-Coder-V2, 시각 언어 작업을 위한 InternVL과 같이 핵심 영역을 전문으로 하는 일부 개방형 모델이 개발되었습니다.

Google AI가 IMO 수학 올림피아드 은메달을 획득하고 수학적 추론 모델 AlphaProof가 출시되었으며 강화 학습이 다시 시작되었습니다. Jul 26, 2024 pm 02:40 PM

AI의 경우 수학 올림피아드는 더 이상 문제가 되지 않습니다. 목요일에 Google DeepMind의 인공 지능은 AI를 사용하여 올해 국제 수학 올림피아드 IMO의 실제 문제를 해결하는 위업을 달성했으며 금메달 획득에 한 걸음 더 다가섰습니다. 지난 주 막 끝난 IMO 대회에는 대수학, 조합론, 기하학, 수론 등 6개 문제가 출제됐다. 구글이 제안한 하이브리드 AI 시스템은 4문제를 맞혀 28점을 얻어 은메달 수준에 이르렀다. 이달 초 UCLA 종신 교수인 테렌스 타오(Terence Tao)가 상금 100만 달러의 AI 수학 올림피아드(AIMO Progress Award)를 추진했는데, 예상외로 7월 이전에 AI 문제 해결 수준이 이 수준으로 향상됐다. IMO에서 동시에 질문을 해보세요. 가장 정확하게 하기 어려운 것이 IMO인데, 역사도 가장 길고, 규모도 가장 크며, 가장 부정적이기도 합니다.

수백만 개의 결정 데이터로 훈련하여 결정학적 위상 문제를 해결하는 딥러닝 방법인 PhAI가 Science에 게재되었습니다. Aug 08, 2024 pm 09:22 PM

Editor |KX 오늘날까지 단순한 금속부터 큰 막 단백질에 이르기까지 결정학을 통해 결정되는 구조적 세부 사항과 정밀도는 다른 어떤 방법과도 비교할 수 없습니다. 그러나 가장 큰 과제인 소위 위상 문제는 실험적으로 결정된 진폭에서 위상 정보를 검색하는 것입니다. 덴마크 코펜하겐 대학의 연구원들은 결정 위상 문제를 해결하기 위해 PhAI라는 딥러닝 방법을 개발했습니다. 수백만 개의 인공 결정 구조와 그에 상응하는 합성 회절 데이터를 사용하여 훈련된 딥러닝 신경망은 정확한 전자 밀도 맵을 생성할 수 있습니다. 연구는 이 딥러닝 기반의 순순한 구조 솔루션 방법이 단 2옹스트롬의 해상도로 위상 문제를 해결할 수 있음을 보여줍니다. 이는 원자 해상도에서 사용할 수 있는 데이터의 10~20%에 해당하는 반면, 기존의 순순한 계산은

자연의 관점: 의학 분야의 인공지능 테스트는 혼란에 빠졌습니다. 어떻게 해야 할까요? Aug 22, 2024 pm 04:37 PM

Editor | ScienceAI 제한된 임상 데이터를 기반으로 수백 개의 의료 알고리즘이 승인되었습니다. 과학자들은 누가 도구를 테스트해야 하며 최선의 방법은 무엇인지에 대해 토론하고 있습니다. 데빈 싱(Devin Singh)은 응급실에서 오랜 시간 치료를 기다리던 중 심장마비를 겪는 소아환자를 목격했고, 이를 계기로 대기시간을 단축하기 위해 AI 적용을 모색하게 됐다. SickKids 응급실의 분류 데이터를 사용하여 Singh과 동료들은 잠재적인 진단을 제공하고 테스트를 권장하는 일련의 AI 모델을 구축했습니다. 한 연구에 따르면 이러한 모델은 의사 방문 속도를 22.3% 단축하여 의료 검사가 필요한 환자당 결과 처리 속도를 거의 3시간 단축할 수 있는 것으로 나타났습니다. 그러나 인공지능 알고리즘의 연구 성공은 이를 입증할 뿐이다.

Bai Jian은 새로운 NIO Phone에 대한 소식을 전하고 NIO가 휴대폰 만들기를 고집하는 이유에 대해 답변합니다. Jul 25, 2024 pm 01:14 PM

새로운 NIO NIO Phone(니오폰2)이 7월 27일 출시됩니다. 출시일이 다가온 7월 24일, NIO Technology (Anhui) Co., Ltd.의 부사장 Bai Jian은 NIO Phone에 관해 네티즌들 사이에서 가장 자주 묻는 두 가지 질문에 답했습니다. NIOPhone "NIO는 왜 휴대폰만들기를 고집하나요?" 신형 NIOPhone과 관련된 거의 모든 댓글란에 비슷한 질문이 나옵니다. Bai Jian은 Weilai가 아주 일찍부터 휴대폰 제조에 대해 생각하고 계획하기 시작했다고 대답했습니다. 일부 휴대폰 브랜드가 자동차를 만들기 시작했기 때문에 일부 사람들이 말했듯이 그것은 변덕스러운 일이 아니었습니다. Bai Jian은 새로운 NIOPhone "스마트 자동차 및 휴대폰"에 대한 소식을 전했습니다.

See all articles