최근 CVPR 2023 대회 결과가 발표되었습니다. NetEase Fuxi Lab은 CVPR 2023 UG2+ Haze Target Recognition Challenge 및 VizWiz Few-Sample Target Recognition Challenge에서 1위를 차지했습니다. 관련 논문은 국제 최고 저널인 TIP에도 게재되었습니다. 이는 컴퓨터 비전 분야에서 NetEase Fuxi의 최고의 기술 혁신 역량이 국제적으로 높은 평가를 받고 있음을 보여줍니다.
IEEE/CVF Computer Vision and Pattern Recognition Conference(CVPR)는 2023년 2월부터 6월까지 국제 컴퓨터 비전 및 패턴 인식 분야 최고의 컨퍼런스로 글로벌 권위 있는 학술기관 및 유명 기업과 협력해 왔습니다. 다양한 도전 경주를 개최합니다. 이러한 과제는 많은 AI 연구팀의 광범위한 참여를 이끌어냈습니다. 최근 CVPR은 수상 결과를 잇달아 발표하고 수상 증서를 발행했습니다. CVPR은 IEEE가 주최하는 최고의 AI 학술대회로 학문적 영향력과 사회적 인지도가 매우 높습니다.
CVPR 2023 UG2+객체 감지 연무 챌린지 및 CVPR 2023 VizWiz Few-Shot 객체 인식 챌린지에서 NetEase Fuxi와 대학의 중국 과학 기술 교사 Yu Jun이 팀을 이루어 1등을 차지했습니다. 이번 협력은 주로 컴퓨터 비전 분야의 표적 탐지와 소수 샘플 표적 인식이라는 두 가지 측면에 중점을 두고 있습니다. 이러한 기술은 다양한 분야의 비전 작업에 널리 사용될 수 있습니다. 특히 산업 응용 분야에서 소수 샘플 대상 탐지는 데이터 수집 및 주석이 어려운 시나리오에서 큰 가치와 중요성을 갖습니다. 이번 대회의 성공을 통해 우리는 컴퓨터 비전 분야에서 NetEase Fuxi의 연구 강점과 혁신 역량을 입증했습니다. 우리는 계속해서 컴퓨터 비전 기술의 발전을 촉진하고 실제 응용을 위한 보다 정확하고 효율적인 솔루션을 제공하기 위해 최선을 다할 것입니다.
UG2+는 분석 성능을 향상시키기 위해 이미지 복원 및 향상 알고리즘을 적용하여 "어려운" 이미지의 분석을 발전시키는 것을 목표로 합니다. 참가자들은 문제가 있는 조건에서 캡처된 이미지 분석을 개선하기 위해 새로운 알고리즘을 개발해야 합니다. VizWiz의 목표는 더 많은 사람들이 시각 장애가 있는 사람들의 기술 요구 사항과 관심 사항을 인식하도록 하고 인공 지능 연구자들이 접근성 장벽을 제거하기 위한 새로운 알고리즘을 개발하도록 장려하는 것입니다. 대회에는 일반적으로 이미지 속 개체 식별, 이미지 속 텍스트 식별, 이미지 관련 질문에 답하기 등의 작업이 포함됩니다. 다음은 NetEase Fuxi의 수상 논문에 대한 간략한 개요입니다.
비지도 이상 탐지를 위한 전방향 주파수 채널 선택 표현
비지도 이상 탐지를 위한 전방향 주파수 채널 선택 표현
키워드: 비지도 이미지 이상 탐지
이상 탐지는 시각적 이미지 이해에 중요한 역할을 하며, 주어진 이미지가 미리 설정된 정상 상태를 벗어나는지 여부를 판단하는 데 사용됩니다. 이는 참신함 감지, 산업용 이미지 기반 제품 품질 모니터링, 자동 결함 복구, 인체 건강 모니터링 및 비디오 감시에 널리 사용됩니다. 현재 주류 비지도 이상 탐지 방법에는 밀도 기반 방법, 분류 기반 방법, 재구성 기반 방법 등 세 가지 주요 유형이 있습니다. 이러한 방법은 이미지의 통계적 특성을 분석하고, 정상 샘플을 학습하고, 이미지를 재구성하여 이상 탐지를 달성하고, 다양한 애플리케이션에 대한 신뢰할 수 있는 도구와 기술 지원을 제공합니다.
그 중 재구성 기반 방법은 재구성 능력이 낮고 성능이 낮기 때문에 거의 언급되지 않습니다. 그러나 비지도 훈련을 위해 많은 수의 추가 훈련 샘플이 필요하지 않으며 산업 응용 분야에서 더 실용적입니다. 이를 위해 본 연구에서는 재구성 기반 방법의 개선에 중점을 두고, 주파수 관점에서 감각 이상 탐지 작업을 처리하는 최초의 새로운 전체 주파수 채널 선택 재구성 네트워크(OCR-GAN)를 제안한다. 많은 실험을 통해 다른 방법에 비해 이 방법의 효과와 우월성이 입증되었습니다. 예를 들어, 추가 교육 데이터 없이 MVTec AD 데이터 세트에서 새로운 SOTA 성능이 달성되며 AUC는 98.3으로 재구성 기반 방법 기준인 38.1과 현재 SOTA 방법을 0.3 크게 초과합니다.
본 논문에서는 스마트 게임 호환성 테스트에서 UI 이상 문제를 해결하기 위한 혁신적인 솔루션을 제안합니다. 이 솔루션은 인공지능 기술을 활용해 게임 실행 시 발생하는 UI 이상 현상을 자동으로 감지하고, 게임 호환성 테스트 자동화를 구현한다. 이미지 이상 탐지 기술을 사용하여 생성된 다수의 게임 인터페이스 스크린샷을 컴퓨터 비전 관점에서 자동으로 탐지하고, 그로부터 UI 비정상적인 그림을 얻어 게임 개발자가 문제의 원인을 빠르고 정확하게 찾아내도록 지원하여 효과적으로 비용을 절감합니다. 게임 테스트. 전문가의 인건비.
이 논문은 저장대학교 Liu Yong 교수팀과 공동으로 IEEE Transactions on Image Process(TIP) 저널에 게재되도록 선정되었습니다. TIP는 IEEE 산하 영상처리 연구 분야 최고 저널로, 중국과학원 SCI 분야 저널이자, 컴퓨터 그래픽 및 멀티미디어(CCF A) 분야 카테고리 A 저널입니다. 중국 컴퓨터 학회에서 권장하는 제품입니다. 2022~2023년 저널의 Impact Factor는 11.041에 이릅니다.
위 내용은 NetEase Fuxi는 CVPR 2023 UG2+ 및 VizWiz 대회에서 우승했으며 그의 논문은 TIP로 선정되었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!