목차
심층 준지도 학습
현재 반지도 학습 코드 라이브러리의 문제점과 과제
USB: 다양한 작업을 수행하고 연구자에게 더욱 친숙한 새로운 벤치마크 라이브러리
USB가 제공하는 솔루션
기술 주변기기 일체 포함 USB: 시각, 언어 및 오디오 분류 작업을 통합하는 최초의 준지도 분류 학습 벤치마크

USB: 시각, 언어 및 오디오 분류 작업을 통합하는 최초의 준지도 분류 학습 벤치마크

Apr 13, 2023 pm 02:46 PM
비전

현재 준지도 학습의 개발이 본격화되고 있습니다. 그러나 기존 준지도 학습 벤치마크는 자연어 처리, 오디오 처리 등 분류 작업에 대한 일관되고 다양한 평가를 제외하고 대부분 컴퓨터 비전 분류 작업으로 제한됩니다. 또한 대부분의 준지도 논문은 대규모 기관에서 출판되며, 컴퓨팅 자원의 한계로 인해 학술 연구실이 해당 분야 발전에 참여하기 어려운 경우가 많습니다.

이를 위해 Microsoft Research Asia의 연구원들은 Westlake University, Tokyo Institute of Technology, Carnegie Mellon University, Max Planck Institute 및 기타 기관의 연구원들과 함께 Unified SSL Benchmark(USB)를 제안했습니다. 시각적, 언어 및 오디오 분류 작업을 통합하는 지도 분류 학습 벤치마크입니다.

본 논문에서는 보다 다양한 응용 분야를 소개할 뿐만 아니라 최초로 시각적 사전 훈련 모델을 사용하여 준지도 알고리즘의 검증 시간을 대폭 단축하여 연구자에게 더욱 친숙한 준지도 연구를 제공합니다. 소규모 연구 그룹. 인공지능 분야 최고 국제학술대회인 NeurIPS 2022에 관련 논문이 게재되었습니다.

USB: 시각, 언어 및 오디오 분류 작업을 통합하는 최초의 준지도 분류 학습 벤치마크

문서 링크: https://arxiv.org/pdf/2208.07204.pdf

코드 링크: https://github.com/microsoft/Semi-supervised-learning

지도 학습은 레이블이 지정된 데이터에 적합한 모델을 구축합니다. 지도 학습을 사용하여 대량의 고품질 레이블이 지정된 데이터를 훈련하면 신경망 모델이 경쟁력 있는 결과를 생성합니다.

예를 들어 Paperswithcode 웹사이트의 통계에 따르면 ImageNet의 백만 수준 데이터 세트에서 기존 지도 학습 방법은 88% 이상의 정확도를 달성할 수 있습니다. 그러나 대량의 레이블이 지정된 데이터를 얻는 데는 시간이 많이 걸리고 힘든 경우가 많습니다.

반지도 학습(SSL)은 레이블이 있는 데이터에 대한 의존성을 완화하기 위해 레이블이 없는 대량의 데이터를 사용하여 레이블이 있는 데이터가 적을 때 모델의 일반화를 개선하는 데 전념합니다. 준지도 학습(Semi-supervised learning) 역시 머신러닝의 중요한 주제 중 하나입니다. 딥러닝 이전에 이 분야의 연구자들은 준지도 지원 벡터 머신, 엔트로피 정규화 및 협업 훈련과 같은 고전적인 알고리즘을 제안했습니다.

심층 준지도 학습

딥 러닝의 등장과 함께 심층 준지도 학습 알고리즘도 큰 발전을 이루었습니다. 동시에 Microsoft, Google, Meta를 포함한 기술 회사들도 실제 시나리오에서 준지도 학습의 엄청난 잠재력을 인식했습니다.

예를 들어 Google은 검색 성능을 향상시키기 위해 준지도 알고리즘인 시끄러운 학생 훈련을 사용합니다[1]. 가장 대표적인 준지도 알고리즘은 현재 레이블이 지정된 데이터에 대한 훈련에 교차 엔트로피 손실을 사용하고 레이블이 지정되지 않은 데이터에 대한 일관성 정규화를 사용하여 입력 섭동에 대한 불변 예측을 장려합니다.

예를 들어, NeurIPS 2020에서 Google이 제안한 FixMatch[2] 알고리즘은 증강 앵커링 및 고정 임계값 기술을 사용하여 모델의 일반화를 다양한 강도의 향상된 데이터로 향상하고 노이즈 의사 라벨의 영향을 줄입니다. 훈련 중에 FixMatch는 사용자가 제공/사전 정의한 임계값 아래에서 레이블이 지정되지 않은 데이터를 필터링합니다. NeurIPS 2021에서 Microsoft Research Asia와 Tokyo Institute of Technology가 공동으로 제안한

FlexMatch[3]는 다양한 범주 간의 다양한 학습 어려움을 고려하므로 수업에서 서로 다른 임계값을 채택해야 한다고 제안합니다.

특히, 배우기 쉬운 카테고리의 경우 모델은 학습하기 어려운 카테고리에 대한 시끄러운 의사 라벨의 영향을 줄이기 위해 높은 임계값을 설정해야 하며, 모델은 피팅을 장려하기 위해 낮은 임계값을 설정해야 합니다. 이 카테고리의. 각 클래스의 학습 난이도 평가는 해당 클래스에 속하고 고정된 값을 초과하는 레이블이 지정되지 않은 데이터 샘플의 수에 따라 달라집니다.

동시에 Microsoft Research Asia의 연구원들은 이 분야에서 심층적인 방법, 일반적으로 사용되는 데이터 세트 및 벤치마크 결과를 통합하는 통합 Pytorch 기반 준지도 방법 코드 라이브러리 TorchSSL[4]을 제안하기 위해 협력했습니다. 지원하다.

USB: 시각, 언어 및 오디오 분류 작업을 통합하는 최초의 준지도 분류 학습 벤치마크그림 1: FlexMatch 알고리즘 흐름

현재 반지도 학습 코드 라이브러리의 문제점과 과제

반지도 학습의 개발이 본격화되고 있지만 연구자들은 현재 대부분의 코드가 준지도 방향의 논문 컴퓨터 비전(CV) 분류 작업에만 초점을 맞춰 연구자들은 CV 작업에 효과적인 이러한 알고리즘이 자연어 처리(NLP) 및 오디오와 같은 다른 분야의 다른 분야에서도 여전히 효과적인지 여부를 알 수 없습니다. 처리(오디오).

또한 대부분의 준지도 논문은 대규모 기관에서 출판되며, 컴퓨팅 자원의 한계로 인해 학술 연구실이 이 분야의 발전을 촉진하는 데 참여하기 어려운 경우가 많습니다. 일반적으로 준지도 학습 벤치마크에는 현재 다음과 같은 두 가지 문제가 있습니다.

(1) 다양성이 부족합니다. 기존 준지도 학습 벤치마크의 대부분은 CV 분류 작업(예: CIFAR-10/100, SVHN, STL-10 및 ImageNet 분류)으로 제한되며 NLP, 오디오 등과 같은 분류 작업에 대한 일관되고 다양한 평가를 제외합니다. , NLP에서는 오디오에 레이블이 지정된 데이터가 충분하지 않은 것도 일반적인 문제입니다.

(2) 시간이 많이 걸리고 학계에 비우호적입니다. TorchSSL과 같은 기존 반지도 학습 벤치마크는 심층 신경망 모델을 처음부터 훈련해야 하는 경우가 많기 때문에 시간이 많이 걸리고 환경 친화적이지 않은 경우가 많습니다. 특히 TorchSSL을 사용하여 FixMatch[1]를 평가하려면 약 300일의 GPU일이 필요합니다. 이러한 높은 교육 비용으로 인해 많은 연구실(특히 학계 또는 소규모 연구 그룹)에서 SSL 관련 연구를 감당할 수 없게 되어 SSL의 발전을 방해하게 됩니다.

USB: 다양한 작업을 수행하고 연구자에게 더욱 친숙한 새로운 벤치마크 라이브러리

위의 문제를 해결하기 위해 Microsoft Research Asia의 연구원들은 Westlake University, Tokyo Institute of Technology, Carnegie Mellon University, Max- Planck Institute 및 기타 기관의 연구원들은 시각, 언어 및 오디오 분류 작업을 통합하는 최초의 준지도 분류 학습 벤치마크인 통합 SSL 벤치마크(USB)를 제안했습니다.

소수의 비전 작업에만 초점을 맞춘 이전 준지도 학습 벤치마크(예: TorchSSL)와 비교하여, 이 벤치마크는 보다 다양한 응용 분야를 소개할 뿐만 아니라 비전 사전 훈련된 모델(사전 훈련된 비전)을 사용합니다. Transformer)를 통해 처음으로 시각적 작업 수를 크게 줄였습니다. 반지도 알고리즘의 검증 시간이 단축되어(7000 GPU 시간에서 900 GPU 시간으로) 반지도 연구, 특히 소규모 연구에 더욱 친숙해졌습니다. 여러 떼.

국제 인공지능 분야 최고 학술회의인 NeurIPS 2022에 관련 논문이 접수되었습니다. (자세한 내용은 "원문 읽기"를 클릭하세요.)

USB가 제공하는 솔루션

그렇다면 USB는 어떻게 현재 준지도 벤치마크의 문제를 한 번에 해결할 수 있을까요? 연구원들은 주로 다음과 같은 개선을 이루었습니다.

(1) 작업 다양성을 높이기 위해 USB는 5개의 CV 데이터 세트, 5개의 NLP 데이터 세트 및 5개의 오디오 데이터 세트를 도입하고 다양하고 도전적인 벤치마크를 제공하여 여러 항목에 대한 일관된 평가를 가능하게 했습니다. 다양한 도메인의 작업. 표 1은 USB와 TorchSSL 간의 작업 및 교육 시간을 자세히 비교한 것입니다.

USB: 시각, 언어 및 오디오 분류 작업을 통합하는 최초의 준지도 분류 학습 벤치마크

표 1: USB와 TorchSSL 프레임워크 간의 작업 및 교육 시간 비교

(2) 교육 효율성을 높이기 위해 연구원들은 사전 교육된 비전 Transformer를 SSL 대신 SSL에 도입했습니다. ResNet 교육을 처음부터 시작합니다. 특히 연구원들은 사전 훈련된 모델을 사용하면 성능에 영향을 주지 않고 훈련 반복 횟수를 크게 줄일 수 있다는 사실을 발견했습니다(예: CV 작업에 대한 훈련 반복 횟수를 100만 단계에서 200,000단계로 줄임).

(3) 연구원들에게 더욱 친숙한 환경을 제공하기 위해 연구원들은 14개의 SSL 알고리즘을 오픈 소스로 구현했으며 연구원들이 USB 보고서에서 결과를 쉽게 재현할 수 있도록 모듈형 코드 라이브러리 및 관련 구성 파일을 오픈 소스로 제공했습니다. 빠르게 시작할 수 있도록 USB는 자세한 문서와 튜토리얼도 제공합니다. 또한 USB는 사용자가 SSL 알고리즘을 직접 호출할 수 있도록 pip 패키지도 제공합니다. 연구원들은 앞으로도 새로운 알고리즘(예: 불균형 준지도 알고리즘 등)과 더욱 까다로운 데이터 세트를 USB에 계속 추가할 것을 약속합니다. 표 2는 USB에서 지원되는 알고리즘과 모듈을 보여줍니다.

USB: 시각, 언어 및 오디오 분류 작업을 통합하는 최초의 준지도 분류 학습 벤치마크

표 2: USB에서 지원되는 알고리즘 및 모듈

반 지도 학습은 레이블이 지정되지 않은 대량의 데이터를 활용하여 보다 정확하고 강력한 모델과 애플리케이션 가치를 교육함으로써 중요한 미래 연구를 수행합니다. Microsoft Research Asia 연구원들은 이 USB 작업을 사용하여 학계와 업계가 준지도 학습 분야에서 더 큰 발전을 이룰 수 있기를 기대하고 있습니다.

위 내용은 USB: 시각, 언어 및 오디오 분류 작업을 통합하는 최초의 준지도 분류 학습 벤치마크의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Goat Simulator 3에서 공포 복도 임무를 완료하는 방법 Goat Simulator 3에서 공포 복도 임무를 완료하는 방법 Feb 25, 2024 pm 03:40 PM

Terror Corridor는 Goat Simulator 3의 임무입니다. 이 임무를 어떻게 완료할 수 있습니까? 자세한 정리 방법과 해당 프로세스를 숙지하고 이 임무의 해당 과제를 완료할 수 있으면 Goat Simulator 3가 제공됩니다. 관련 정보를 배울 수 있는 안내입니다. Goat Simulator 3 Terror Corridor 가이드 1. 먼저 플레이어는 지도의 왼쪽 상단에 있는 Silent Hill로 이동해야 합니다. 2. 지붕에 RESTSTOP이라고 적힌 집이 보입니다. 플레이어는 이 집에 들어가려면 염소를 조작해야 합니다. 3. 방에 들어간 후 먼저 직진하다가 여기 끝에 문이 있고 여기서 바로 들어갑니다. 4. 들어간 후에도 먼저 앞으로 걸어간 다음 여기 문에 도달하면 문이 닫혀 있어야합니다.

수정: Windows 작업 스케줄러에서 운영자 거부 요청 오류 수정: Windows 작업 스케줄러에서 운영자 거부 요청 오류 Aug 01, 2023 pm 08:43 PM

작업을 자동화하고 여러 시스템을 관리하기 위해 임무 계획 소프트웨어는 특히 시스템 관리자에게 유용한 도구입니다. Windows 작업 스케줄러는 작업을 완벽하게 수행하지만 최근 많은 사람들이 운영자 거부 요청 오류를 보고했습니다. 이 문제는 운영 체제의 모든 반복에 존재하며 널리 보고되고 다루어졌음에도 불구하고 효과적인 해결책은 없습니다. 다른 사람들에게 실제로 효과가 있을 수 있는 것이 무엇인지 알아보려면 계속해서 읽어보세요! 운영자 또는 관리자가 거부한 작업 스케줄러 0x800710e0의 요청은 무엇입니까? 작업 스케줄러를 사용하면 사용자 입력 없이 다양한 작업과 응용 프로그램을 자동화할 수 있습니다. 이를 사용하여 특정 애플리케이션을 예약 및 구성하고, 자동 알림을 구성하고, 메시지 전달을 돕는 등의 작업을 할 수 있습니다. 그것

Goat Simulator 3에서 Imperial Tomb 미션을 통과하는 방법 Goat Simulator 3에서 Imperial Tomb 미션을 통과하는 방법 Mar 11, 2024 pm 01:10 PM

Goat Simulator 3는 고전적인 시뮬레이션 게임플레이를 갖춘 게임으로, 플레이어는 캐주얼 액션 시뮬레이션의 재미를 완전히 경험할 수 있습니다. 이 게임에는 또한 많은 흥미로운 특수 작업이 있으며, 그 중 Goat Simulator 3 Imperial Tomb 작업에서는 플레이어가 종탑을 찾아야 합니다. 일부 플레이어는 세 개의 시계를 동시에 작동하는 방법을 잘 모릅니다. 다음은 Goat Simulator 3의 Tomb of the Tomb 미션에 대한 가이드입니다! 순서대로. 세부 단계 확장 1. 먼저 지도를 열고 Wuqiu Cemetery로 이동해야 합니다. 2. 그런 다음 종탑으로 올라가면 내부에 3개의 종이 있을 것입니다. 3. 그리고 큰 것부터 작은 것 순으로 222312312를 따라가면서 화난 두드리기에 익숙해지세요. 4. 노크를 완료한 후 미션을 완료하고 문을 열어 광선검을 획득할 수 있습니다.

Goat Simulator 3에서 스티브 구출 임무를 수행하는 방법 Goat Simulator 3에서 스티브 구출 임무를 수행하는 방법 Feb 25, 2024 pm 03:34 PM

Steve 구출은 Goat Simulator 3의 독특한 작업입니다. 이 작업을 완료하려면 정확히 무엇을 해야 할까요? 이 작업은 상대적으로 간단하지만 의미를 오해하지 않도록 주의해야 합니다. 여기서는 Goat Simulator에서 Steve를 구출하도록 안내하겠습니다. 3 작업 전략은 관련 작업을 더 잘 완료하는 데 도움이 될 수 있습니다. 염소 시뮬레이터 3 스티브 구출 미션 전략 1. 먼저 지도 오른쪽 하단에 있는 온천으로 가세요. 2. 온천에 도착하면 스티브 구출 임무를 시작할 수 있습니다. 3. 온천에 남자가 있다는 점에 유의하세요. 그의 이름은 스티브이지만 그는 이 임무의 대상이 아닙니다. 4. 이 온천에서 스티브라는 물고기를 찾아 해변으로 가져와 이 작업을 완료하세요.

ORB-SLAM3를 넘어! SL-SLAM: 저조도, 심한 흔들림, 약한 텍스처 장면을 모두 처리합니다. ORB-SLAM3를 넘어! SL-SLAM: 저조도, 심한 흔들림, 약한 텍스처 장면을 모두 처리합니다. May 30, 2024 am 09:35 AM

이전에 작성했던 오늘은 딥 러닝 기술이 복잡한 환경에서 비전 기반 SLAM(동시 위치 파악 및 매핑)의 성능을 향상할 수 있는 방법에 대해 논의합니다. 심층 특징 추출과 깊이 일치 방법을 결합하여 저조도 조건, 동적 조명, 질감이 약한 영역 및 심한 지터와 같은 까다로운 시나리오에서 적응을 향상하도록 설계된 다목적 하이브리드 시각적 SLAM 시스템을 소개합니다. 우리 시스템은 확장 단안, 스테레오, 단안 관성 및 스테레오 관성 구성을 포함한 여러 모드를 지원합니다. 또한 시각적 SLAM을 딥러닝 방법과 결합하여 다른 연구에 영감을 주는 방법도 분석합니다. 공개 데이터 세트 및 자체 샘플링 데이터에 대한 광범위한 실험을 통해 위치 정확도 및 추적 견고성 측면에서 SL-SLAM의 우수성을 입증합니다.

Douyin 팬 그룹 작업은 어디에서 찾을 수 있나요? Douyin 팬클럽이 레벨을 잃을까요? Douyin 팬 그룹 작업은 어디에서 찾을 수 있나요? Douyin 팬클럽이 레벨을 잃을까요? Mar 07, 2024 pm 05:25 PM

현재 가장 인기 있는 소셜 미디어 플랫폼 중 하나인 TikTok은 많은 사용자의 참여를 유도하고 있습니다. Douyin에는 사용자가 특정 보상과 혜택을 얻기 위해 완료할 수 있는 팬 그룹 작업이 많이 있습니다. 그렇다면 Douyin 팬클럽 작업은 어디서 찾을 수 있나요? 1. 두인 팬클럽 과제는 어디서 볼 수 있나요? Douyin 팬 그룹 작업을 찾으려면 Douyin의 개인 홈페이지를 방문해야 합니다. 홈페이지에 보시면 '팬클럽'이라는 옵션이 보이실 겁니다. 이 옵션을 클릭하면 자신이 가입한 팬 그룹 및 관련 작업을 찾아볼 수 있습니다. 팬클럽 작업란에서는 좋아요, 댓글, 공유, 전달 등 다양한 종류의 작업을 확인할 수 있습니다. 각 작업에는 해당 보상과 요구 사항이 있습니다. 일반적으로 작업을 완료하면 일정량의 금화나 경험치를 받게 됩니다.

Windows 11에서 작업 관리자 프로세스 업데이트를 중지하고 작업을 더 쉽게 종료하는 방법 Windows 11에서 작업 관리자 프로세스 업데이트를 중지하고 작업을 더 쉽게 종료하는 방법 Aug 20, 2023 am 11:05 AM

Windows 11 및 Windows 10에서 작업 관리자 프로세스 업데이트를 일시 중지하는 방법 CTRL+창 키+Delete를 눌러 작업 관리자를 엽니다. 기본적으로 작업 관리자는 프로세스 창을 엽니다. 여기에서 볼 수 있듯이 모든 앱은 끝없이 돌아다니기 때문에 선택하려고 할 때 아래로 가리키는 것이 어려울 수 있습니다. 따라서 CTRL을 길게 누르면 작업 관리자가 일시 중지됩니다. 여전히 앱을 선택하고 아래로 스크롤할 수도 있지만 항상 CTRL 버튼을 누르고 있어야 합니다.

자율주행의 최초 순수 시각적 정적 재구성 자율주행의 최초 순수 시각적 정적 재구성 Jun 02, 2024 pm 03:24 PM

순수한 시각적 주석 솔루션은 주로 비전과 동적 주석을 위한 GPS, IMU 및 휠 속도 센서의 일부 데이터를 사용합니다. 물론 대량 생산 시나리오의 경우 순수 비전일 필요는 없습니다. 일부 대량 생산 차량에는 고체 레이더(AT128)와 같은 센서가 장착됩니다. 대량 생산 관점에서 데이터 폐쇄 루프를 만들고 이러한 센서를 모두 사용하면 동적 개체에 라벨을 붙이는 문제를 효과적으로 해결할 수 있습니다. 그러나 우리 계획에는 고체 레이더가 없습니다. 따라서 가장 일반적인 대량 생산 라벨링 솔루션을 소개하겠습니다. 순수한 시각적 주석 솔루션의 핵심은 고정밀 포즈 재구성에 있습니다. 재구성 정확도를 보장하기 위해 SFM(Structure from Motion)의 포즈 재구성 방식을 사용합니다. 하지만 통과

See all articles