ChatGPT가 데이터 주석 산업을 죽일 것인가? 인간보다 20배 저렴하고 정확하다
의외로 AI가 진화한 후 가장 먼저 제거되는 사람들은 AI 훈련을 돕는 사람들입니다.
많은 NLP 애플리케이션에서는 특히 분류자를 교육하거나 감독되지 않은 모델의 성능을 평가하는 등 다양한 작업을 위해 대량의 데이터에 수동으로 주석을 추가해야 합니다. 규모와 복잡성에 따라 이러한 작업은 MTurk와 같은 플랫폼의 크라우드소싱 작업자와 연구 보조원과 같은 훈련된 주석자가 수행할 수 있습니다.
우리는 LLM(대형 언어 모델)이 특정 규모에 도달한 후 "출현"할 수 있다는 것을 알고 있습니다. 즉, 이전에는 예측할 수 없었던 새로운 기능을 획득할 수 있습니다. AI의 새로운 확산을 촉진하는 대규모 모델인 ChatGPT의 기능은 데이터 세트 라벨링 및 교육을 포함하여 많은 작업에서 사람들의 기대를 뛰어넘었습니다.
최근 취리히 대학의 연구원들은 ChatGPT가 관련성, 자세, 주제 및 프레임 감지를 포함한 다양한 주석 작업에서 크라우드소싱 작업 플랫폼과 인간 작업 보조자보다 뛰어난 성능을 발휘한다는 사실을 입증했습니다.
또한 연구원들은 계산을 수행했습니다. ChatGPT 비용은 주석당 $0.003 미만으로 MTurk보다 약 20배 저렴합니다. 이러한 결과는 텍스트 분류의 효율성을 크게 향상시킬 수 있는 대규모 언어 모델의 잠재력을 보여줍니다.
문서 링크:https://arxiv.org/abs/2303.15056
세부 정보 검색
많은 NLP 애플리케이션에는 특히 분류 프로세서 훈련이나 평가를 위해 주석이 달린 고품질 데이터가 필요합니다. 비지도 모델의 성능. 예를 들어, 연구자들은 때때로 관련성을 위해 시끄러운 소셜 미디어 데이터를 필터링하고, 텍스트를 다른 주제나 개념 범주에 할당하거나, 감정적 입장을 측정해야 합니다. 이러한 작업에 사용되는 특정 방법(지도, 준지도 또는 비지도 학습)에 관계없이 훈련 세트를 구축하거나 성능을 평가하기 위한 최적의 표준으로 사용하려면 정확하게 레이블이 지정된 데이터가 필요합니다.
사람들이 이를 처리하는 일반적인 방법은 연구 보조원을 모집하거나 MTurk와 같은 크라우드소싱 플랫폼을 사용하는 것입니다. OpenAI는 ChatGPT를 구축할 때 부정적인 내용의 문제도 케냐의 데이터 주석 기관에 하청 계약하고 정식 출시되기 전에 많은 주석 훈련을 실시했습니다.
스위스 취리히 대학교에서 제출한 이 보고서는 2022년 11월에 출시된 ChatGPT를 중심으로 텍스트 주석 작업에서 LLM(대형 언어 모델)의 잠재력을 탐구합니다. 이는 제로샷(즉, 추가 교육 없이) ChatGPT가 수동 노동 비용의 10분의 1에 불과한 비용으로 분류 작업에 대한 MTurk 주석보다 뛰어난 성능을 발휘한다는 것을 증명합니다.
연구원들은 이전 연구에서 수집된 2,382개의 트윗 샘플을 사용했습니다. 트윗에는 관련성, 입장, 주제, 2프레임 감지라는 5가지 작업에 대해 훈련된 주석 작성자(연구 보조자)가 라벨을 지정했습니다. 실험에서 연구원들은 제로샷 분류로 ChatGPT에 작업을 제출하고 동시에 MTurk의 크라우드 소싱 작업자에게 작업을 제출한 다음 두 가지 벤치마크를 기반으로 ChatGPT의 성능을 평가했습니다. 연구 보조 주석자와 관련된 정확도.
작업 5개 중 4개에서 ChatGPT의 제로 샘플 정확도가 MTurk보다 높은 것으로 나타났습니다. 모든 작업에 대해 ChatGPT의 인코더 계약은 MTurk 및 훈련된 주석자의 계약보다 뛰어납니다. 또한 비용 측면에서 ChatGPT는 MTurk보다 훨씬 저렴합니다. 5가지 분류 작업 비용은 ChatGPT(주석 25264개)에서 약 $68, MTurk(주석 12632개)에서 약 $657입니다.
따라서 ChatGPT의 주석당 비용은 약 $0.003, 즉 1/3센트입니다. MTurk보다 약 20배 저렴하고 품질도 더 좋습니다. 이를 고려하면 이제 더 많은 샘플에 주석을 달거나 지도 학습을 위한 대규모 훈련 세트를 생성하는 것이 가능합니다. 기존 테스트에 따르면 100,000개의 주석 비용은 약 $300입니다.
ChatGPT 및 기타 LLM이 더 넓은 맥락에서 어떻게 작동하는지 더 잘 이해하려면 추가 연구가 필요하지만, 이러한 결과는 연구원들이 데이터에 주석을 추가하고 MTurk를 방해하는 방식을 바꿀 수 있는 잠재력이 있음을 시사한다고 연구원들은 말합니다. 다른 플랫폼의 일부 비즈니스 모델 .
실험 절차
연구원들은 콘텐츠 조정 관련 작업에 대한 이전 연구에서 수동으로 주석을 추가한 2382개의 트윗 데이터세트를 사용했습니다. 특히, 숙련된 주석자(연구 보조자)는 다양한 범주 수를 가진 5가지 개념 범주에 대한 최적의 표준을 구축했습니다. 230조에 관한 콘텐츠 조정 질문에 대한 트윗의 관련성(1996년 미국 통신 품위법의 일부로서의 지위) , 미국 인터넷 법률의 핵심 부분, 주제 식별(6개 범주), 그룹 1 프레임워크(문제, 솔루션 또는 중립으로서의 콘텐츠 조정) 및 섹션 1 두 가지 프레임워크 세트(14개 범주)
그런 다음 연구원들은 ChatGPT와 MTurk에서 모집된 크라우드소싱 근로자를 사용하여 정확히 동일한 분류를 수행했습니다. ChatGPT에 대해 4세트의 주석이 작성되었습니다. 출력의 무작위성 정도를 제어하는 ChatGPT 온도 매개변수의 영향을 탐색하기 위해 여기에는 덜 무작위성을 의미하는 기본값인 1과 0.2가 주석으로 표시되어 있습니다. 각 온도 값에 대해 연구원들은 ChatGPT의 인코더 일치를 계산하기 위해 두 세트의 주석을 수행했습니다.
전문가의 경우, 이 연구에서는 두 명의 정치학 대학원생이 다섯 가지 작업 모두에 대해 트윗에 주석을 달고 있는 것을 발견했습니다. 각 작업에 대해 코더에게는 동일한 지침 세트가 제공되었으며 작업별로 트윗에 독립적으로 주석을 달도록 요청 받았습니다. ChatGPT와 MTurk의 정확성을 계산하기 위해 비교에서는 두 훈련된 주석자가 모두 동의한 트윗만 고려했습니다.
MTurk의 경우 연구 목표는 특히 Amazon에서 "MTurk Masters"로 분류되고 90% 이상의 긍정적인 평가를 받았으며 미국에 거주하는 근로자를 선별하여 최고의 근로자 그룹을 선택하는 것입니다. .
이 연구에서는 ChatGPT API의 "gpt-3.5-turbo" 버전을 사용하여 트윗을 분류합니다. 주석은 2023년 3월 9일부터 3월 20일 사이에 진행되었습니다. 각 주석 작업에 대해 연구원들은 ChatGPT와 MTurk 크라우드 작업자 간의 비교 가능성을 보장하기 위해 의도적으로 "단계별로 생각해 봅시다"와 같은 ChatGPT 관련 프롬프트를 추가하지 않았습니다.
여러 변형을 테스트한 후 사람들은 다음과 같은 프롬프트를 사용하여 ChatGPT에 트윗을 하나씩 피드하기로 결정했습니다. "이것은 내가 선택한 트윗입니다. [작업별 지침(예: 설명)] 또한, 이 연구에서는 각 트윗에 대해 4개의 ChatGPT 응답이 수집되었으며, ChatGPT 결과가 주석 기록의 영향을 받지 않도록 각 트윗마다 새로운 채팅 세션도 생성되었습니다.
그림 1. MTurk의 높은 점수를 받은 주석 작성자와 비교한 ChatGPT 제로 샷 텍스트 주석 기능 ChatGPT의 정확도는 5개 작업 중 4개에서 MTurk보다 우수합니다.
ChatGPT가 장점을 갖는 4가지 작업 중 위 그림에서 한 가지 경우(관련성) ChatGPT는 약간의 이점이 있지만 다른 세 가지 경우(프레임 I, 프레임 II 및 Stance)에서는 성능이 MTurk와 매우 유사하며 ChatGPT는 MTurk보다 2.2~3.4배 더 나은 성능을 발휘합니다. 또한 작업의 난이도, 클래스 수 및 주석이 0샘플이라는 사실을 고려할 때 ChatGPT의 정확도는 일반적으로 두 가지 범주(관련/비관련)가 있는 상관 관계에 적합합니다. 정확도는 72.8%인 반면, 세 가지 범주(긍정적/부정적/중립)가 있는 경우 작업의 본질적인 난이도도 영향을 주지만 범주 수가 증가함에 따라 정확도는 78.7%입니다. 프로토콜에 따르면, 그림 1은 온도 매개변수가 0.2로 설정된 경우 모든 작업에 대한 성능이 95%를 초과하는 등 매우 높은 성능을 보여줍니다. 이 값은 훈련된 주석자를 포함하여 코더 간 일치 관계가 더 높습니다. 그리고 정확도는 기본 온도 값인 1을 사용하는 경우에도 양수입니다(더 많은 무작위성을 의미함). 그러나 이는 약합니다(Pearson의 상관 계수: 0.17). 상관 관계는 단 5개의 데이터 포인트를 기반으로 하지만 온도 값이 더 낮음을 나타냅니다. 정확도를 크게 줄이지 않고도 결과의 일관성을 향상시키는 것처럼 보이기 때문에 주석 작업에 더 적합할 수 있습니다. ChatGPT 테스트는 복잡한 주제이며 광범위한 리소스가 필요하다는 점을 강조해야 합니다. 연구자들은 특정 연구 목적을 위해 개념적 범주를 개발했습니다. 일부 작업에는 많은 범주가 포함되지만 ChatGPT는 여전히 높은 정확도를 달성합니다
.모델을 사용하여 데이터에 주석을 다는 것은 새로운 것이 아닙니다. 대규모 데이터 세트를 사용하는 컴퓨터 과학 연구에서 사람들은 소수의 샘플에 라벨을 붙인 다음 기계 학습을 통해 증폭시키는 경우가 많습니다. 그러나 인간을 능가한 후에는 향후 ChatGPT의 판단을 더 신뢰할 수 있을 수도 있습니다.
위 내용은 ChatGPT가 데이터 주석 산업을 죽일 것인가? 인간보다 20배 저렴하고 정확하다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











CentOS 종료 명령은 종료이며 구문은 종료 [옵션] 시간 [정보]입니다. 옵션은 다음과 같습니다. -H 시스템 중지 즉시 옵션; -P 종료 후 전원을 끕니다. -R 다시 시작; -대기 시간. 시간은 즉시 (현재), 분 (분) 또는 특정 시간 (HH : MM)으로 지정할 수 있습니다. 추가 정보는 시스템 메시지에 표시 될 수 있습니다.

CentOS 시스템 하에서 Gitlab의 백업 및 복구 정책 데이터 보안 및 복구 가능성을 보장하기 위해 CentOS의 Gitlab은 다양한 백업 방법을 제공합니다. 이 기사는 완전한 GITLAB 백업 및 복구 전략을 설정하는 데 도움이되는 몇 가지 일반적인 백업 방법, 구성 매개 변수 및 복구 프로세스를 자세히 소개합니다. 1. 수동 백업 gitlab-rakegitlab : 백업 : 명령을 작성하여 수동 백업을 실행하십시오. 이 명령은 gitlab 저장소, 데이터베이스, 사용자, 사용자 그룹, 키 및 권한과 같은 주요 정보를 백업합니다. 기본 백업 파일은/var/opt/gitlab/backups 디렉토리에 저장됩니다. /etc /gitlab을 수정할 수 있습니다

CentOS 시스템에서 HDFS 구성 확인에 대한 완전한 안내서이 기사에서는 CentOS 시스템에서 HDF의 구성 및 실행 상태를 효과적으로 확인하는 방법을 안내합니다. 다음 단계는 HDF의 설정 및 작동을 완전히 이해하는 데 도움이됩니다. Hadoop 환경 변수 확인 : 먼저 Hadoop 환경 변수가 올바르게 설정되어 있는지 확인하십시오. 터미널에서 다음 명령을 실행하여 Hadoop이 올바르게 설치되고 구성되었는지 확인하십시오. Hadoopversion Check HDFS 구성 파일 : HDFS의 Core 구성 파일은/etc/hadoop/conf/directory에 있으며 Core-Site.xml 및 HDFS-Site.xml이 중요합니다. 사용

CentOS에 대한 Zookeeper Performance Tuning은 하드웨어 구성, 운영 체제 최적화, 구성 매개 변수 조정, 모니터링 및 유지 관리 등 여러 측면에서 시작할 수 있습니다. 특정 튜닝 방법은 다음과 같습니다. SSD는 하드웨어 구성에 권장됩니다. Zookeeper의 데이터는 디스크에 작성되므로 SSD를 사용하여 I/O 성능을 향상시키는 것이 좋습니다. 충분한 메모리 : 자주 디스크 읽기 및 쓰기를 피하기 위해 충분한 메모리 리소스를 동물원에 충분한 메모리 자원을 할당하십시오. 멀티 코어 CPU : 멀티 코어 CPU를 사용하여 Zookeeper가이를 병렬로 처리 할 수 있도록하십시오.

CentOS 시스템에서 Pytorch GPU 가속도를 활성화하려면 Cuda, Cudnn 및 GPU 버전의 Pytorch를 설치해야합니다. 다음 단계는 프로세스를 안내합니다. CUDA 및 CUDNN 설치 CUDA 버전 호환성 결정 : NVIDIA-SMI 명령을 사용하여 NVIDIA 그래픽 카드에서 지원하는 CUDA 버전을보십시오. 예를 들어, MX450 그래픽 카드는 CUDA11.1 이상을 지원할 수 있습니다. Cudatoolkit 다운로드 및 설치 : NVIDIACUDATOOLKIT의 공식 웹 사이트를 방문하여 그래픽 카드에서 지원하는 가장 높은 CUDA 버전에 따라 해당 버전을 다운로드하여 설치하십시오. CUDNN 라이브러리 설치 :

Docker는 Linux 커널 기능을 사용하여 효율적이고 고립 된 응용 프로그램 실행 환경을 제공합니다. 작동 원리는 다음과 같습니다. 1. 거울은 읽기 전용 템플릿으로 사용되며, 여기에는 응용 프로그램을 실행하는 데 필요한 모든 것을 포함합니다. 2. Union 파일 시스템 (Unionfs)은 여러 파일 시스템을 스택하고 차이점 만 저장하고 공간을 절약하고 속도를 높입니다. 3. 데몬은 거울과 컨테이너를 관리하고 클라이언트는 상호 작용을 위해 사용합니다. 4. 네임 스페이스 및 CGroup은 컨테이너 격리 및 자원 제한을 구현합니다. 5. 다중 네트워크 모드는 컨테이너 상호 연결을 지원합니다. 이러한 핵심 개념을 이해 함으로써만 Docker를 더 잘 활용할 수 있습니다.

Centos에 MySQL을 설치하려면 다음 단계가 필요합니다. 적절한 MySQL Yum 소스 추가. mysql 서버를 설치하려면 yum install mysql-server 명령을 실행하십시오. mysql_secure_installation 명령을 사용하여 루트 사용자 비밀번호 설정과 같은 보안 설정을 작성하십시오. 필요에 따라 MySQL 구성 파일을 사용자 정의하십시오. MySQL 매개 변수를 조정하고 성능을 위해 데이터베이스를 최적화하십시오.

SSH 서비스를 다시 시작하라는 명령은 SystemCTL SSHD를 다시 시작합니다. 자세한 단계 : 1. 터미널에 액세스하고 서버에 연결; 2. 명령을 입력하십시오 : SystemCTL SSHD 재시작; 3. 서비스 상태를 확인하십시오 : SystemCTL 상태 SSHD.
