목차
Method
실험 및 결과
기술 주변기기 일체 포함 언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

Apr 08, 2023 am 11:11 AM
도구 모델

자연어 처리 작업에서 대규모 언어 모델은 제로샷 및 퓨샷 학습에서 인상적인 결과를 달성했습니다. 그러나 모든 모델에는 추가 확장을 통해 부분적으로만 해결될 수 있는 본질적인 한계가 있습니다. 구체적으로 모델의 한계로는 최신 정보에 접근할 수 없다는 점, 사실에 대한 '정보 환각', 저자원 언어 이해의 어려움, 정확한 계산을 위한 수학적 능력 부족 등이 있습니다.

이러한 문제를 해결하는 간단한 방법은 모델에 검색 엔진, 계산기 또는 달력과 같은 외부 도구를 장착하는 것입니다. 그러나 기존 방법은 종종 광범위한 수동 주석에 의존하거나 도구 사용을 특정 작업 설정으로 제한하여 외부 도구와 결합된 언어 모델의 사용을 일반화하기 어렵게 만듭니다.

이 병목 현상을 해결하기 위해 Meta AI는 최근 언어 모델이 다양한 외부 도구를 "사용"하는 방법을 학습할 수 있는 Toolformer라는 새로운 방법을 제안했습니다.

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

논문 주소: https://arxiv.org/pdf/2302.04761v1.pdf

Toolformer는 곧 큰 주목을 받았고, 이 논문이 문제를 해결했다고 생각하는 사람들도 있습니다. 현재 대규모 언어 모델에는 많은 문제가 있으며 그는 "이것은 최근 몇 주 동안 가장 중요한 논문입니다."라고 칭찬했습니다.

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

누군가는 Toolformer가 자기 지도 학습을 사용하여 대규모 언어 모델이 몇 개의 샘플만으로 일부 API 및 도구를 사용하는 방법을 학습할 수 있다는 점을 지적했습니다. 이는 매우 유연하고 효율적입니다.

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

어떤 사람들은 Toolformer가 우리를 인공일반지능(AGI)에 한발 더 가까이 다가갈 것이라고 생각하기도 합니다.

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

Toolformer는 다음과 같은 실질적인 요구 사항을 충족하기 때문에 매우 높은 평가를 받았습니다.

  • 대규모 언어 모델은 자체 감독 방식으로 도구 사용법을 배워야 하며 광범위한 매뉴얼이 필요하지 않습니다. 주석. 사람이 주석을 추가하는 데 드는 비용이 높기 때문에 이는 매우 중요합니다. 그러나 더 중요한 것은 사람이 유용하다고 생각하는 것과 모델이 유용하다고 생각하는 것이 다를 수 있다는 것입니다.
  • 언어 모델에는 특정 작업에 국한되지 않는 도구의 보다 포괄적인 사용이 필요합니다.

이것은 위에서 언급한 병목 현상을 분명히 해결합니다. Toolformer의 방법과 실험 결과를 자세히 살펴보겠습니다.

Method

Toolformer는 다음과 같은 기능을 갖춘 대규모 언어 모델을 기반으로 처음부터 데이터 세트를 생성한다는 아이디어(Schick and Schütze, 2021b; Honovich et al., 2022; Wang et al., 2022)를 기반으로 합니다. 컨텍스트 학습(ICL): API를 사용하는 인간의 샘플이 몇 개만 주어지면 LM이 잠재적인 API 호출로 거대한 언어 모델링 데이터세트에 주석을 달도록 한 다음 자체 감독 손실 함수를 사용하여 실제로 모델 예측에 도움이 되는 API 호출을 결정할 수 있습니다. 향후 토큰, 그리고 마지막으로 LM 자체에 유용한 API 호출을 기반으로 미세 조정합니다.

Toolformer는 사용된 데이터 세트에 구애받지 않기 때문에 모델이 사전 훈련된 것과 정확히 동일한 데이터 세트에 사용할 수 있으므로 모델이 일반성과 언어 모델링 기능을 잃지 않습니다.

구체적으로 이 연구의 목표는 언어 모델 M에 API 호출을 통해 다양한 도구를 사용할 수 있는 기능을 제공하는 것입니다. 이를 위해서는 각 API의 입력 및 출력이 텍스트 시퀀스로 특성화될 수 있어야 합니다. 이를 통해 각 호출의 시작과 끝을 표시하는 데 사용되는 특수 토큰을 사용하여 API 호출을 특정 텍스트에 원활하게 삽입할 수 있습니다.

이 연구는 각 API 호출을 튜플로 표현합니다

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

, 여기서 a_c는 API의 이름이고 i_c는 해당 입력입니다. 해당 결과 r이 있는 API 호출 c가 주어지면 이 연구는 결과를 제외하고 포함하는 선형화된 API 호출 순서를

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

여기서, , 및 "→"로 표현합니다. . 아래 그림 1에서 볼 수 있듯이 이 접근 방식을 통해 LM은 다양한 도구를 제어하는 ​​방법을 배우고 어떤 도구를 언제, 어떻게 사용할지 스스로 선택할 수 있습니다.

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

데이터세트

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

가 주어지면 연구에서는 먼저 API 호출을 추가하여 이 데이터세트를 데이터세트 C*로 변환했습니다. 이는 아래 그림 2에 표시된 것처럼 세 단계로 수행됩니다. 먼저 연구에서는 M의 상황 내 학습 기능을 활용하여 다수의 잠재적 API 호출을 샘플링한 다음 이러한 API 호출을 실행하고 얻은 응답이 예측에 도움이 되는지 확인합니다. 필터링 기준으로 사용될 미래 토큰입니다. 필터링 후 연구에서는 API 호출을 다른 도구에 병합하여 궁극적으로 데이터 세트 C*를 생성하고 이 데이터 세트에서 M 자체를 미세 조정합니다.

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

실험 및 결과

이 연구에서는 다양한 다운스트림 작업에 대한 실험을 수행했으며 결과는 다음과 같습니다. 사전 학습된 6.7B 매개변수를 기반으로 Toolformer(다양한 API 사용 방법 학습) GPT-J 모델 및 도구)는 다양한 작업에서 더 큰 GPT-3 모델 및 기타 여러 기준보다 훨씬 뛰어난 성능을 발휘합니다.

이 연구에서는 LAMA 벤치마크의 SQuAD, GoogleRE 및 T-REx 하위 집합에 대한 여러 모델을 평가했으며 실험 결과는 아래 표 3에 나와 있습니다.

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

Toolformer Inference의 수학을 테스트하려면 기능, 본 연구에서는 ASDiv, SVAMP 및 MAWPS 벤치마크에 대한 실험을 수행했습니다. 실험에 따르면 Toolformer는 대부분의 경우 계산기 도구를 사용하며 이는 OPT(66B) 및 GPT-3(175B)보다 훨씬 뛰어납니다.

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

질문 응답 측면에서 본 연구는 웹 질문, 자연 질문 및 TriviaQA의 세 가지 질의 응답 데이터 세트에 대한 실험을 수행했습니다. Toolformer는 동일한 크기의 기본 모델보다 성능이 크게 뛰어나지만 GPT-3(175B)보다 열등합니다.

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

언어 간 작업 측면에서 본 연구에서는 Toolformer와 MLQA의 모든 기본 모델을 비교했으며 그 결과는 아래 표 6과 같습니다.

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

달력 API 연구 유용성을 입증하기 위해 이 연구에서는 TEMPLAMA에 대한 여러 모델과 DATESET이라는 새로운 데이터 세트를 실험합니다. Toolformer는 모든 기준보다 성능이 뛰어나지만 TEMPLAMA 달력 도구를 사용하지 않습니다.

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

다양한 다운스트림 작업의 성능 향상을 검증하는 것 외에도, 본 연구에서는 API 호출의 미세 조정으로 인해 Toolformer의 언어 모델링 성능이 저하되지 않는지 확인하기를 희망합니다. 이를 위해 본 연구에서는 두 가지 언어 모델링 데이터셋을 대상으로 실험을 수행하여 평가하였으며, 모델의 Perplexity는 아래 표 8과 같다.

API 호출이 없는 언어 모델링의 경우 API 호출을 추가하는 데 비용이 들지 않습니다.

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

마지막으로 연구자들은 언어 모델의 규모가 커짐에 따라 외부 도구의 도움을 구하는 기능이 모델 성능에 미치는 영향을 분석했습니다. 분석 결과는 아래 그림 4에 나와 있습니다

언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer

관심 있는 독자는 원본 논문을 읽고 더 많은 연구 세부 사항을 알아볼 수 있습니다.

위 내용은 언어 모델이 자체적으로 검색 엔진을 사용하는 방법을 배웠습니까? Meta AI가 제안하는 API 호출 자기지도 학습 방법 Toolformer의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

H5 페이지 생산에는 지속적인 유지 보수가 필요합니까? H5 페이지 생산에는 지속적인 유지 보수가 필요합니까? Apr 05, 2025 pm 11:27 PM

코드 취약점, 브라우저 호환성, 성능 최적화, 보안 업데이트 및 사용자 경험 개선과 같은 요소로 인해 H5 페이지를 지속적으로 유지해야합니다. 효과적인 유지 관리 방법에는 완전한 테스트 시스템 설정, 버전 제어 도구 사용, 페이지 성능을 정기적으로 모니터링하고 사용자 피드백 수집 및 유지 관리 계획을 수립하는 것이 포함됩니다.

플렉스 레이아웃의 자주색 슬래시 영역이 잘못된 '오버플로 공간'으로 간주되는 이유는 무엇입니까? 플렉스 레이아웃의 자주색 슬래시 영역이 잘못된 '오버플로 공간'으로 간주되는 이유는 무엇입니까? Apr 05, 2025 pm 05:51 PM

플렉스 레이아웃의 보라색 슬래시 영역에 대한 질문 플렉스 레이아웃을 사용할 때 개발자 도구 (d ...)와 같은 혼란스러운 현상이 발생할 수 있습니다.

부정적인 마진이 어떤 경우에는 적용되지 않는 이유는 무엇입니까? 이 문제를 해결하는 방법? 부정적인 마진이 어떤 경우에는 적용되지 않는 이유는 무엇입니까? 이 문제를 해결하는 방법? Apr 05, 2025 pm 10:18 PM

어떤 경우에는 부정적인 마진이 적용되지 않는 이유는 무엇입니까? 프로그래밍 중에 CSS의 부정적인 마진 (음수 ...

58.com 작업 페이지에서 실시간 응용 프로그램 및 뷰어 데이터를 얻는 방법은 무엇입니까? 58.com 작업 페이지에서 실시간 응용 프로그램 및 뷰어 데이터를 얻는 방법은 무엇입니까? Apr 05, 2025 am 08:06 AM

크롤링하는 동안 58.com 작업 페이지의 동적 데이터를 얻는 방법은 무엇입니까? Crawler 도구를 사용하여 58.com의 작업 페이지를 크롤링 할 때는이 문제가 발생할 수 있습니다.

어떤 경우에는 부정적인 마진이 적용되지 않는 이유는 무엇입니까? 어떤 경우에는 부정적인 마진이 적용되지 않는 이유는 무엇입니까? Apr 05, 2025 pm 04:09 PM

어떤 경우에는 부정적인 마진이 적용되지 않는 이유는 무엇입니까? CSS를 사용하여 레이아웃 웹 페이지를 사용하는 경우 종종 부정적인 여백이 발생합니다 (음수 ...

Safari의 로컬 웹 페이지에서 맞춤형 스타일 시트가 적용되지만 Baidu 페이지에서는 그렇지 않은 이유는 무엇입니까? Safari의 로컬 웹 페이지에서 맞춤형 스타일 시트가 적용되지만 Baidu 페이지에서는 그렇지 않은 이유는 무엇입니까? Apr 05, 2025 pm 05:15 PM

Safari에서 사용자 정의 스타일 시트 사용에 대한 토론 오늘 우리는 Safari 브라우저에 대한 사용자 정의 스타일 시트 적용에 대한 질문에 대해 논의 할 것입니다. 프론트 엔드 초보자 ...

CSS를 사용하여 다양한 오목 효과를 효율적으로 달성하는 방법은 무엇입니까? CSS를 사용하여 다양한 오목 효과를 효율적으로 달성하는 방법은 무엇입니까? Apr 05, 2025 pm 02:18 PM

CSS에서 오목한 효과를 달성하는 여러 가지 방법이 많은 개발자들이 웹 페이지에서 오목한 효과를 달성해야 할 필요성을 만났습니다. 최근 포럼에서 언급 한 개발자 ...

CSS의 클립 경로 속성을 사용하여 복잡한 카드 스타일을 만드는 방법은 무엇입니까? CSS의 클립 경로 속성을 사용하여 복잡한 카드 스타일을 만드는 방법은 무엇입니까? Apr 05, 2025 pm 11:09 PM

CSS를 사용하여 복잡한 카드 스타일을 만드는 방법은 무엇입니까? 매일 웹 디자인에서 카드 스타일은 일반적이고 중요한 레이아웃 방법입니다. 오늘 우리는 설명하고 싶습니다 ...

See all articles