매개 변수가 약간 개선되고 성능 지수가 폭발합니다! 구글: 대규모 언어 모델은 '신비한 기술'을 숨긴다
훈련받지 않은 일을 할 수 있기 때문에 대규모 언어 모델은 일종의 마법을 갖고 있는 것처럼 보이며 따라서 언론과 연구자들로부터 과대광고와 관심의 초점이 되었습니다.
대형 언어 모델을 확장할 때 작은 모델에서는 사용할 수 없는 몇 가지 새로운 기능이 가끔 등장합니다. "창의성"과 유사한 이러한 속성을 "창발" 기능이라고 하며, 이는 일반 인공 지능을 향한 한 단계를 나타냅니다.
현재 Google, Stanford, Deepmind 및 North Carolina 대학의 연구원들은 대규모 언어 모델에서 "신발" 능력을 탐구하고 있습니다.
Decoder 프롬프트 DALL-E
마법의 "창발" 능력
NLP(자연어 처리)는 대량의 텍스트 데이터에 대해 훈련된 언어 모델에 의해 혁명을 일으켰습니다. 언어 모델을 확장하면 다양한 다운스트림 NLP 작업에서 성능과 샘플 효율성이 향상되는 경우가 많습니다.
많은 경우 작은 모델의 성능 추세를 추론하여 대규모 언어 모델의 성능을 예측할 수 있습니다. 예를 들어, 언어 모델의 복잡성에 대한 규모의 영향은 7차수 이상에서 입증되었습니다.
그러나 일부 다른 작업의 성능은 예측 가능한 방식으로 향상되지 않았습니다.
예를 들어, GPT-3 논문에서는 여러 자리 덧셈을 수행하는 언어 모델의 능력이 100M에서 13B 매개변수의 모델에 대해 평평한 스케일링 곡선을 가지고 있음을 보여줍니다. 이는 대략 무작위이지만 노드에서 성능 점프를 유발합니다. .
NLP 연구에서 언어 모델의 사용이 증가함에 따라 예기치 않게 발생할 수 있는 이러한 기능을 더 잘 이해하는 것이 중요합니다.
Machine Learning Research(TMLR)에 최근 발표된 "Emergent Power of Large Language Models" 논문에서 연구자들은 확장 언어 모델이 생성하는 "창발" 능력의 수십 가지 예를 보여주었습니다.
이 "신생" 기능의 존재는 추가 확장이 언어 모델 기능의 범위를 더욱 확장할 수 있는지에 대한 의문을 제기합니다.
특정한 힌트와 미세 조정 방법은 더 큰 모델에서만 개선을 가져올 수 있습니다.
"긴급" 프롬프트 작업
먼저 프롬프트 작업 능력에서 발생할 수 있는 "창출"에 대해 논의합니다.
이러한 유형의 작업에서는 사전 훈련된 언어 모델이 다음 단어 예측 작업을 수행하도록 유도되고 응답을 완료하여 작업을 수행합니다.
추가 미세 조정 없이도 언어 모델은 훈련 중에 볼 수 없는 작업을 수행할 수 있는 경우가 많습니다.
작업이 특정 규모 임계값에서 무작위 성능에서 무작위 성능 이상으로 예기치 않게 급등하는 경우 이를 "긴급" 작업이라고 부릅니다.
아래에서는 다단계 산술, 대학 수준 시험 응시, 단어의 의도된 의미 파악 등 "긴급" 성능을 갖춘 프롬프트 작업의 세 가지 예를 보여줍니다.
각 경우에 언어 모델은 성능이 급상승하는 특정 임계값에 도달할 때까지 모델 크기에 거의 의존하지 않고 성능이 좋지 않습니다.
충분한 규모의 모델의 경우 이러한 작업에 대한 성능은 무작위가 아닙니다. 예를 들어 산술 및 다중 작업 NLU 작업은 10^22를 초과하는 FLOP(초당 부동 소수점 연산)로 학습하고, 컨텍스트 학습 FLOP 작업에 포함된 단어 중 10의 24승을 초과하는 단어입니다.
"긴급" 프롬프트 전략
두 번째 유형의 "긴급" 기능에는 언어 모델 기능을 향상시키는 프롬프트 전략이 포함됩니다.
프롬프트 전략은 다양한 작업에 적용할 수 있는 광범위한 프롬프트 패러다임입니다. 작은 모델에 실패하면 "긴급"으로 간주되며 충분히 큰 모델에서만 사용할 수 있습니다.
사고 연쇄 프롬프트는 프롬프트 모델이 최종 답변을 제공하기 전에 일련의 중간 단계를 생성하는 "긴급" 프롬프트 전략의 전형적인 예입니다.
사고 체인 프롬프트를 사용하면 언어 모델이 다단계 수학 단어 문제와 같은 복잡한 추론이 필요한 작업을 수행할 수 있습니다.
모델이 명시적인 훈련 없이도 사고 사슬 추론 능력을 습득할 수 있다는 점은 언급할 가치가 있습니다. 아래 그림은 사고 사슬 프롬프트의 예를 보여줍니다.
사고 연쇄 프롬프트의 실증 결과는 다음과 같습니다.
소형 모델의 경우 Thought Chain 프롬프트를 적용해도 까다로운 수학 단어 문제 벤치마크인 GSM8K에 적용할 때와 같이 표준 프롬프트보다 성능이 뛰어나지 않습니다.
그러나 대형 모델의 경우 Thought Chain 프롬프트는 GSM8K에서 57%의 해상도에 도달하여 테스트 성능이 크게 향상되었습니다.
"창발" 능력을 연구하는 의미
그렇다면 "창발" 능력을 연구하는 의미는 무엇일까요?
대규모 언어 모델에서 "신생" 기능을 식별하는 것은 이 현상과 미래 모델 기능에 대한 잠재적 영향을 이해하는 첫 번째 단계입니다.
예를 들어, "신생" 퓨샷 힌트 기능과 전략은 사전 훈련에서 명시적으로 인코딩되지 않기 때문에 연구자는 현재 언어 모델의 퓨샷 힌트 기능의 전체 범위를 알지 못할 수도 있습니다.
또한, 추가 확장이 잠재적으로 더 큰 모델에 "신생" 기능을 제공할지 여부에 대한 질문도 매우 중요합니다.
- "긴급" 능력은 왜 나타나는 걸까요?
- 특정 기능이 등장하면 언어 모델의 새로운 실제 응용 프로그램이 잠금 해제됩니까?
- 컴퓨팅 리소스는 비싸기 때문에 확장성을 높이지 않고(예: 더 나은 모델 아키텍처 또는 훈련 기술) 다른 방법을 통해 새로운 기능을 잠금 해제할 수 있습니까?
연구원들은 이러한 문제가 아직 알려지지 않았다고 말합니다.
그러나 NLP 분야가 계속 발전함에 따라 스케일링으로 생성되는 "창발" 기능을 포함하여 언어 모델의 동작을 분석하고 이해하는 것이 매우 중요합니다.
위 내용은 매개 변수가 약간 개선되고 성능 지수가 폭발합니다! 구글: 대규모 언어 모델은 '신비한 기술'을 숨긴다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











DeepSeek은 강력한 정보 검색 도구입니다.이 장점은 정보가 느리고 결과 프레젠테이션 방법이 간단하며 데이터베이스 적용 범위는 제한되어 있다는 것입니다 .

DeepSeek은 특정 데이터베이스 나 시스템에서만 더 빠르고 정확한 독점 검색 엔진입니다. 이를 사용할 때 사용자는 문서를 읽고, 다양한 검색 전략을 시도하고, 사용자 경험에 대한 도움을 요청하고 사용자 경험에 대한 피드백을 최대한 활용하는 것이 좋습니다.

이 기사에서는 GATE.IO (GATE.IO) 웹 버전의 등록 프로세스와 GATE 트레이딩 앱의 등록 프로세스를 소개합니다. 웹 등록 또는 앱 등록이든, 공식 웹 사이트 또는 App Store를 방문하여 Genuine 앱을 다운로드 한 다음 사용자 이름, 암호, 이메일, 휴대 전화 번호 및 기타 정보, 완전한 이메일 또는 휴대 전화 확인을 작성해야합니다.

Bybit Exchange 링크를 직접 다운로드하고 설치할 수없는 이유는 무엇입니까? Bybit은 사용자에게 거래 서비스를 제공하는 암호 화폐 거래소입니다. Exchange의 모바일 앱은 다음과 같은 이유로 AppStore 또는 GooglePlay를 통해 직접 다운로드 할 수 없습니다. 1. App Store Policy는 Apple과 Google이 App Store에서 허용되는 응용 프로그램 유형에 대한 엄격한 요구 사항을 갖지 않도록 제한합니다. Cryptocurrency Exchange 응용 프로그램은 금융 서비스가 포함되며 특정 규정 및 보안 표준이 필요하기 때문에 이러한 요구 사항을 충족하지 않습니다. 2. 법률 및 규정 준수 준수 많은 국가에서 암호 화폐 거래와 관련된 활동이 규제되거나 제한됩니다. 이러한 규정을 준수하기 위해 BYBIT 응용 프로그램은 공식 웹 사이트 또는 기타 공인 채널을 통해서만 사용할 수 있습니다.

앱을 다운로드하고 계정의 안전을 보장하기 위해 공식 채널을 선택하는 것이 중요합니다.

로그인 단계 및 암호 복구 프로세스를 포함하여 참깨 오픈 exchange 웹 버전의 로그인 작업에 대한 자세한 소개는 로그인 실패, 페이지를 열 수 없으며 플랫폼에 부드럽게 로그인 할 수없는 일반적인 문제에 대한 솔루션을 제공합니다.

이 기사에서는 Binance, OKX, Gate.io, Bitflyer, Kucoin, Bybit, Coinbase Pro, Kraken, Bydfi 및 Xbit DencentRalized Exchanges를 포함하여주의를 기울여야 할 상위 10 개의 Cryptocurrency 거래 플랫폼을 권장합니다. 이 플랫폼은 거래 통화 수량, 거래 유형, 보안, 규정 준수 및 특수 기능 측면에서 고유 한 이점이 있습니다. 예를 들어 Binance는 전 세계 최대의 거래량과 풍부한 기능으로 유명합니다. 적절한 플랫폼을 선택하려면 자체 거래 경험, 위험 허용 범위 및 투자 선호도를 기반으로 포괄적 인 고려 사항이 필요합니다. 이 기사가 자신에게 가장 적합한 것을 찾는 데 도움이되기를 바랍니다.

Binance 웹 사이트 로그인 포털의 최신 버전에 액세스하려면 다음을 수행하십시오. 공식 웹 사이트로 이동하여 오른쪽 상단의 "로그인"버튼을 클릭하십시오. 기존 로그인 방법을 선택하십시오. 새 사용자 인 경우 "등록하십시오. 등록 된 휴대폰 번호 또는 이메일 및 비밀번호를 입력하고 완전한 인증 (예 : 모바일 확인 코드 또는 Google 인증 자). 성공적인 확인 후 Binance 공식 웹 사이트 로그인 포털의 최신 버전에 액세스 할 수 있습니다.
