AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 '심호흡'이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

王林
풀어 주다: 2023-09-22 20:13:03
앞으로
758명이 탐색했습니다.

프롬프트 단어에 "심호흡"을 추가하면 AI 대형 모델의 수학 점수가 8.4점 더 높아집니다!

Google DeepMind 팀의 최근 발견은 모두가 이미 잘 알고 있는 "단계별로 생각하자"(단계적으로 생각하자)와 결합된 이 새로운 "주문"(심호흡을 하세요)을 사용한다는 것입니다. ), 대형 모델은 GSM8K 데이터로 세트 점수가 71.8점에서 80.2점으로 향상되었습니다.

그리고 이 가장 효과적인 프롬프트 단어는 AI 자체에 의해 발견되었습니다.

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

심호흡을 하면 냉각팬의 속도가 빨라진다는 농담도 있습니다

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

새로 고액 연봉을 받는 엔지니어도 일이 오래가지 못할 수 있으니 정신을 차려야 한다고 생각하는 사람도 있습니다. 장기

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

관련 논문"Large Language Model is an Optimizer"이 다시 한 번 센세이션을 일으켰습니다.

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

구체적으로 Big-Bench Hard 데이터 세트에서 빅 모델 자체가 디자인한 프롬프트 단어가 최대 50% 향상되었습니다.

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

어떤 사람들은 "모델마다 가장 좋은 프롬프트 단어가 다릅니다"에도 중점을 둡니다.

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

논문에서는 프롬프트 단어 디자인 작업뿐만 아니라 선형 회귀 및 여행하는 세일즈맨 문제와 같은 고전적인 최적화 작업에 대한 대형 모델의 능력도 테스트되었습니다.

모델마다 최적의 프롬프트 단어가 다릅니다

최적화 문제는 어디에나 있습니다. 도함수와 기울기를 기반으로 하는 알고리즘은 강력한 도구이지만 실제 응용 프로그램에서는 기울기를 적용할 수 없는 상황이 자주 발생합니다.

이 문제를 해결하기 위해 팀은 프롬프트 단어에 의한 최적화(Optimization by PROmpting)라는 새로운 방법 OPRO을 개발했습니다.

최적화 문제를 공식적으로 정의하고 프로그램으로 해결하는 대신 자연어를 통해 최적화 문제를 설명하고 새로운 솔루션을 생성하려면 대형 모델이 필요합니다.

그래프 흐름 요약은 대형 모델에 대한 재귀 호출입니다.

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

최적화의 각 단계에서 이전에 생성된 솔루션과 점수가 입력으로 사용되고, 대규모 모델은 새로운 솔루션과 점수를 생성한 후 다음 최적화 단계에서 사용할 프롬프트 단어에 추가합니다.

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

논문에서는 주로 Google의 PaLM 2과 Bard의 text-bison 버전을 평가 모델로 사용했습니다.

옵티마이저로는 GPT-3.5, GPT-4 등 4가지 모델을 사용하겠습니다

연구 결과 프롬프트 단어 스타일과 모델별로 디자인된 적용 가능한 프롬프트 단어 스타일도 서로 다른 것으로 나타났습니다

이전 최적의 프롬프트 단어에서 GPT 시리즈의 AI가 디자인한 것은 "정답을 얻을 수 있도록 단계별로 해결해 봅시다."

이 프롬프트 단어는 APE 방법을 사용하여 디자인되었으며, ICLR 2023에서 GPT-3(text-davinci-002)에서 인간이 설계한 버전보다 성능이 뛰어난 "단계별로 생각해보자"라는 논문이 발표되었습니다.

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

Google 기반 PaLM 2 및 Bard에서는 이번 벤치마크 테스트에서 APE 버전이 인간 버전보다 성능이 나빴습니다

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

OPRO 방식으로 디자인된 새로운 프롬프트 단어 중 " 심호흡하세요" "이 문제를 분해하세요" 가 PaLM에 가장 좋은 효과를 줍니다.

Bard 대형 모델의 텍스트-바이슨 버전의 경우 더 자세한 프롬프트 단어를 제공하는 경향이 더 큽니다

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

또한 이 논문은 수학적 최적화 프로그램에서 대형 모델의 잠재력을 보여줍니다

선형 회귀 지속적인 최적화 문제의 예입니다.

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

여행하는 외판원 문제를 이산 최적화 문제의 예로 들 수 있습니다.

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

힌트만 있으면 대규모 모델이 좋은 솔루션을 찾을 수 있으며 때로는 손으로 디자인한 휴리스틱과 일치하거나 초과할 수도 있습니다.

그러나 팀은 대형 모델이 아직 기존의 경사 기반 최적화 알고리즘을 대체할 수 없다고 믿습니다. 노드 수가 많은 순회 판매원 문제와 같이 문제 규모가 큰 경우 OPRO 방법의 성능은 이상적이지 않습니다.

팀에서는 향후 개선 방향에 대한 아이디어를 제시했습니다. 그들은 현재의 대형 모델이 오류 사례를 효과적으로 활용할 수 없으며 단순히 오류 사례를 제공하는 것만으로는 대형 모델이 오류의 원인을 포착할 수 없다고 믿습니다

오류 사례에 대한 보다 풍부한 피드백을 결합하고 높은 수준의 최적화 궤적을 요약하는 것이 유망한 방향입니다. 주요 기능 차이점 품질과 낮은 품질의 생성 단서 사이.

이 정보는 최적화 모델이 과거에 생성된 힌트를 더 효과적으로 개선하는 데 도움이 될 수 있으며 힌트 최적화에 필요한 샘플 수를 더욱 줄일 수 있습니다.

논문은 다수의 최적 힌트 단어를 공개합니다

논문은 Google과 DeepMind 부서가 합병되었지만 저자는 주로 Quoc Le, Zhou Dengyong을 포함하여 원래 Google Brain 팀 출신입니다.

저희는 코넬대학교 박사학위를 취득한 푸단 동문 Chengrun Yang과 UC Berkeley 박사학위를 취득한 Shanghai Jiao Tong University 동문 Chen Xinyan입니다.

팀은 또한 영화 추천, 영화 이름 스푸핑 등 실용적인 시나리오를 포함하여 실험에서 얻은 최고의 프롬프트 단어를 논문에 많이 제공했습니다. 필요하신 분들은 직접 참고하시면 됩니다

AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 심호흡이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!

논문주소 : https://arxiv.org/abs/2309.03409

위 내용은 AI가 프롬프트 단어를 독립적으로 설계한 Google DeepMind는 수학에서 '심호흡'이 대형 모델을 8포인트 증가시킬 수 있다는 사실을 발견했습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:51cto.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿