> 기술 주변기기 > 일체 포함 > Google, AI가 출력 정확도를 독립적으로 판단할 수 있는 모델 훈련 프레임워크인 ASPIRE 출시

Google, AI가 출력 정확도를 독립적으로 판단할 수 있는 모델 훈련 프레임워크인 ASPIRE 출시

王林
풀어 주다: 2024-01-23 17:36:10
앞으로
1169명이 탐색했습니다.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Google은 최근 대규모 언어 모델을 위해 특별히 설계된 ASPIRE 교육 프레임워크의 출시를 알리는 보도 자료를 발표했습니다. 이 프레임워크는 AI 모델의 선택적 예측 기능을 향상시키는 것을 목표로 합니다.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Google은 자연어 이해 및 콘텐츠 생성 분야에서 대규모 언어 모델이 빠르게 발전하고 있으며 다양한 혁신적인 애플리케이션을 구축하는 데 사용되었지만 위험도가 높은 의사 결정 상황에 적용하는 것은 여전히 ​​부적절하다고 언급했습니다. 이는 모델 예측의 "환각" 가능성과 불확실성 때문입니다. 따라서 Google은 일련의 모델에 "신뢰성" 메커니즘을 도입하는 ASPIRE 교육 프레임워크를 개발했습니다. 즉, 모델은 일련의 답변을 출력합니다. , 각각의 답변은 모두 정답일 확률 점수를 갖습니다 .

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

▲ 이미지 출처 Google 보도 자료(아래 동일)

기술적 수준에서 교육 프레임워크는 과제별 조정, 답변 샘플링, 자체 평가 학습의 세 단계로 나눌 수 있습니다.

"특정 작업 조정" 단계는 기본 훈련을 받은 대형 언어 모델을 심층적으로 훈련하는 단계로,

모델의 예측 역량 강화에 중점을 둡니다. 연구자들은 주로 모델에 일련의 조정 가능한 매개변수를 도입하고 특정 작업의 훈련 데이터 세트에 대해 사전 훈련된 언어 모델을 미세 조정함으로써 모델의 예측 성능을 향상시키고 모델이 특정 문제를 더 잘 해결할 수 있도록 합니다.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

두 번째 단계는 "답안 샘플링"입니다. 특정 미세 조정 후 모델은 이전에 학습된 조정 가능한 매개변수를 사용하여 각 교육 질문에 대해 서로 다른 답변을 생성하고 자체 평가 학습을 위한 데이터 세트를 생성할 수 있습니다. 신뢰성이 높은 일련의 답변.

또한 연구원들은 "Beam Search" 방법과 Rouge-L 알고리즘을 사용하여 답변의 품질을 평가하고 생성된 답변과 점수를 모델에 다시 입력하여 3단계를 시작했습니다.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

"자체 평가 학습"의 세 번째 단계에서 연구원들은 모델의 자체 평가 기능을 향상시키기 위해 특별히 모델에 조정 가능한 매개변수 세트를 추가했습니다.

이 단계의 목표는 모델이 "출력 답변의 정확성을 스스로 판단"하는 방법을 학습하여 대규모 언어 모델이 답변을 생성할 때 답변의 올바른 확률 점수도 첨부하는 것입니다.

Google 연구원들은 ASPIRE 훈련 프레임워크의 결과를 검증하기 위해 CoQA, TriviaQA 및 SQuAD라는 세 가지 질문 및 답변 데이터 세트를 사용했습니다. "ASPIRE로 조정된 OPT-2.7B 소형 모델은 더 큰 OPT- 30B 모델." 실험 결과는 또한 적절한 조정을 통해 작은 언어 모델이라도 일부 시나리오에서는 큰 언어 모델을 능가할 수 있음을 보여줍니다.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

연구원들은

ASPIRE 프레임워크 훈련이 대규모 언어 모델의 출력 정확도를 크게 향상시킬 수 있으며 심지어 더 작은 모델도 미세 조정 후 "정확하고 자신감 있는" 예측을 할 수 있다는 결론을 내렸습니다.

위 내용은 Google, AI가 출력 정확도를 독립적으로 판단할 수 있는 모델 훈련 프레임워크인 ASPIRE 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:51cto.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿