GPT-4는 DeepMind 훈련을 통해 정확도를 13.7% 향상시켜 더 나은 유도 및 추론 능력을 달성했습니다.
현재 LLM(대형 언어 모델)은 특히 예제와 중간 단계가 제공되는 경우 추론 작업에 대한 놀라운 기능을 보여줍니다. 그러나 프롬프트 방법은 대개 LLM의 암시적 지식에 의존하며, 암시적 지식이 틀리거나 작업과 일치하지 않는 경우 LLM이 잘못된 답변을 제공할 수 있습니다
현재 Google, Mila Institute 등에서 연구 기관들은 LLM이 추론 규칙을 학습할 수 있도록 하는 새로운 방법을 공동으로 탐구하고 HtT(가설-이론)라는 새로운 프레임워크를 제안했습니다. 이 새로운 방법은 다단계 추론을 향상시킬 뿐만 아니라 해석 가능성과 전달 가능성의 장점도 가지고 있습니다
논문 주소: https://arxiv.org/abs/2310.07064
에 따르면 수치추론과 관계추론 문제에 대한 결과는 HtT 방법이 기존 프롬프트 방법을 개선하고 정확도를 11~27% 증가시키는 것으로 나타났습니다. 동시에, 학습된 규칙은 동일한 문제의 다른 모델이나 다른 형태로 이전될 수도 있습니다
방법 소개
일반적으로 HtT 프레임워크에는 귀납적 단계와 연역적이라는 두 단계가 포함됩니다. 단계. 기존 기계 학습의 훈련 및 테스트와 유사합니다.
유도 단계에서 LLM은 먼저 훈련 예제에 대한 규칙 세트를 생성하고 확인해야 합니다. 본 연구에서는 CoT를 사용하여 규칙을 선언하고 답을 도출하고, 규칙의 빈도와 정확성을 평가하고, 자주 등장하여 정답으로 이어지는 규칙을 수집하고, 규칙 기반을 형성합니다
좋은 규칙 기반을 갖춘 다음 단계는 다음과 같습니다. 이 연구를 적용하려면 이러한 규칙이 문제를 해결합니다. 이를 위해 추론 단계에서 본 연구에서는 프롬프트에서 규칙 베이스를 추가하고 LLM이 규칙 베이스에서 규칙을 검색하여 추론을 수행하고 암묵적 추론을 명시적 추론으로 변환하도록 요구합니다.
그러나 연구 결과에 따르면 매우 강력한 LLM(예: GPT-4)이라도 모든 단계에서 올바른 규칙을 검색하는 데 어려움을 겪는 것으로 나타났습니다. 따라서 본 연구에서는 LLM의 컨텍스트 검색 기능을 향상시키기 위한 XML 마크업 기법을 개발합니다.
실험 결과
HtT를 평가하기 위해 본 연구에서는 두 가지 다단계 추론 문제를 벤치마킹합니다. 실험 결과는 HtT가 소수 샘플 프롬프트 방법을 개선한다는 것을 보여줍니다. 저자들은 또한 HtT에 대한 보다 포괄적인 이해를 제공하기 위해 광범위한 절제 연구를 수행했습니다.
수치적 추론과 관계형 추론 문제에 대한 새로운 방법을 평가합니다. 수치 추론에서 그들은 GPT-4의 정확도가 21.0% 향상되는 것을 관찰했습니다. 관계형 추론에서 GPT-4는 정확도가 13.7% 향상되었으며, GPT-3.5는 훨씬 더 많은 이점을 얻어 성능이 두 배 향상되었습니다. 성능 향상은 주로 규칙 환상의 감소에서 비롯됩니다.
구체적으로 아래 표 1은 산술의 16진수, 11진수, 9진수 데이터세트에 대한 결과를 보여줍니다. 모든 기본 시스템 중에서 0샷 CoT는 두 LLM 모두에서 최악의 성능을 나타냅니다.
표 2는 CLUTRR의 다양한 방법을 비교한 결과를 보여줍니다. 0-shot CoT는 GPT3.5와 GPT4에서 가장 나쁜 성능을 보이는 것을 볼 수 있습니다. 몇 번의 프롬프트 방법의 경우 CoT와 LtM은 유사하게 수행됩니다. 평균 정확도 측면에서 HtT는 두 모델의 힌트 방법보다 지속적으로 11.1~27.2% 더 우수합니다. GPT3.5는 CLUTRR 규칙을 검색하는 데 나쁘지 않으며 GPT4보다 HtT에서 더 많은 이점을 얻는다는 점은 주목할 가치가 있습니다. 아마도 산술보다 CLUTRR에 규칙이 적기 때문일 것입니다.
GPT4의 규칙을 사용하면 GPT3.5의 CoT 성능이 27.2% 향상된다는 점을 언급할 가치가 있습니다. 이는 CoT 성능의 두 배 이상이며 GPT4의 CoT 성능에 가깝습니다. 따라서 저자는 HtT가 강력한 LLM에서 약한 LLM으로의 새로운 형태의 지식 증류 역할을 할 수 있다고 믿습니다.
표 3은 HtT가 GPT-4(텍스트 버전)의 성능을 크게 향상시키는 것을 보여줍니다. 이러한 개선 사항은 GPT3.5에서는 중요하지 않습니다. 텍스트 입력을 처리할 때 규칙 환상 이외의 오류가 자주 발생하기 때문입니다.
위 내용은 GPT-4는 DeepMind 훈련을 통해 정확도를 13.7% 향상시켜 더 나은 유도 및 추론 능력을 달성했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











5월 30일, Tencent는 Hunyuan 모델의 포괄적인 업그레이드를 발표했습니다. Hunyuan 모델을 기반으로 하는 앱 "Tencent Yuanbao"가 공식 출시되었으며 Apple 및 Android 앱 스토어에서 다운로드할 수 있습니다. 이전 테스트 단계의 Hunyuan 애플릿 버전과 비교하여 Tencent Yuanbao는 일상 생활 시나리오를 위한 작업 효율성 시나리오를 위한 AI 검색, AI 요약 및 AI 작성과 같은 핵심 기능을 제공하며 Yuanbao의 게임 플레이도 더욱 풍부해지고 다양한 기능을 제공합니다. , 개인 에이전트 생성과 같은 새로운 게임 플레이 방법이 추가됩니다. Tencent Cloud 부사장이자 Tencent Hunyuan 대형 모델 책임자인 Liu Yuhong은 "Tencent는 먼저 대형 모델을 만들기 위해 노력하지 않을 것입니다."라고 말했습니다. Tencent Hunyuan 대형 모델 비즈니스 시나리오에서 풍부하고 방대한 폴란드 기술을 활용하면서 사용자의 실제 요구 사항에 대한 통찰력을 얻습니다.

Volcano Engine의 Tan Dai 사장은 대형 모델을 구현하려는 기업은 모델 효율성, 추론 비용, 구현 어려움이라는 세 가지 주요 과제에 직면하게 된다고 말했습니다. 복잡한 문제를 해결하기 위한 지원으로 좋은 기본 대형 모델이 있어야 하며, 서비스를 통해 대규모 모델을 널리 사용할 수 있으며 기업이 시나리오를 구현하는 데 더 많은 도구, 플랫폼 및 애플리케이션이 필요합니다. ——Tan Dai, Huoshan Engine 01 사장. 대형 빈백 모델이 출시되어 많이 사용되고 있습니다. 모델 효과를 연마하는 것은 AI 구현에 있어 가장 중요한 과제입니다. Tan Dai는 좋은 모델은 많은 양의 사용을 통해서만 연마될 수 있다고 지적했습니다. 현재 Doubao 모델은 매일 1,200억 개의 텍스트 토큰을 처리하고 3,000만 개의 이미지를 생성합니다. 기업이 대규모 모델 시나리오를 구현하는 데 도움을 주기 위해 ByteDance가 독자적으로 개발한 beanbao 대규모 모델이 화산을 통해 출시됩니다.

기계 학습 및 데이터 과학 분야에서 모델 해석 가능성은 항상 연구자와 실무자의 초점이었습니다. 딥러닝, 앙상블 방법 등 복잡한 모델이 널리 적용되면서 모델의 의사결정 과정을 이해하는 것이 특히 중요해졌습니다. explainable AI|XAI는 모델의 투명성을 높여 머신러닝 모델에 대한 신뢰와 확신을 구축하는 데 도움이 됩니다. 모델 투명성을 향상시키는 것은 여러 복잡한 모델의 광범위한 사용은 물론 모델을 설명하는 데 사용되는 의사 결정 프로세스와 같은 방법을 통해 달성할 수 있습니다. 이러한 방법에는 기능 중요도 분석, 모델 예측 간격 추정, 로컬 해석 가능성 알고리즘 등이 포함됩니다. 특성 중요도 분석은 모델이 입력 특성에 미치는 영향 정도를 평가하여 모델의 의사결정 과정을 설명할 수 있습니다. 모델 예측 구간 추정

C++의 기계 학습 알고리즘이 직면하는 일반적인 과제에는 메모리 관리, 멀티스레딩, 성능 최적화 및 유지 관리 가능성이 포함됩니다. 솔루션에는 스마트 포인터, 최신 스레딩 라이브러리, SIMD 지침 및 타사 라이브러리 사용은 물론 코딩 스타일 지침 준수 및 자동화 도구 사용이 포함됩니다. 실제 사례에서는 Eigen 라이브러리를 사용하여 선형 회귀 알고리즘을 구현하고 메모리를 효과적으로 관리하며 고성능 행렬 연산을 사용하는 방법을 보여줍니다.

1. 배경 소개 먼저 Yunwen Technology의 발전 역사를 소개하겠습니다. Yunwen Technology Company...2023년은 대형 모델이 유행하는 시기입니다. 많은 기업에서는 대형 모델 이후 그래프의 중요성이 크게 감소했으며 이전에 연구된 사전 설정 정보 시스템이 더 이상 중요하지 않다고 생각합니다. 그러나 RAG의 홍보와 데이터 거버넌스의 확산으로 우리는 보다 효율적인 데이터 거버넌스와 고품질 데이터가 민영화된 대형 모델의 효율성을 향상시키는 중요한 전제 조건이라는 것을 알게 되었습니다. 따라서 점점 더 많은 기업이 주목하기 시작했습니다. 지식 구축 관련 콘텐츠에 이는 또한 탐구할 수 있는 많은 기술과 방법이 있는 더 높은 수준으로 지식의 구성 및 처리를 촉진합니다. 신기술의 출현이 기존 기술을 모두 패배시키는 것이 아니라, 신기술과 기존 기술을 통합할 수도 있음을 알 수 있습니다.

6월 13일 뉴스에 따르면 Byte의 'Volcano Engine' 공개 계정에 따르면 Xiaomi의 인공 지능 비서인 'Xiao Ai'가 Volcano Engine과 협력을 이루었습니다. 두 당사자는 beanbao 대형 모델을 기반으로 보다 지능적인 AI 상호 작용 경험을 달성할 것입니다. . ByteDance가 만든 대형 빈바오 모델은 매일 최대 1,200억 개의 텍스트 토큰을 효율적으로 처리하고 3,000만 개의 콘텐츠를 생성할 수 있는 것으로 알려졌습니다. Xiaomi는 Doubao 대형 모델을 사용하여 자체 모델의 학습 및 추론 능력을 향상시키고 사용자 요구를 보다 정확하게 파악할 뿐만 아니라 보다 빠른 응답 속도와 보다 포괄적인 콘텐츠 서비스를 제공하는 새로운 "Xiao Ai Classmate"를 만들었습니다. 예를 들어, 사용자가 복잡한 과학 개념에 대해 질문하면 &ldq

번역기 | 검토자: Li Rui | Chonglou 인공 지능(AI) 및 기계 학습(ML) 모델은 오늘날 점점 더 복잡해지고 있으며 이러한 모델에서 생성되는 출력은 이해관계자에게 설명할 수 없는 블랙박스입니다. XAI(Explainable AI)는 이해관계자가 이러한 모델의 작동 방식을 이해할 수 있도록 하고, 이러한 모델이 실제로 의사 결정을 내리는 방식을 이해하도록 하며, AI 시스템의 투명성, 이 문제를 해결하기 위한 신뢰 및 책임을 보장함으로써 이 문제를 해결하는 것을 목표로 합니다. 이 기사에서는 기본 원리를 설명하기 위해 다양한 설명 가능한 인공 지능(XAI) 기술을 살펴봅니다. 설명 가능한 AI가 중요한 몇 가지 이유 신뢰와 투명성: AI 시스템이 널리 수용되고 신뢰되려면 사용자가 의사 결정 방법을 이해해야 합니다.

편집자 |ScienceAI 질문 응답(QA) 데이터 세트는 자연어 처리(NLP) 연구를 촉진하는 데 중요한 역할을 합니다. 고품질 QA 데이터 세트는 모델을 미세 조정하는 데 사용될 수 있을 뿐만 아니라 LLM(대형 언어 모델)의 기능, 특히 과학적 지식을 이해하고 추론하는 능력을 효과적으로 평가하는 데에도 사용할 수 있습니다. 현재 의학, 화학, 생물학 및 기타 분야를 포괄하는 과학적인 QA 데이터 세트가 많이 있지만 이러한 데이터 세트에는 여전히 몇 가지 단점이 있습니다. 첫째, 데이터 형식이 비교적 단순하고 대부분이 객관식 질문이므로 평가하기 쉽지만 모델의 답변 선택 범위가 제한되고 모델의 과학적 질문 답변 능력을 완전히 테스트할 수 없습니다. 이에 비해 개방형 Q&A는
