7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.-일체 포함-php.cn

7B 모델이 나머지 모델을 능가합니다

코드 모델을 기반으로 구축

집

기술 주변기기

일체 포함

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

王林

Feb 07, 2024 pm 05:03 PM

ai 데이터

7B 오픈소스 모델, 수학적 힘이 1000억 규모의 GPT-4를 뛰어넘습니다!

그 성능은 오픈소스 모델의 한계를 돌파했다고 할 수 있습니다. Alibaba Tongyi의 연구원들조차도 스케일링 법칙이 실패했다고 한탄했습니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

외부 도구 없이 경쟁 수준의 MATH 데이터 세트에서 51.7%의 정확도를 달성할 수 있습니다.

오픈 소스 모델 중 GPT-4의 초기 및 API 버전을 능가하는 이 데이터세트의 정확도를 절반으로 달성한 최초의 모델입니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

이 성과는 전체 오픈 소스 커뮤니티에 충격을 주었습니다. Stability AI의 창립자인 Emad Mostaque는 R&D 팀이 인상적이며 과소평가된 잠재력을 가지고 있다고 칭찬했습니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

Deep Search 팀의 최신 오픈 소스 7B 대형 수학 모델 DeepSeekMath입니다.

7B 모델이 나머지 모델을 능가합니다

DeepSeekMath의 수학적 능력을 평가하기 위해 연구팀은 테스트를 위해 중국어 (MGSM-zh, CMATH) 영어 (GSM8K, MATH) 이중 언어 데이터 세트를 사용했습니다.

보조 도구를 사용하지 않고 사고 사슬의 프롬프트에만 의존(CoT) DeepSeekMath의 성능은 70B 대형 수학적 모델 MetaMATH를 포함한 다른 오픈 소스 모델을 능가했습니다.

자체 출시된 67B 범용 대형 모델과 비교하여 DeepSeekMath의 결과도 크게 향상되었습니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

비공개 소스 모델을 고려하면 DeepSeekMath는 여러 데이터 세트에서 Gemini Pro 및 GPT-3.5를 능가하고 중국 CMATH에서는 GPT-4를 능가하며 MATH에서의 성능도 그에 가깝습니다.

하지만 유출된 사양에 따르면 GPT-4는 수천억 개의 매개변수를 가진 거대하고 DeepSeekMath에는 7B 매개변수만 있다는 점에 유의해야 합니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

도구 (Python) 을 지원에 사용할 수 있으면 DeepSeekMath의 경쟁 난이도 (MATH) 데이터 세트 성능이 7% 포인트 더 향상될 수 있습니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

그렇다면 DeepSeekMath의 뛰어난 성능 뒤에는 어떤 기술이 적용되어 있을까요?

코드 모델을 기반으로 구축

일반 모델보다 더 나은 수학적 성능을 얻기 위해 연구팀은 코드 모델 DeepSeek-Coder-v1.5를 사용하여 초기화했습니다.

팀은 2단계 훈련이든 1단계 훈련 설정이든 코드 훈련이 일반 데이터 훈련에 비해 모델의 수학적 능력을 향상시킬 수 있다는 것을 발견했기 때문입니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

Coder를 기반으로 연구팀은 계속해서 5000억 개의 토큰을 훈련했습니다. 데이터 분포는 다음과 같습니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

훈련 데이터 측면에서 DeepSeekMath는 Common Crawl에서 추출한 120B개의 고품질 수학 웹페이지 데이터를 사용합니다. DeepSeekMath 코퍼스를 얻었으며, 전체 데이터 양은 오픈소스 데이터세트인 OpenWebMath의 9배에 달합니다.

데이터 수집 프로세스는 4번의 반복을 통해 수행되었으며, 연구팀은 3,500만 개 이상의 수학 웹 페이지를 수집했으며, 토큰 수는 1,200억 개에 달했습니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

훈련 데이터에 테스트 세트의 내용이 포함되지 않도록(GSM8K 및 MATH의 내용은 인터넷에 대량으로 존재하기 때문), 연구팀은 필터링도 특별히 수행했습니다.

DeepSeekMath Corpus의 데이터 품질을 검증하기 위해 연구팀은 MathPile과 같은 여러 데이터 세트를 사용하여 1,500억 개의 토큰을 훈련한 결과 여러 수학 벤치마크에서 Corpus가 크게 앞섰습니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

정렬 단계에서 연구팀은 먼저 CoT, PoT 및 도구 통합 추론의 세 가지 형식을 포함하는 776K 샘플 중국어 및 영어 수학 안내 감독 미세 조정 (SFT) 데이터 세트를 구축했습니다.

강화학습(RL) 단계에서 연구팀은 "GRPO(Group Relative Policy Optimization) "라는 효율적인 알고리즘을 사용했습니다.

GRPO는 근위 정책 최적화

(PPO) 의 변형으로, 기존 가치 함수를 그룹 기반 상대 보상 추정으로 대체하여 훈련 중 계산 및 메모리 요구 사항을 줄일 수 있습니다.

동시에 GRPO는 반복적인 프로세스를 통해 교육을 받고, 정책 모델의 출력을 기반으로 보상 모델이 지속적으로 업데이트되어 정책의 지속적인 개선이 보장됩니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

국내 최초 오픈소스 MoE 모델을 출시했습니다.

DeepSeekMath를 출시한 심층 검색팀은 국내 오픈소스 모델 분야의 '리딩 플레이어'입니다.

이전 팀은 국내 최초 오픈소스 MoE 모델인 DeepSeek MoE를 출시했는데, 7B 버전은 같은 규모의 밀도가 높은 모델인 Llama 2를 계산량의 40%로 이겼습니다.

일반 모델로서 DeepSeek MoE는 코딩 및 수학 작업에서 매우 우수한 성능을 발휘하며 리소스 소비도 매우 낮습니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

코드 측면에서 팀이 출시한 DeepSeek-Coder의 프로그래밍 능력은 코드 생성, 파일 간 코드 완성, 수학적 프로그래밍 솔루션 등 여러 작업에서 동일한 규모의 오픈 소스 벤치마크인 CodeLllama를 능가했습니다. 문제.

동시에 GPT-3.5-Turbo도 물리치고 GPT-4-Turbo에 가장 가까운 오픈 소스 코드 모델이 되었습니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

앞서 언급했듯이 이번에 출시된 DeepSeekMath도 Coder를 기반으로 구축되었습니다.

X에서는 일부 사람들이 이미 MoE 버전의 Coder 및 Math를 기대하고 있습니다.

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

논문 주소: https://arxiv.org/abs/2402.03300

위 내용은 7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7716

자바 튜토리얼

1641

Cakephp 튜토리얼

1396

라라벨 튜토리얼

1289

PHP 튜토리얼

1232

Related knowledge

Worldcoin (WLD) 가격 예측 2025-2031 : WLD가 2031 년까지 4 달러에 도달 할 것인가? Apr 21, 2025 pm 02:42 PM

Worldcoin (WLD)은 Cryptocurrency 시장에서 고유 한 생체 인정 및 개인 정보 보호 메커니즘으로 눈에 띄고 많은 투자자의 관심을 끌고 있습니다. WLD는 혁신적인 기술, 특히 OpenAi 인공 지능 기술과 함께 Altcoins에서 뛰어난 성과를 거두었습니다. 그러나 향후 몇 년 안에 디지털 자산은 어떻게 행동 할 것인가? WLD의 미래 가격을 함께 예측합시다. 2025 WLD 가격 예측은 2025 년 WLD에서 상당한 성장을 달성 할 것으로 예상됩니다. 시장 분석에 따르면 평균 WLD 가격은 최대 $ 1.36로 $ 1.31에 도달 할 수 있습니다. 그러나 곰 시장에서 가격은 약 $ 0.55로 떨어질 수 있습니다. 이러한 성장 기대는 주로 WorldCoin2에 기인합니다.

크로스 체인 거래는 무엇을 의미합니까? 크로스 체인 거래는 무엇입니까? Apr 21, 2025 pm 11:39 PM

크로스 체인 거래를 지원하는 교환 : 1. Binance, 2. Uniswap, 3. Sushiswap, 4. Curve Finance, 5. Thorchain, 6. 1inch Exchange, 7. DLN 거래,이 플랫폼은 다양한 기술을 통해 다중 체인 자산 거래를 지원합니다.

'Black Monday Sell'은 Cryptocurrency 업계의 힘든 날입니다. Apr 21, 2025 pm 02:48 PM

cryptocurrency 시장의 급락으로 인해 투자자들 사이에 공황이 발생했으며 Dogecoin (Doge)은 가장 어려운 지역 중 하나가되었습니다. 가격은 급격히 하락했으며 분산 금융 (DEFI) (TVL)의 총 가치 잠금 장치도 크게 감소했습니다. "Black Monday"의 판매 물결은 cryptocurrency 시장을 휩쓸었고 Dogecoin은 처음으로 타격을 받았습니다. DefitVl은 2023 년 수준으로 떨어졌고 지난 달 통화 가격은 23.78% 하락했습니다. Dogecoin의 Defitvl은 주로 SOSO 가치 지수의 26.37% 감소로 인해 272 만 달러로 떨어졌습니다. 지루한 Dao 및 Thorchain과 같은 다른 주요 Defi 플랫폼도 TVL도 각각 24.04% 및 20으로 떨어졌습니다.

Aavenomics는 AAVE 프로토콜 토큰을 수정하고 쿼럼 수의 사람들에게 도달 한 토큰 재구매를 소개하는 권장 사항입니다. Apr 21, 2025 pm 06:24 PM

Aavenomics는 AAVE 프로토콜 토큰을 수정하고 Aavedao의 쿼럼을 구현 한 Token Repos를 소개하는 제안입니다. AAVE 프로젝트 체인 (ACI)의 설립자 인 Marc Zeller는 X에서 이것을 발표하여 계약의 새로운 시대를 표시한다고 지적했습니다. AAVE 체인 이니셔티브 (ACI)의 설립자 인 Marc Zeller는 AAVENOMICS 제안서에 AAVE 프로토콜 토큰 수정 및 토큰 리포지션 도입이 포함되어 있다고 X에서 AAVEDAO에 대한 쿼럼을 달성했다고 발표했습니다. Zeller에 따르면, 이것은 계약의 새로운 시대를 나타냅니다. Aavedao 회원국은 수요일에 주당 100 인 제안을지지하기 위해 압도적으로 투표했습니다.

하이브리드 블록 체인 거래 플랫폼은 무엇입니까? Apr 21, 2025 pm 11:36 PM

cryptocurrency 교환 선택에 대한 제안 : 1. 유동성 요구 사항의 경우 우선 순위는 순서 깊이와 강한 변동성 저항으로 인해 Binance, Gate.io 또는 Okx입니다. 2. 규정 준수 및 보안, 코인베이스, 크라켄 및 쌍둥이 자리는 엄격한 규제 승인을 받았습니다. 3. Kucoin의 소프트 스테이 킹 및 Bybit의 파생 설계 혁신적인 기능은 고급 사용자에게 적합합니다.

가상 통화 가격의 상승 또는 하락은 왜입니까? 가상 통화 가격의 상승 또는 하락은 왜입니까? Apr 21, 2025 am 08:57 AM

가상 통화 가격 상승의 요인은 다음과 같습니다. 1. 시장 수요 증가, 2. 공급 감소, 3. 긍정적 인 뉴스, 4. 낙관적 시장 감정, 5. 거시 경제 환경; 감소 요인에는 다음이 포함됩니다. 1. 시장 수요 감소, 2. 공급 증가, 3. 부정적인 뉴스의 파업, 4. 비관적 시장 감정, 5. 거시 경제 환경.

Binance 전체 프로세스 전략에 대한 커널 에어 드롭 보상을받는 방법 Apr 21, 2025 pm 01:03 PM

암호 화폐의 번화 한 세계에서는 새로운 기회가 항상 나타납니다. 현재 Kerneldao (Kernel) 에어 드롭 활동은 많은 관심을 끌고 많은 투자자들의 관심을 끌고 있습니다. 그렇다면이 프로젝트의 기원은 무엇입니까? BNB 보유자는 어떤 이점을 얻을 수 있습니까? 걱정하지 마십시오. 다음은 당신을 위해 하나씩 공개 할 것입니다.

통화 서클 시장의 실시간 데이터에 대한 상위 10 개 무료 플랫폼 권장 사항이 출시됩니다. Apr 22, 2025 am 08:12 AM

초보자에게 적합한 cryptocurrency 데이터 플랫폼에는 CoinmarketCap 및 비소 트럼펫이 포함됩니다. 1. CoinmarketCap은 초보자 및 기본 분석 요구에 대한 글로벌 실시간 가격, 시장 가치 및 거래량 순위를 제공합니다. 2. 비소 인용문은 중국 사용자가 저 위험 잠재적 프로젝트를 신속하게 선별하는 데 적합한 중국 친화적 인 인터페이스를 제공합니다.

See all articles

7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.

7B 모델이 나머지 모델을 능가합니다

코드 모델을 기반으로 구축

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제