7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.
7B 오픈소스 모델, 수학적 힘이 1000억 규모의 GPT-4를 뛰어넘습니다!
그 성능은 오픈소스 모델의 한계를 돌파했다고 할 수 있습니다. Alibaba Tongyi의 연구원들조차도 스케일링 법칙이 실패했다고 한탄했습니다.
외부 도구 없이 경쟁 수준의 MATH 데이터 세트에서 51.7%의 정확도를 달성할 수 있습니다.
오픈 소스 모델 중 GPT-4의 초기 및 API 버전을 능가하는 이 데이터세트의 정확도를 절반으로 달성한 최초의 모델입니다.
이 성과는 전체 오픈 소스 커뮤니티에 충격을 주었습니다. Stability AI의 창립자인 Emad Mostaque는 R&D 팀이 인상적이며 과소평가된 잠재력을 가지고 있다고 칭찬했습니다.
Deep Search 팀의 최신 오픈 소스 7B 대형 수학 모델 DeepSeekMath입니다.
7B 모델이 나머지 모델을 능가합니다
DeepSeekMath의 수학적 능력을 평가하기 위해 연구팀은 테스트를 위해 중국어 (MGSM-zh, CMATH) 영어 (GSM8K, MATH) 이중 언어 데이터 세트를 사용했습니다.
보조 도구를 사용하지 않고 사고 사슬의 프롬프트에만 의존(CoT) DeepSeekMath의 성능은 70B 대형 수학적 모델 MetaMATH를 포함한 다른 오픈 소스 모델을 능가했습니다.
자체 출시된 67B 범용 대형 모델과 비교하여 DeepSeekMath의 결과도 크게 향상되었습니다.
비공개 소스 모델을 고려하면 DeepSeekMath는 여러 데이터 세트에서 Gemini Pro 및 GPT-3.5를 능가하고 중국 CMATH에서는 GPT-4를 능가하며 MATH에서의 성능도 그에 가깝습니다.
하지만 유출된 사양에 따르면 GPT-4는 수천억 개의 매개변수를 가진 거대하고 DeepSeekMath에는 7B 매개변수만 있다는 점에 유의해야 합니다.
도구 (Python) 을 지원에 사용할 수 있으면 DeepSeekMath의 경쟁 난이도 (MATH) 데이터 세트 성능이 7% 포인트 더 향상될 수 있습니다.
그렇다면 DeepSeekMath의 뛰어난 성능 뒤에는 어떤 기술이 적용되어 있을까요?
코드 모델을 기반으로 구축
일반 모델보다 더 나은 수학적 성능을 얻기 위해 연구팀은 코드 모델 DeepSeek-Coder-v1.5를 사용하여 초기화했습니다.
팀은 2단계 훈련이든 1단계 훈련 설정이든 코드 훈련이 일반 데이터 훈련에 비해 모델의 수학적 능력을 향상시킬 수 있다는 것을 발견했기 때문입니다.
Coder를 기반으로 연구팀은 계속해서 5000억 개의 토큰을 훈련했습니다. 데이터 분포는 다음과 같습니다.
훈련 데이터 측면에서 DeepSeekMath는 Common Crawl에서 추출한 120B개의 고품질 수학 웹페이지 데이터를 사용합니다. DeepSeekMath 코퍼스를 얻었으며, 전체 데이터 양은 오픈소스 데이터세트인 OpenWebMath의 9배에 달합니다.
데이터 수집 프로세스는 4번의 반복을 통해 수행되었으며, 연구팀은 3,500만 개 이상의 수학 웹 페이지를 수집했으며, 토큰 수는 1,200억 개에 달했습니다.
훈련 데이터에 테스트 세트의 내용이 포함되지 않도록(GSM8K 및 MATH의 내용은 인터넷에 대량으로 존재하기 때문), 연구팀은 필터링도 특별히 수행했습니다.
DeepSeekMath Corpus의 데이터 품질을 검증하기 위해 연구팀은 MathPile과 같은 여러 데이터 세트를 사용하여 1,500억 개의 토큰을 훈련한 결과 여러 수학 벤치마크에서 Corpus가 크게 앞섰습니다.
정렬 단계에서 연구팀은 먼저 CoT, PoT 및 도구 통합 추론의 세 가지 형식을 포함하는 776K 샘플 중국어 및 영어 수학 안내 감독 미세 조정 (SFT) 데이터 세트를 구축했습니다.
강화학습(RL) 단계에서 연구팀은 "GRPO(Group Relative Policy Optimization) "라는 효율적인 알고리즘을 사용했습니다.
GRPO는 근위 정책 최적화(PPO) 의 변형으로, 기존 가치 함수를 그룹 기반 상대 보상 추정으로 대체하여 훈련 중 계산 및 메모리 요구 사항을 줄일 수 있습니다.
동시에 GRPO는 반복적인 프로세스를 통해 교육을 받고, 정책 모델의 출력을 기반으로 보상 모델이 지속적으로 업데이트되어 정책의 지속적인 개선이 보장됩니다.논문 주소: https://arxiv.org/abs/2402.03300
위 내용은 7B 오픈 소스 수학적 모델은 중국 팀이 제작한 수십억 개의 GPT-4를 물리칩니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Worldcoin (WLD)은 Cryptocurrency 시장에서 고유 한 생체 인정 및 개인 정보 보호 메커니즘으로 눈에 띄고 많은 투자자의 관심을 끌고 있습니다. WLD는 혁신적인 기술, 특히 OpenAi 인공 지능 기술과 함께 Altcoins에서 뛰어난 성과를 거두었습니다. 그러나 향후 몇 년 안에 디지털 자산은 어떻게 행동 할 것인가? WLD의 미래 가격을 함께 예측합시다. 2025 WLD 가격 예측은 2025 년 WLD에서 상당한 성장을 달성 할 것으로 예상됩니다. 시장 분석에 따르면 평균 WLD 가격은 최대 $ 1.36로 $ 1.31에 도달 할 수 있습니다. 그러나 곰 시장에서 가격은 약 $ 0.55로 떨어질 수 있습니다. 이러한 성장 기대는 주로 WorldCoin2에 기인합니다.

크로스 체인 거래를 지원하는 교환 : 1. Binance, 2. Uniswap, 3. Sushiswap, 4. Curve Finance, 5. Thorchain, 6. 1inch Exchange, 7. DLN 거래,이 플랫폼은 다양한 기술을 통해 다중 체인 자산 거래를 지원합니다.

cryptocurrency 시장의 급락으로 인해 투자자들 사이에 공황이 발생했으며 Dogecoin (Doge)은 가장 어려운 지역 중 하나가되었습니다. 가격은 급격히 하락했으며 분산 금융 (DEFI) (TVL)의 총 가치 잠금 장치도 크게 감소했습니다. "Black Monday"의 판매 물결은 cryptocurrency 시장을 휩쓸었고 Dogecoin은 처음으로 타격을 받았습니다. DefitVl은 2023 년 수준으로 떨어졌고 지난 달 통화 가격은 23.78% 하락했습니다. Dogecoin의 Defitvl은 주로 SOSO 가치 지수의 26.37% 감소로 인해 272 만 달러로 떨어졌습니다. 지루한 Dao 및 Thorchain과 같은 다른 주요 Defi 플랫폼도 TVL도 각각 24.04% 및 20으로 떨어졌습니다.

Aavenomics는 AAVE 프로토콜 토큰을 수정하고 Aavedao의 쿼럼을 구현 한 Token Repos를 소개하는 제안입니다. AAVE 프로젝트 체인 (ACI)의 설립자 인 Marc Zeller는 X에서 이것을 발표하여 계약의 새로운 시대를 표시한다고 지적했습니다. AAVE 체인 이니셔티브 (ACI)의 설립자 인 Marc Zeller는 AAVENOMICS 제안서에 AAVE 프로토콜 토큰 수정 및 토큰 리포지션 도입이 포함되어 있다고 X에서 AAVEDAO에 대한 쿼럼을 달성했다고 발표했습니다. Zeller에 따르면, 이것은 계약의 새로운 시대를 나타냅니다. Aavedao 회원국은 수요일에 주당 100 인 제안을지지하기 위해 압도적으로 투표했습니다.

cryptocurrency 교환 선택에 대한 제안 : 1. 유동성 요구 사항의 경우 우선 순위는 순서 깊이와 강한 변동성 저항으로 인해 Binance, Gate.io 또는 Okx입니다. 2. 규정 준수 및 보안, 코인베이스, 크라켄 및 쌍둥이 자리는 엄격한 규제 승인을 받았습니다. 3. Kucoin의 소프트 스테이 킹 및 Bybit의 파생 설계 혁신적인 기능은 고급 사용자에게 적합합니다.

가상 통화 가격 상승의 요인은 다음과 같습니다. 1. 시장 수요 증가, 2. 공급 감소, 3. 긍정적 인 뉴스, 4. 낙관적 시장 감정, 5. 거시 경제 환경; 감소 요인에는 다음이 포함됩니다. 1. 시장 수요 감소, 2. 공급 증가, 3. 부정적인 뉴스의 파업, 4. 비관적 시장 감정, 5. 거시 경제 환경.

암호 화폐의 번화 한 세계에서는 새로운 기회가 항상 나타납니다. 현재 Kerneldao (Kernel) 에어 드롭 활동은 많은 관심을 끌고 많은 투자자들의 관심을 끌고 있습니다. 그렇다면이 프로젝트의 기원은 무엇입니까? BNB 보유자는 어떤 이점을 얻을 수 있습니까? 걱정하지 마십시오. 다음은 당신을 위해 하나씩 공개 할 것입니다.

초보자에게 적합한 cryptocurrency 데이터 플랫폼에는 CoinmarketCap 및 비소 트럼펫이 포함됩니다. 1. CoinmarketCap은 초보자 및 기본 분석 요구에 대한 글로벌 실시간 가격, 시장 가치 및 거래량 순위를 제공합니다. 2. 비소 인용문은 중국 사용자가 저 위험 잠재적 프로젝트를 신속하게 선별하는 데 적합한 중국 친화적 인 인터페이스를 제공합니다.
