기술 주변기기 일체 포함 Deepseek은 AI를 30 배 더 저렴하게 훈련 시켰습니까?

Deepseek은 AI를 30 배 더 저렴하게 훈련 시켰습니까?

Mar 08, 2025 am 10:20 AM

<:> Deepseek : 자원뿐만 아니라 효율성으로 AI 훈련 혁명을 혁신합니다 Deepseek은 AI 커뮤니티에서 상당한 화제를 일으키고 있으며, 겉보기에 불가능한 것을 달성 한 것에 대해 찬사를 받았습니다. AI 모델을 전형적인 비용의 1/30으로 훈련시킵니다. 많은 회사가 "최첨단"모델을 자랑하지만 DeepSeek은 진정한 혁신이 경계를 높이고 이전에는 달성 할 수없는 결과를 달성하는 데 있다는 것을 보여주고 있습니다. 이 회사의 앱은 Chatgpt와 같은 기존 거인을 능가하는 App Store 차트의 상단에 도착했습니다. 이 바이러스 성 이미지는 그 성공을 보여줍니다 :

Deepseek의 놀라운 업적은 영리한 전략의 조합에서 비롯됩니다.

비싼 하드웨어가 아닌 스마트 최적화 :

기대치와는 반대로, DeepSeek은 최첨단 제한 AI 칩에 의존하지 않았습니다. 대신, 그들은 세심한 저수준 코드 최적화를 통해 쉽게 구할 수있는 하드웨어 (NVIDIA H800)의 성능을 극대화하는 데 중점을 두었습니다. 이로 인해 메모리 사용의 피크 효율이 보장되어 우수한 소프트웨어가 하드웨어 제한을 극복 할 수 있음을 증명했습니다. How DeepSeek Trained AI 30 Times Cheaper?

목표 교육 : 효율성 극대화 :
    전통적인 AI 교육은 종종 기여에 관계없이 모든 모델 구성 요소를 업데이트합니다. DeepSeek의 혁신적인 "보조 손실이없는로드 밸런싱"기술은 이러한 비 효율성을 해결합니다. 그들은 모델의 필수 부분 만 훈련시키고, 일부 부품을 과부하를 피하기 위해 바이어스 용어를 사용하여 자원을 동적으로 할당하는 반면 다른 부분은 활용률이 낮은 상태입니다.
  1. <: :> 작동 방식 : 각 텍스트 세그먼트 ( "토큰")는 전문가의 작은 하위 집합에 의해 처리됩니다. 시스템은 전문가 간의 워크로드의 균형을 맞추기 위해 바이어스 용어를 동적으로 조정합니다. 이로 인해 계산 오버 헤드가 추가되지 않고 효율적인 리소스 활용도가 발생합니다.
결과 :

모델 매개 변수의 5%만이 토큰 당 훈련을받습니다 메타에 비해 GPU 사용량의 정확도를 손상시키지 않고 훨씬 빠르고 저렴한 훈련 How DeepSeek Trained AI 30 Times Cheaper?

      속도 및 비용 절감을위한 데이터 압축 :
    1. AI 모델 실행, 특히 추론 (출력 생성)은 메모리 집약적입니다. DeepSeek의 "저 순위 키 값 (KV) 조인트 압축"기술은 KV 캐시의 키 값 쌍을 효율적으로 압축하여 성능 손실없이 스토리지 요구를 최소화합니다. <: :> 작동 방식 :
    키 및 값 벡터는 다운 프로 젝트 매트릭스를 사용하여 압축됩니다. 압축 데이터 만 저장되어 메모리 요구 사항이 줄어 듭니다 데이터는 최소한의 정확도 손실로 필요에 따라 압축을 압축합니다

    혜택 :
      메모리 사용량을 낮추십시오 더 빠른 추론.
    • <.> 비용 절감
    • 더 똑똑한 훈련을위한 강화 학습 :
    • Deepseek은 쉽게 검증 가능한 답변 (수학, 코딩)을 갖춘 작업에 중점을 둔 강화 학습을 사용합니다. 올바른 결과는 보상을 받고 성공적인 패턴을 강화하고 더 적은 리소스로 정확도를 향상시킵니다.

      Deepseek의 충격 :
    • DeepSeek의 성공은 타겟팅 훈련, 스마트 압축 및 효율적인 하드웨어 활용의 세 가지 주요 원칙을 강조합니다. 이 접근법은 비용을 줄일뿐만 아니라 테스트 및 혁신주기를 가속화합니다. 회사는 획기적인 AI가 무제한 자원이 필요하지 않다는 것을 증명합니다. 사용 가능한 것을 극대화하는 것입니다. 이 효율성 모델은 AI의 미래를위한 게임 체인저입니다. (참고 : 관련 기사 목록과 관련 기사 목록은 변경되지 않았습니다.)
    • DeepSeek의 비용 효율적인 AI 교육의 비밀을 잠금 해제하십시오! “DeepSeek에 시작하기”코스에 등록하고 비용의 일부로 강력한 AI 기술을 활용하는 방법을 배우십시오. 놓치지 마세요 - 지금 여정을 시작하십시오!
    • DeepSeek 작업 및 유사한 모델과의 비교에 대한 자세한 기사를 확인하십시오 :
    Deepseek R1- Openai의 O1 최대 경쟁자는 여기에 있습니다! DeepSeek-v3 를 사용한 AI 애플리케이션 구축 deepseek-v3 vs gpt-4o vs llama 3.3 70b How DeepSeek Trained AI 30 Times Cheaper? Deepseek v3 vs gpt-4o : 어느 것이 더 낫습니까? Deepseek R1 vs Openai O1 : 어느 것이 더 낫습니까? 더 멋진 콘텐츠를 위해 분석 Vidhya 블로그를 계속 지켜봐주십시오!

위 내용은 Deepseek은 AI를 30 배 더 저렴하게 훈련 시켰습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

창의적인 프로젝트를위한 최고의 AI 아트 발전기 (무료 & amp; 유료) 창의적인 프로젝트를위한 최고의 AI 아트 발전기 (무료 & amp; 유료) Apr 02, 2025 pm 06:10 PM

이 기사는 최고의 AI 아트 생성기를 검토하여 자신의 기능, 창의적인 프로젝트에 대한 적합성 및 가치에 대해 논의합니다. Midjourney를 전문가에게 최고의 가치로 강조하고 고품질의 사용자 정의 가능한 예술에 Dall-E 2를 추천합니다.

Meta Llama 3.2- 분석 Vidhya를 시작합니다 Meta Llama 3.2- 분석 Vidhya를 시작합니다 Apr 11, 2025 pm 12:04 PM

메타의 라마 3.2 : 멀티 모달 및 모바일 AI의 도약 Meta는 최근 AI에서 강력한 비전 기능과 모바일 장치에 최적화 된 가벼운 텍스트 모델을 특징으로하는 AI의 상당한 발전 인 Llama 3.2를 공개했습니다. 성공을 바탕으로 o

최고의 AI 챗봇 비교 (Chatgpt, Gemini, Claude & amp; more) 최고의 AI 챗봇 비교 (Chatgpt, Gemini, Claude & amp; more) Apr 02, 2025 pm 06:09 PM

이 기사는 Chatgpt, Gemini 및 Claude와 같은 최고의 AI 챗봇을 비교하여 고유 한 기능, 사용자 정의 옵션 및 자연어 처리 및 신뢰성의 성능에 중점을 둡니다.

chatgpt 4 o를 사용할 수 있습니까? chatgpt 4 o를 사용할 수 있습니까? Mar 28, 2025 pm 05:29 PM

ChatGpt 4는 현재 이용 가능하고 널리 사용되며 ChatGpt 3.5와 같은 전임자와 비교하여 상황을 이해하고 일관된 응답을 생성하는 데 상당한 개선을 보여줍니다. 향후 개발에는보다 개인화 된 인터가 포함될 수 있습니다

컨텐츠 생성을 향상시키기 위해 AI를 쓰는 최고 AI 작문 컨텐츠 생성을 향상시키기 위해 AI를 쓰는 최고 AI 작문 Apr 02, 2025 pm 06:11 PM

이 기사는 Grammarly, Jasper, Copy.ai, Writesonic 및 Rytr와 같은 최고의 AI 작문 조수에 대해 논의하여 콘텐츠 제작을위한 독특한 기능에 중점을 둡니다. Jasper는 SEO 최적화가 뛰어나고 AI 도구는 톤 구성을 유지하는 데 도움이된다고 주장합니다.

AI 에이전트를 구축하기위한 상위 7 개의 에이전트 래그 시스템 AI 에이전트를 구축하기위한 상위 7 개의 에이전트 래그 시스템 Mar 31, 2025 pm 04:25 PM

2024는 콘텐츠 생성에 LLM을 사용하는 것에서 내부 작업을 이해하는 것으로 바뀌는 것을 목격했습니다. 이 탐사는 AI 요원의 발견으로 이어졌다 - 자율 시스템을 처리하는 과제와 최소한의 인간 개입으로 결정을 내렸다. buildin

최고의 AI 음성 생성기 선택 : 최고 옵션 검토 최고의 AI 음성 생성기 선택 : 최고 옵션 검토 Apr 02, 2025 pm 06:12 PM

이 기사는 Google Cloud, Amazon Polly, Microsoft Azure, IBM Watson 및 Destript와 같은 최고의 AI 음성 생성기를 검토하여 기능, 음성 품질 및 다양한 요구에 대한 적합성에 중점을 둡니다.

AV 바이트 : Meta ' S Llama 3.2, Google의 Gemini 1.5 등 AV 바이트 : Meta ' S Llama 3.2, Google의 Gemini 1.5 등 Apr 11, 2025 pm 12:01 PM

이번 주 AI 환경 : 발전의 회오리 바람, 윤리적 고려 사항 및 규제 토론. OpenAi, Google, Meta 및 Microsoft와 같은 주요 플레이어

See all articles