世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです
従来のコンピューティングを超える能力を備えているだけでなく、より低コストでより効率的なパフォーマンスを実現する人工知能モデルを想像してみてください。これは SF ではありません。世界で最も強力なオープンソース MoE モデルである DeepSeek-V2[1] がここにあります。
DeepSeek-V2 は、経済的なトレーニングと効率的な推論の特徴を備えた強力な専門家混合 (MoE) 言語モデルです。これは 236B のパラメータで構成され、そのうち 21B は各タグをアクティブにするために使用されます。 DeepSeek 67B と比較して、DeepSeek-V2 はパフォーマンスが強力であると同時に、トレーニング コストを 42.5% 節約し、KV キャッシュを 93.3% 削減し、最大生成スループットを 5.76 倍に増加します。
DeepSeek は、汎用人工知能 (AGI) の性質を探求し、研究、エンジニアリング、ビジネスの統合に取り組んでいる会社です。
DeepSeek-V2 の包括的な機能
現在主流の大規模モデルのリストでは、DeepSeek-V2 は優れたパフォーマンスを発揮します:
- 中国の包括的な機能 (AlignBench) オープンソース モデルの中で最も強力です: GPT-4-Turbo を使用し、 Wenxin 4.0 などのクローズド ソース モデルは評価において同じ階層にあります
- 英語の総合力 (MT-Bench) は最初の階層にあります: 英語の総合能力 (MT-Bench) は最強のオープンソース モデルと同じ階層にありますLLaMA3-70B、最強のMoEオープンソースモデルMixtral 8x22Bを超える
- 知識、数学、推論、プログラミングなどのリストでトップにランク
- 128Kコンテキストウィンドウをサポート
新しいモデル構造
ときAI の可能性は常に探究されています。深く掘り下げていくと、私たちはこう尋ねずにはいられません。インテリジェントな進歩を促進するための鍵は何でしょうか? DeepSeek-V2 は、革新的なアーキテクチャと費用対効果の完璧な組み合わせという答えを提供します。
「DeepSeek-V2は改良版です。合計パラメータ236B、アクティベーション21Bで、最終的に70B~110Bの高密度モデルの能力に達します。同時に、メモリ消費量はわずか1/5~1/です。」 8 カードの H800 マシンでは、100 枚の同じレベルのトークンを入力し、毎秒 50,000 枚以上のトークンを出力できます。これは技術の飛躍であるだけでなく、革命でもあります。コスト管理。「
AI テクノロジーの急速な発展に伴い、今日、DeepSeek-V2 の出現は技術的な進歩を示すだけでなく、インテリジェント アプリケーションの普及の先駆けでもあります。」これにより、AI の敷居が下がり、より多くの企業や個人が効率的なインテリジェント サービスのメリットを享受できるようになります。同時に、それはインテリジェントなアプリケーションの普及の先駆けでもあります。これにより、AI の敷居が下がり、より多くの企業や個人が効率的なインテリジェント サービスのメリットを享受できるようになります。
中国語の機能 VS 価格
中国語の機能に関して、DeepSeek-V2 は AlignBench ランキングで世界をリードしており、非常に競争力のある API 価格を提供しています。
モデルと論文は両方ともオープンソースです
DeepSeek-V2は単なるモデルではなく、よりスマートな世界への鍵です。低コストかつ高パフォーマンスの AI アプリケーションの新たな章を開きます。 DeepSeek-V2 のオープンソースは、より多くの人々の革新的な精神を刺激し、人類の知性の未来を共同で促進するという信念の最良の証拠です。
- モデルの重み: https://huggingface.co/deepseek-ai
- オープンソースアドレス: https://github.com/deepseek-ai/DeepSeek-V2
AIが進化し続ける現代において、 DeepSeek についてどう思いますか - V2 は私たちの世界をどのように変えますか?興味があれば、chat.deepseek.com にアクセスして、DeepSeek-V2 によってもたらされる技術的な変化をご自身で体験してください。
参考資料
[1]
DeepSeek-V2:https://www.php.cn/link/b2651c9921723afdfd04ed61ec302a6b
以上が世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











gitを介してローカルにプロジェクトをダウンロードするには、次の手順に従ってください。gitをインストールします。プロジェクトディレクトリに移動します。次のコマンドを使用してリモートリポジトリのクローニング:git clone https://github.com/username/repository-name.git

GITコードを更新する手順:コードをチェックしてください:gitクローンhttps://github.com/username/repo.git最新の変更を取得:gitフェッチマージの変更:gitマージオリジン/マスタープッシュ変更(オプション):gitプッシュオリジンマスター

GITコミットは、プロジェクトの現在の状態のスナップショットを保存するために、ファイルの変更をGITリポジトリに記録するコマンドです。使用方法は次のとおりです。一時的なストレージエリアに変更を追加する簡潔で有益な提出メッセージを書き込み、送信メッセージを保存して終了して送信を完了します。

gitコードマージプロセス:競合を避けるために最新の変更を引き出します。マージするブランチに切り替えます。マージを開始し、ブランチをマージするように指定します。競合のマージ(ある場合)を解決します。ステージングとコミットマージ、コミットメッセージを提供します。

eコマースのウェブサイトを開発するとき、私は困難な問題に遭遇しました:大量の製品データで効率的な検索機能を達成する方法は?従来のデータベース検索は非効率的であり、ユーザーエクスペリエンスが低いです。いくつかの調査の後、私は検索エンジンタイプセンスを発見し、公式のPHPクライアントタイプセンス/タイプセンス-PHPを通じてこの問題を解決し、検索パフォーマンスを大幅に改善しました。

解決:gitのダウンロード速度が遅い場合、次の手順を実行できます。ネットワーク接続を確認し、接続方法を切り替えてみてください。 GIT構成の最適化:ポストバッファーサイズ(Git Config -Global HTTP.Postbuffer 524288000)を増やし、低速制限(GIT Config -Global HTTP.LowsPeedLimit 1000)を減らします。 Gitプロキシ(Git-ProxyやGit-LFS-Proxyなど)を使用します。別のGitクライアント(SourcetreeやGithubデスクトップなど)を使用してみてください。防火を確認してください

ローカルGitコードを更新する方法は? Git Fetchを使用して、リモートリポジトリから最新の変更を引き出します。 Git Merge Origin/<リモートブランチ名>を使用して、地元のブランチへのリモート変更をマージします。合併から生じる競合を解決します。 Git Commit -M "Merge Branch< Remote Branch Name>"を使用してください。マージの変更を送信し、更新を適用します。

gitリポジトリを削除するには、次の手順に従ってください。削除するリポジトリを確認します。リポジトリのローカル削除:RM -RFコマンドを使用して、フォルダーを削除します。倉庫をリモートで削除する:倉庫の設定に移動し、「倉庫の削除」オプションを見つけて、操作を確認します。
