ホームページ テクノロジー周辺機器 AI Zhipu AI、国産チップに適合した第 3 世代大型ベースモデルを発売

Zhipu AI、国産チップに適合した第 3 世代大型ベースモデルを発売

Oct 27, 2023 pm 08:21 PM
大型モデル 国産チップス 知的な推論

・第 3 世代の大型ベース モデル ChatGLM3 は、中国語のグラフィックとテキストを理解する能力を向上させ、質問に基づいてインターネット上の関連情報を自動的に検索できるビジュアル モード GPT-4V を目指しています。回答する際には参考文献や記事へのリンクを提供してください。最終テスト モデル ChatGLM3-1.5B および ChatGLM3-3B は、vivo、Xiaomi、Samsung の携帯電話および車両プラットフォームをサポートします。

10月27日、2023年中国コンピュータカンファレンスで、中国のコグニティブ大型モデル会社北京芝埔華庄科技有限公司(以下「芝埔AI」)は、マルチ技術を採用した第3世代ベース大型モデルChatGLM3を発表した。 -段階の強化された予測により、トレーニングがより完全になり、携帯電話に展開できる ChatGLM3-1.5B および ChatGLM3-3B が発売され、vivo、Xiaomi、Samsung などのさまざまな携帯電話や車載プラットフォームがサポートされます。 。

ビジュアルモード GPT-4V を目指して、ChatGLM3 は、10 を超える国際標準画像およびテキスト評価データセットで SOTA (最高のパフォーマンス) を達成した CogVLM のマルチモーダル理解機能を含む、いくつかの新機能の反復アップグレードを実装しました。 。 、 最先端の)。 CogVLM モデルは、中国語のグラフィックスとテキストの理解を向上させ、複雑なターゲット検出を完了し、それにラベルを付けて自動データ アノテーションを完了することができます。レシピは材料の写真に基づいて提供され、対話者の好みに合わせて調整できます。

Zhipu AI、国産チップに適合した第 3 世代大型ベースモデルを発売

レシピは材料の写真に基づいて提供されます。

Zhipu AI の CEO、Zhang Peng 氏は The Paper (www.thepaper.cn) に対し、マルチモーダル大規模モデルは音声、視覚、自然言語のインタラクティブな認識において多くの具体的な進歩を遂げ、将来的にはマルチになると語った。 -モーダル大規模モデルは、より重要な段階に移行し、より多くのモーダルデータが統合される可能性があり、マルチモーダル事前トレーニングにより、大規模モデルの知能または認知能力のさらなる向上にもつながります。

Zhipu AI、国産チップに適合した第 3 世代大型ベースモデルを発売

画像の内容を分析する機能。

ChatGLM3 のコード拡張モジュール コード インタープリターは、ユーザーのニーズに応じてコードを生成および実行し、データ分析やファイル処理などの複雑なタスクを自動的に完了します。 「コード」機能は現在、画像処理、数学的計算、データ分析、その他の使用シナリオをサポートしています。

Zhipu AI、国産チップに適合した第 3 世代大型ベースモデルを発売

ユーザーのニーズに応じてコードを生成し、実行します。

Web 検索の強化 WebGLM のアクセス検索の強化により、質問に基づいてインターネット上の関連情報を自動的に検索し、回答時に参考文献や記事のリンクを提供できます。

ChatGLM3 は AgentTuning テクノロジーを統合し、モデル エージェント機能を有効にし、国内の大規模モデルがツール呼び出し、コード実行、ゲーム、データベース操作、ナレッジ グラフの検索と推論、オペレーティング システム、その他のシナリオをネイティブにサポートできるようにします。

現在、ChatGLM3 は、携帯電話に導入できるエンドテスト モデル ChatGLM3-1.5B および ChatGLM3-3B をリリースしています。これらは、vivo、Xiaomi、Samsung などのさまざまな携帯電話や車載プラットフォームをサポートしています。モバイル プラットフォーム上の CPU チップは 20 トークン/秒の速度です。

Zhipu AI、国産チップに適合した第 3 世代大型ベースモデルを発売

エンドテストモデルChatGLM3-1.5BおよびChatGLM3-3Bは、vivo、Xiaomi、Samsungの携帯電話および車両プラットフォームをサポートしています。

Zhang Peng 氏は、2022 年の初め以来、Zhipu AI によって発売された GLM シリーズ モデルは、Ascend、Sunway Supercomputing、Haiguang DCU アーキテクチャでの大規模な事前トレーニングと推論をサポートしていると述べました。現在、Zhipu AIの製品は10以上の国内ハードウェアエコシステムをサポートしており、国内チップ企業との共同イノベーションは国内ネイティブ大型モデルと国産チップの開発を支援する。

以上がZhipu AI、国産チップに適合した第 3 世代大型ベースモデルを発売の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

ビッグモデルアプリ Tencent Yuanbao がオンラインになりました! Hunyuan がアップグレードされ、どこにでも持ち運べるオールラウンドな AI アシスタントが作成されました ビッグモデルアプリ Tencent Yuanbao がオンラインになりました! Hunyuan がアップグレードされ、どこにでも持ち運べるオールラウンドな AI アシスタントが作成されました Jun 09, 2024 pm 10:38 PM

5月30日、TencentはHunyuanモデルの包括的なアップグレードを発表し、Hunyuanモデルに基づくアプリ「Tencent Yuanbao」が正式にリリースされ、AppleおよびAndroidアプリストアからダウンロードできるようになりました。前のテスト段階のフンユアン アプレット バージョンと比較して、Tencent Yuanbao は、日常生活シナリオ向けの AI 検索、AI サマリー、AI ライティングなどのコア機能を提供し、Yuanbao のゲームプレイもより豊富で、複数の機能を提供します。 、パーソナルエージェントの作成などの新しいゲームプレイ方法が追加されます。 Tencent Cloud 副社長で Tencent Hunyuan 大型モデルの責任者である Liu Yuhong 氏は、「テンセントは、最初に大型モデルを開発しようとはしません。」と述べました。 Tencent Hunyuan の大型モデルは、ビジネス シナリオにおける豊富で大規模なポーランド テクノロジーを活用しながら、ユーザーの真のニーズを洞察します。

Bytedance Beanbao 大型モデルがリリース、Volcano Engine フルスタック AI サービスが企業のインテリジェントな変革を支援 Bytedance Beanbao 大型モデルがリリース、Volcano Engine フルスタック AI サービスが企業のインテリジェントな変革を支援 Jun 05, 2024 pm 07:59 PM

Volcano Engine の社長である Tan Dai 氏は、大規模モデルを実装したい企業は、モデルの有効性、推論コスト、実装の難易度という 3 つの重要な課題に直面していると述べました。複雑な問題を解決するためのサポートとして、適切な基本的な大規模モデルが必要です。また、サービスは低コストの推論を備えているため、大規模なモデルを広く使用できるようになり、企業がシナリオを実装できるようにするためには、より多くのツール、プラットフォーム、アプリケーションが必要になります。 ——Huoshan Engine 01 社長、Tan Dai 氏。大きなビーンバッグ モデルがデビューし、頻繁に使用されています。モデル効果を磨き上げることは、AI の実装における最も重要な課題です。 Tan Dai 氏は、良いモデルは大量に使用することでのみ磨かれると指摘しました。現在、Doubao モデルは毎日 1,200 億トークンのテキストを処理し、3,000 万枚の画像を生成しています。企業による大規模モデルシナリオの実装を支援するために、バイトダンスが独自に開発した豆包大規模モデルが火山を通じて打ち上げられます。

Shengteng AI テクノロジーを使用した秦嶺・秦川交通モデルは、西安のスマート交通イノベーション センターの構築を支援します Shengteng AI テクノロジーを使用した秦嶺・秦川交通モデルは、西安のスマート交通イノベーション センターの構築を支援します Oct 15, 2023 am 08:17 AM

「高度な複雑性、高度な断片化、およびクロスドメイン」は、輸送業界のデジタル化およびインテリジェントなアップグレードに向かう上で常に主要な問題点でした。最近、チャイナビジョン、西安雁塔区政府、西安未来人工知能コンピューティングセンターが共同で構築したパラメータースケール1000億の「秦嶺・秦川交通モデル」は、スマート交通・交通分野を指向している。西安とその周辺地域にサービスを提供しており、この地域はスマート交通イノベーションの拠点となるでしょう。 「秦嶺・秦川交通モデル」は、オープンシナリオにおける西安の膨大な地元交通生態データ、中国科学ビジョンが自社開発したオリジナルの高度なアルゴリズム、そして西安未来人工知能コンピューティングセンターのShengteng AIの強力なコンピューティング能力を組み合わせたものです。道路網の監視を提供するため、緊急指令、メンテナンス管理、公共交通機関などのスマートな交通シナリオは、デジタルでインテリジェントな変化をもたらします。交通管理には都市ごとに異なる特徴があり、道路の交通状況も異なります。

NVIDIA の大規模モデル推論フレームワークを明らかにする: TensorRT-LLM NVIDIA の大規模モデル推論フレームワークを明らかにする: TensorRT-LLM Feb 01, 2024 pm 05:24 PM

1. TensorRT-LLM の製品位置付け TensorRT-LLM は、NVIDIA が開発した大規模言語モデル (LLM) 向けのスケーラブルな推論ソリューションです。 TensorRT 深層学習コンパイル フレームワークに基づいて計算グラフを構築、コンパイル、実行し、FastTransformer の効率的なカーネル実装を利用します。さらに、デバイス間の通信には NCCL を利用します。開発者は、カットラスに基づいてカスタマイズされた GEMM を開発するなど、技術開発や需要の違いに基づいて特定のニーズを満たすためにオペレーターをカスタマイズできます。 TensorRT-LLM は、NVIDIA の公式推論ソリューションであり、高いパフォーマンスを提供し、実用性を継続的に向上させることに尽力しています。 TensorRT-LL

GPT-4をベンチマーク!中国移動の九天大型モデルが二重登録を通過 GPT-4をベンチマーク!中国移動の九天大型モデルが二重登録を通過 Apr 04, 2024 am 09:31 AM

4月4日のニュースによると、中国サイバースペース局は最近、登録された大型モデルのリストを発表し、その中にチャイナモバイルの「九天自然言語インタラクション大型モデル」が含まれており、チャイナモバイルの九天AI大型モデルが生成人工言語を正式に提供できることを示した。外部世界への諜報機関。チャイナモバイルは、これは中央企業が開発した初めての大規模モデルであり、国家の「生成人工知能サービス登録」と「国内深層合成サービスアルゴリズム登録」の二重登録を通過したと述べた。報告によると、Juiutian の自然言語インタラクション大規模モデルは、強化された業界能力、セキュリティ、信頼性の特徴を持ち、フルスタック ローカリゼーションをサポートしており、90 億、139 億、570 億、1000 億などのさまざまなパラメータ バージョンを形成しており、クラウド、エッジ、エンドでは状況が異なりますが、柔軟に導入できます。

新しいテストベンチマークがリリース、最も強力なオープンソースのLlama 3が困惑 新しいテストベンチマークがリリース、最も強力なオープンソースのLlama 3が困惑 Apr 23, 2024 pm 12:13 PM

テストの問題が簡単すぎると、上位の生徒も下位の生徒も 90 点を獲得でき、その差は広がりません。Claude3、Llama3、さらには GPT-5 などのより強力なモデルが後にリリースされるため、業界はより困難で差別化されたモデルのベンチマークが緊急に必要です。大型モデルアリーナの背後にある組織 LMSYS は、次世代ベンチマーク Arena-Hard を発表し、広く注目を集めました。 Llama3 命令の 2 つの微調整されたバージョンの強度に関する最新のリファレンスもあります。全員が同様のスコアを持っていた以前の MTBench と比較すると、アリーナとハードの識別は 22.6% から 87.4% に増加し、一目で強くも弱くもなりました。 Arena-Hard は、アリーナからのリアルタイムの人間データを使用して構築されており、人間の好みとの一致率は 89.1% です。

産業ナレッジグラフの高度な実践 産業ナレッジグラフの高度な実践 Jun 13, 2024 am 11:59 AM

1. 背景の紹介 まず、Yunwen Technology の開発の歴史を紹介します。 Yunwen Technology Company ...2023 年は大規模モデルが普及する時期であり、多くの企業は大規模モデルの後、グラフの重要性が大幅に低下し、以前に検討されたプリセット情報システムはもはや重要ではないと考えています。しかし、RAG の推進とデータ ガバナンスの普及により、より効率的なデータ ガバナンスと高品質のデータが民営化された大規模モデルの有効性を向上させるための重要な前提条件であることがわかり、ますます多くの企業が注目し始めています。知識構築関連コンテンツへ。これにより、知識の構築と処理がより高いレベルに促進され、探索できる技術や方法が数多く存在します。新しいテクノロジーの出現によってすべての古いテクノロジーが打ち破られるわけではなく、新旧のテクノロジーが統合される可能性があることがわかります。

Xiaomi Byteが力を合わせます! Xiao Ai の Doubao へのアクセスの大規模モデル: 携帯電話と SU7 にすでにインストールされています Xiaomi Byteが力を合わせます! Xiao Ai の Doubao へのアクセスの大規模モデル: 携帯電話と SU7 にすでにインストールされています Jun 13, 2024 pm 05:11 PM

6月13日のニュースによると、Byteの「Volcano Engine」公開アカウントによると、Xiaomiの人工知能アシスタント「Xiao Ai」はVolcano Engineとの協力に達し、両社はbeanbao大型モデルに基づいて、よりインテリジェントなAIインタラクティブ体験を実現するとのこと。 。 ByteDance が作成した大規模な豆包モデルは、毎日最大 1,200 億のテキスト トークンを効率的に処理し、3,000 万個のコンテンツを生成できると報告されています。 Xiaomi は、Doubao 大型モデルを使用して、独自モデルの学習能力と推論能力を向上させ、ユーザーのニーズをより正確に把握するだけでなく、より速い応答速度とより包括的なコンテンツ サービスを提供する新しい「Xiao Ai Classmate」を作成しました。たとえば、ユーザーが複雑な科学的概念について質問する場合、&ldq

See all articles