ホームページ テクノロジー周辺機器 AI 360はZhipu AIと戦略的提携に達し、大規模言語モデル360GLMを共同開発しました

360はZhipu AIと戦略的提携に達し、大規模言語モデル360GLMを共同開発しました

May 25, 2023 am 11:11 AM
戦略的協力 大規模な言語モデル プログラミング研究開発

DoNewsは5月16日、360がZhipu AIと戦略的提携に達したと発表、双方が共同開発した1000億レベルの大型モデル「360GLM」が新世代のレベルに達したと報じた。認知知能の一般的なモデル。

両社は研究開発で協力しており、これは基本モデルとアプリケーションシナリオの効果的な組み合わせでもあります。 360 グループの創設者である周宏儀氏は、マイクロソフトが産業企業として、OpenAI のエンジニアリング、シナリオベース、製品化および商業化の能力を補完してきたと何度も述べてきました。人工知能におけるこの転換点の出現。

周宏毅氏は、中国は大規模テクノロジー企業と主要な科学研究機関のための産学連携イノベーションモデルを確立し、中国の「Microsoft OpenAI」を組み合わせて大規模モデルテクノロジー研究を主導すべきだと考えている。 Zhipu AIとの今回の協力は、産業と研究の間の協力関係を活用していると彼は述べた。

Zhipu AI は中国トップの人工知能テクノロジー企業であり、中国で「最も OpenAI の気質とレベル」を備えた AI 企業として評価されています。 2022年11月、スタンフォード大学大型モデルセンターは、世界の主流大型モデル30社の総合評価を実施し、Zhipu AIが開発したバイリンガル1000億レベルの超大規模事前学習モデルGLM-130Bが唯一の評価を獲得した。アジアで選ばれた大型モデル. 評価の結果、その精度やその他の重要な指標は、OpenAI、Google Brain、Microsoft、NVIDIA などの企業の大規模モデルと近いか同じであることが示されました. 世界 70 か国の 1,000 以上の機関利用申請を行っています。

Zhipu AI チームが開発した ChatGLM は、教師あり微調整およびその他のテクノロジーを通じて GLM-130B で人間の意図の調整を実現し、NVIDIA や Huawei Yiteng、Haiguang、Shenwei などの国産チップによるトレーニングと推論をサポートします。 - 6B モデルは世界中で 160 万回以上ダウンロードされ、Huggingface のグローバル モデル トレンド リストで 2 週連続で 1 位にランクされました。

この協力に関して、Zhipu AI CEO の Zhang Peng 氏は、Zhipu AI は常に独自のビジョンを堅持してきたと述べました。それは、機械に人間のように思考させ、Model as a Service (MaaS) の概念を実現することです。

Zhang Peng氏は、360グループはAI技術の長期蓄積を備えた国内最先端のマルチモーダル研究開発チームを擁し、検索、ブラウザ、その他のシナリオの利点を重ね合わせており、Zhipu AIの強力な研究開発パートナーになるだろうと述べた。同時に、それはトレーニングであり、データ、強化学習、エンジニアリングの最適化、ユーザーシナリオ、商用化の観点から有用な補足をもたらします。両者の緊密な協力により、より広範囲かつより深いシナリオでの大規模モデルテクノロジーの実装が促進され、より多くの業界に力が与えられるでしょう。

360はZhipu AIと戦略的提携に達し、大規模言語モデル360GLMを共同開発しました

今回の提携により、360は「デュアルエンジン」の自主研究開発と共同研究開発を推進する大型モデルレイアウトを形成しました。 3月には、360社が自社開発した1000億レベルの大規模モデル「360GPT」がインテリジェント検索やAI画像生成などのシーン評価で優れた成果を上げている。

360GLMと360GPTという20億レベルのモデルは、それぞれ機能面で優れた利点を持ち、相互に補完し合い、将来的にはアプリケーション層でシームレスに接続され、ユーザーにスムーズなユーザーエクスペリエンスを提供していきます。この協力に基づいて、Zhipu AI は大規模モデル テクノロジーの応用をさらに促進し、深化させ、より多くの業界が効率とユーザー エクスペリエンスを向上できるよう支援していきます。

以上が360はZhipu AIと戦略的提携に達し、大規模言語モデル360GLMを共同開発しましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Groq Llama 3 70B をローカルで使用するためのステップバイステップ ガイド Groq Llama 3 70B をローカルで使用するためのステップバイステップ ガイド Jun 10, 2024 am 09:16 AM

翻訳者 | Bugatti レビュー | Chonglou この記事では、GroqLPU 推論エンジンを使用して JanAI と VSCode で超高速応答を生成する方法について説明します。 Groq は AI のインフラストラクチャ側に焦点を当てているなど、誰もがより優れた大規模言語モデル (LLM) の構築に取り組んでいます。これらの大型モデルがより迅速に応答するためには、これらの大型モデルからの迅速な応答が鍵となります。このチュートリアルでは、GroqLPU 解析エンジンと、API と JanAI を使用してラップトップ上でローカルにアクセスする方法を紹介します。この記事では、これを VSCode に統合して、コードの生成、コードのリファクタリング、ドキュメントの入力、テスト ユニットの生成を支援します。この記事では、独自の人工知能プログラミングアシスタントを無料で作成します。 GroqLPU 推論エンジン Groq の概要

大規模モデルは時系列予測にも非常に強力です。中国チームがLLMの新機能を有効にし、従来のモデルを超えたSOTAを達成 大規模モデルは時系列予測にも非常に強力です。中国チームがLLMの新機能を有効にし、従来のモデルを超えたSOTAを達成 Apr 11, 2024 am 09:43 AM

大規模な言語モデルの可能性が刺激され、大規模な言語モデルをトレーニングすることなく高精度の時系列予測を達成でき、従来のすべての時系列モデルを上回ります。モナシュ大学、Ant、IBM Research は共同で、モダリティ全体で配列データを処理する大規模言語モデルの機能を促進する一般的なフレームワークを開発しました。このフレームワークは重要な技術革新となっています。時系列予測は、都市、エネルギー、交通、リモート センシングなどの典型的な複雑なシステムにおける意思決定に役立ちます。それ以来、大規模モデルは時系列/時空間データ マイニングに革命をもたらすと期待されています。一般大規模言語モデル再プログラミング フレームワーク研究チームは、トレーニングなしで一般的な時系列予測に大規模言語モデルを簡単に使用するための一般的なフレームワークを提案しました。主に 2 つの主要なテクノロジが提案されています: タイミング入力再プログラミング、プロンプト プレフィックス。時間-

GenAI および LLM の技術面接に関する 7 つのクールな質問 GenAI および LLM の技術面接に関する 7 つのクールな質問 Jun 07, 2024 am 10:06 AM

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

OpenHarmony で大規模な言語モデルをローカルにデプロイする OpenHarmony で大規模な言語モデルをローカルにデプロイする Jun 07, 2024 am 10:02 AM

この記事は、第 2 回 OpenHarmony テクノロジー カンファレンスで実証された「OpenHarmony での大規模言語モデルのローカル デプロイメント」の結果をオープンソース化します。オープンソースのアドレス: https://gitee.com/openharmony-sig/tpc_c_cplusplus/blob/master/thirdparty。 /InferLLM/docs/hap_integrate.md。実装のアイデアと手順は、軽量 LLM モデル推論フレームワーク InferLLM を OpenHarmony 標準システムに移植し、OpenHarmony 上で実行できるバイナリ製品をコンパイルすることです。 InferLLM はシンプルで効率的な L

宏蒙スマートトラベルS9とフルシナリオ新製品発売カンファレンス、多数の大ヒット新製品が一緒にリリースされました 宏蒙スマートトラベルS9とフルシナリオ新製品発売カンファレンス、多数の大ヒット新製品が一緒にリリースされました Aug 08, 2024 am 07:02 AM

今日の午後、Hongmeng Zhixingは新しいブランドと新車を正式に歓迎しました。 8月6日、ファーウェイはHongmeng Smart Xingxing S9およびファーウェイのフルシナリオ新製品発表カンファレンスを開催し、パノラマスマートフラッグシップセダンXiangjie S9、新しいM7ProおよびHuawei novaFlip、MatePad Pro 12.2インチ、新しいMatePad Air、Huawei Bisheng Withを発表しました。レーザー プリンタ X1 シリーズ、FreeBuds6i、WATCHFIT3、スマート スクリーン S5Pro など、スマート トラベル、スマート オフィスからスマート ウェアに至るまで、多くの新しいオールシナリオ スマート製品を開発し、ファーウェイは消費者にスマートな体験を提供するフル シナリオのスマート エコシステムを構築し続けています。すべてのインターネット。宏孟志興氏:スマートカー業界のアップグレードを促進するための徹底的な権限付与 ファーウェイは中国の自動車業界パートナーと提携して、

大規模言語モデルの空間推論能力を刺激する: 思考の視覚化のヒント 大規模言語モデルの空間推論能力を刺激する: 思考の視覚化のヒント Apr 11, 2024 pm 03:10 PM

大規模言語モデル (LLM) は、言語理解とさまざまな推論タスクにおいて優れたパフォーマンスを示します。しかし、人間の認知の重要な側面である空間推論におけるそれらの役割は、依然として十分に研究されていません。人間には、心の目として知られるプロセスを通じて、目に見えない物体や行動の精神的なイメージを作成する能力があり、目に見えない世界を想像することが可能になります。この認知能力に触発されて、研究者らは「思考の視覚化」(VoT)を提案しました。 VoT は、LLM の推論の兆候を視覚化することで LLM の空間推論をガイドし、それによって後続の推論ステップをガイドすることを目的としています。研究者は、自然言語ナビゲーション、視覚などのマルチホップ空間推論タスクに VoT を適用します。

Tao Dacheng のチームは、香港大学および UMD と共同で、374 件の関連著作を要約し、LLM 知識蒸留に関する最新のレビューを発表しました。 Tao Dacheng のチームは、香港大学および UMD と共同で、374 件の関連著作を要約し、LLM 知識蒸留に関する最新のレビューを発表しました。 Mar 18, 2024 pm 07:49 PM

大規模言語モデル (LLM) は過去 2 年間で急速に発展し、GPT-4、Gemini、Claude などのいくつかの驚異的なモデルや製品が登場しましたが、それらのほとんどはクローズド ソースです。現在研究コミュニティが利用できるほとんどのオープンソース LLM とクローズドソース LLM の間には大きな隔たりがあるため、オープンソース LLM やその他の小規模モデルの機能を改善して、クローズドソースの大規模モデルとの隔たりを減らすことが研究のホットスポットとなっています。この分野で。 LLM、特にクローズドソース LLM の強力な機能により、科学研究者や産業従事者は、独自のモデルをトレーニングする際に、これらの大規模モデルの出力と知識を利用できます。このプロセスは本質的に知識の蒸留です (Knowledge、Dist

大規模な言語モデルで一般的に使用される回転位置エンコーディング RoPE の詳細な説明: なぜ絶対位置エンコーディングや相対位置エンコーディングよりも優れているのですか? 大規模な言語モデルで一般的に使用される回転位置エンコーディング RoPE の詳細な説明: なぜ絶対位置エンコーディングや相対位置エンコーディングよりも優れているのですか? Apr 01, 2024 pm 08:19 PM

2017 年に発表された「tentionIsAllYouNeed」論文以来、Transformer アーキテクチャは自然言語処理 (NLP) 分野の基礎となってきました。その設計は長年にわたってほとんど変わっておらず、2022 年にはロータリー ポジション エンコーディング (RoPE) の導入によりこの分野で大きな発展が見られました。回転位置埋め込みは、最先端の NLP 位置埋め込み技術です。最も一般的な大規模言語モデル (Llama、Llama2、PaLM、CodeGen など) はすでにこれを使用しています。この記事では、回転位置エンコーディングとは何か、また、回転位置エンコーディングが絶対位置エンコーディングと相対位置エンコーディングの利点をどのようにうまく組み合わせているのかについて詳しく説明します。 Ro を理解するための位置エンコーディングの必要性

See all articles