


大型モデルの'ゴールデンパートナー”が登場! Tencent Cloud が AI ネイティブ ベクトル データベースを正式リリースし、10 億レベルのベクトル検索機能を提供
7 月 4 日、Tencent Cloud は AI ネイティブ (AI Native) ベクトル データベース Tencent Cloud VectorDB を正式にリリースしました。このデータベースは、大規模モデルのトレーニング、推論、知識ベースの補足などのシナリオで広く使用でき、アクセス層、コンピューティング層、ストレージ層に至るフルライフサイクル AI を提供する中国初のベクトルデータベースです。
業界では大規模モデルの「海馬」として知られるベクトル データベースは、ベクトル データの保存とクエリを行うために特別に設計されています。レポートによると、Tencent Cloud のベクトル データベースは、遅延がミリ秒レベルで制御され、最大 10 億のベクトル検索スケールをサポートしており、従来のスタンドアロンのプラグイン データベースと比較して、検索スケールは 10 倍に増加し、最大クエリ容量は 100 万レベル/秒 (QPS) です。
Tencent Cloud が AI ネイティブ ベクトル データベースを定義
ビッグ モデル時代の到来により、企業にとってビッグ モデルを採用することが不可欠になりました。
ベクトル データベースは、データをベクトル化して保存することで、効率を大幅に向上させ、コストを削減できます。大規模モデルの高い事前トレーニング コスト、「長期記憶」の欠如、不十分な知識更新、複雑なプロンプト ワード エンジニアリングの問題を解決でき、大規模モデルの時間と空間の制限を突破し、大規模なモデルの実装を加速します。業界シナリオのモデル。
統計によると、大規模なモデルの事前トレーニング データの分類、重複排除、クリーニングに Tencent クラウド ベクトル データベースを使用すると、従来の方法と比較して効率が 10 倍向上することが示されています。ベクトル データベースをモデルの外部ナレッジ ベースとして使用する場合そうすれば、コストは 2 ~ 4 桁削減できると考えられます。
Tencent Cloud が AI ネイティブの開発パラダイムを再定義し、アクセス層、コンピューティング層、ストレージ層に包括的な AI ソリューションを提供し、ユーザーがライフサイクル全体を通じてベクトル データベースを使用できるようにしたことは注目に値します。 AI の機能。
具体的には、Tencent Cloud Vector Database は、アクセス層で自然言語テキストの入力をサポートし、「スカラー ベクトル」クエリ方式を採用し、フル メモリ インデックスをサポートし、1 秒あたり最大 100 万クエリ (QPS) をサポートします。コンピューティング層では、AIネイティブ開発パラダイムにより本格的なデータAI計算を実現し、企業がプライベートドメインのナレッジベースを構築する際のテキストセグメンテーション(セグメンテーション)やベクトル化(エンベディング)などの問題をワンストップで解決します。 Tencent Cloud Vector データベースは、データのインテリジェントなストレージ分散をサポートし、企業のストレージ コストを 50% 削減するのに役立ちます。
企業が大規模なモデルにアクセスするには、これまで約 1 か月かかっていましたが、Tencent Cloud Vector Database を使用した後は 3 日で完了できるようになり、企業のアクセス コストが大幅に削減されました。
Tencent Cloud Vector Database のベクトル化 (埋め込み) 能力は権威ある組織によって何度も認められており、2021 年には MS MARCO リストのトップとなり、関連結果は NLP Summit ACL で発表されました。
Tencent Cloud Database副ゼネラルマネージャーのLuo Yun氏は、「AIネイティブの時代が到来した。ベクターデータベースの大規模モデルデータ」とその3つが「フライホイール効果」を生み出し、共同で企業のAI参入を支援すると述べた。ネイティブ時代。)時代。
Tencent Cloud Vector Database により、データ アクセス効率が 10 倍向上します
Tencent Cloud Vector Database は Tencent Group のベクトル エンジン (OLAMA) をベースにしており、毎日数千億件の検索を処理します Tencent 社内の大規模シナリオでの実践後、AI へのデータ アクセスの効率も 10 倍高くなります従来のソリューションと比較して動作安定性が 99.99% と高く、Tencent Video、QQ Browser、QQ Music など 30 以上の国家レベルの製品で使用されています。
Tencent Cloud ベクトル データベースは、製品の運用効率の向上に効果的に役立ちます。データによると、Tencent Cloud Vector Database の使用後、QQ Music の 1 人当たりの聴取時間は 3.2% 増加し、Tencent Video の 1 人当たりの有効露出時間は 1.74% 増加し、QQ Browser のコストは 37.9% 減少しました。
Tencent Video のアプリケーションを例に挙げると、ビデオ ライブラリ内の画像、音声、タイトル テキストなどのコンテンツは Tencent Cloud ベクトル データベースを使用しており、月間平均検索および計算量は最大 200 億回であり、効率的に要件を満たしています。著作権保護とオリジナル識別の必要性、類似性検索、その他のシナリオ要件。
大規模モデル加速ベクトル データベースは急速な発展期に入っています。東北証券の予測によると、世界のベクトル データベース市場は 2030 年までに 500 億米ドルに達し、国内のベクトル データベース市場は 60 人民元を超えると予想されています。十億。
ベクトル データベースは、企業が大規模モデルをより効率的かつ便利に使用してデータの価値を最大化するのに役立ちます。大規模モデルの継続的な開発と普及により、AI ネイティブ ベクトル データベースが企業データ処理の標準になるでしょう。
以上が大型モデルの'ゴールデンパートナー”が登場! Tencent Cloud が AI ネイティブ ベクトル データベースを正式リリースし、10 億レベルのベクトル検索機能を提供の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









5月30日、TencentはHunyuanモデルの包括的なアップグレードを発表し、Hunyuanモデルに基づくアプリ「Tencent Yuanbao」が正式にリリースされ、AppleおよびAndroidアプリストアからダウンロードできるようになりました。前のテスト段階のフンユアン アプレット バージョンと比較して、Tencent Yuanbao は、日常生活シナリオ向けの AI 検索、AI サマリー、AI ライティングなどのコア機能を提供し、Yuanbao のゲームプレイもより豊富で、複数の機能を提供します。 、パーソナルエージェントの作成などの新しいゲームプレイ方法が追加されます。 Tencent Cloud 副社長で Tencent Hunyuan 大型モデルの責任者である Liu Yuhong 氏は、「テンセントは、最初に大型モデルを開発しようとはしません。」と述べました。 Tencent Hunyuan の大型モデルは、ビジネス シナリオにおける豊富で大規模なポーランド テクノロジーを活用しながら、ユーザーの真のニーズを洞察します。

Volcano Engine の社長である Tan Dai 氏は、大規模モデルを実装したい企業は、モデルの有効性、推論コスト、実装の難易度という 3 つの重要な課題に直面していると述べました。複雑な問題を解決するためのサポートとして、適切な基本的な大規模モデルが必要です。また、サービスは低コストの推論を備えているため、大規模なモデルを広く使用できるようになり、企業がシナリオを実装できるようにするためには、より多くのツール、プラットフォーム、アプリケーションが必要になります。 ——Huoshan Engine 01 社長、Tan Dai 氏。大きなビーンバッグ モデルがデビューし、頻繁に使用されています。モデル効果を磨き上げることは、AI の実装における最も重要な課題です。 Tan Dai 氏は、良いモデルは大量に使用することでのみ磨かれると指摘しました。現在、Doubao モデルは毎日 1,200 億トークンのテキストを処理し、3,000 万枚の画像を生成しています。企業による大規模モデルシナリオの実装を支援するために、バイトダンスが独自に開発した豆包大規模モデルが火山を通じて打ち上げられます。

「高度な複雑性、高度な断片化、およびクロスドメイン」は、輸送業界のデジタル化およびインテリジェントなアップグレードに向かう上で常に主要な問題点でした。最近、チャイナビジョン、西安雁塔区政府、西安未来人工知能コンピューティングセンターが共同で構築したパラメータースケール1000億の「秦嶺・秦川交通モデル」は、スマート交通・交通分野を指向している。西安とその周辺地域にサービスを提供しており、この地域はスマート交通イノベーションの拠点となるでしょう。 「秦嶺・秦川交通モデル」は、オープンシナリオにおける西安の膨大な地元交通生態データ、中国科学ビジョンが自社開発したオリジナルの高度なアルゴリズム、そして西安未来人工知能コンピューティングセンターのShengteng AIの強力なコンピューティング能力を組み合わせたものです。道路網の監視を提供するため、緊急指令、メンテナンス管理、公共交通機関などのスマートな交通シナリオは、デジタルでインテリジェントな変化をもたらします。交通管理には都市ごとに異なる特徴があり、道路の交通状況も異なります。

1. TensorRT-LLM の製品位置付け TensorRT-LLM は、NVIDIA が開発した大規模言語モデル (LLM) 向けのスケーラブルな推論ソリューションです。 TensorRT 深層学習コンパイル フレームワークに基づいて計算グラフを構築、コンパイル、実行し、FastTransformer の効率的なカーネル実装を利用します。さらに、デバイス間の通信には NCCL を利用します。開発者は、カットラスに基づいてカスタマイズされた GEMM を開発するなど、技術開発や需要の違いに基づいて特定のニーズを満たすためにオペレーターをカスタマイズできます。 TensorRT-LLM は、NVIDIA の公式推論ソリューションであり、高いパフォーマンスを提供し、実用性を継続的に向上させることに尽力しています。 TensorRT-LL

4月4日のニュースによると、中国サイバースペース局は最近、登録された大型モデルのリストを発表し、その中にチャイナモバイルの「九天自然言語インタラクション大型モデル」が含まれており、チャイナモバイルの九天AI大型モデルが生成人工言語を正式に提供できることを示した。外部世界への諜報機関。チャイナモバイルは、これは中央企業が開発した初めての大規模モデルであり、国家の「生成人工知能サービス登録」と「国内深層合成サービスアルゴリズム登録」の二重登録を通過したと述べた。報告によると、Juiutian の自然言語インタラクション大規模モデルは、強化された業界能力、セキュリティ、信頼性の特徴を持ち、フルスタック ローカリゼーションをサポートしており、90 億、139 億、570 億、1000 億などのさまざまなパラメータ バージョンを形成しており、クラウド、エッジ、エンドでは状況が異なりますが、柔軟に導入できます。

1. 背景の紹介 まず、Yunwen Technology の開発の歴史を紹介します。 Yunwen Technology Company ...2023 年は大規模モデルが普及する時期であり、多くの企業は大規模モデルの後、グラフの重要性が大幅に低下し、以前に検討されたプリセット情報システムはもはや重要ではないと考えています。しかし、RAG の推進とデータ ガバナンスの普及により、より効率的なデータ ガバナンスと高品質のデータが民営化された大規模モデルの有効性を向上させるための重要な前提条件であることがわかり、ますます多くの企業が注目し始めています。知識構築関連コンテンツへ。これにより、知識の構築と処理がより高いレベルに促進され、探索できる技術や方法が数多く存在します。新しいテクノロジーの出現によってすべての古いテクノロジーが打ち破られるわけではなく、新旧のテクノロジーが統合される可能性があることがわかります。

テストの問題が簡単すぎると、上位の生徒も下位の生徒も 90 点を獲得でき、その差は広がりません。Claude3、Llama3、さらには GPT-5 などのより強力なモデルが後にリリースされるため、業界はより困難で差別化されたモデルのベンチマークが緊急に必要です。大型モデルアリーナの背後にある組織 LMSYS は、次世代ベンチマーク Arena-Hard を発表し、広く注目を集めました。 Llama3 命令の 2 つの微調整されたバージョンの強度に関する最新のリファレンスもあります。全員が同様のスコアを持っていた以前の MTBench と比較すると、アリーナとハードの識別は 22.6% から 87.4% に増加し、一目で強くも弱くもなりました。 Arena-Hard は、アリーナからのリアルタイムの人間データを使用して構築されており、人間の好みとの一致率は 89.1% です。

6月13日のニュースによると、Byteの「Volcano Engine」公開アカウントによると、Xiaomiの人工知能アシスタント「Xiao Ai」はVolcano Engineとの協力に達し、両社はbeanbao大型モデルに基づいて、よりインテリジェントなAIインタラクティブ体験を実現するとのこと。 。 ByteDance が作成した大規模な豆包モデルは、毎日最大 1,200 億のテキスト トークンを効率的に処理し、3,000 万個のコンテンツを生成できると報告されています。 Xiaomi は、Doubao 大型モデルを使用して、独自モデルの学習能力と推論能力を向上させ、ユーザーのニーズをより正確に把握するだけでなく、より速い応答速度とより包括的なコンテンツ サービスを提供する新しい「Xiao Ai Classmate」を作成しました。たとえば、ユーザーが複雑な科学的概念について質問する場合、&ldq
