7 月 4 日、Tencent Cloud は AI ネイティブ (AI Native) ベクトル データベース Tencent Cloud VectorDB を正式にリリースしました。このデータベースは、大規模モデルのトレーニング、推論、知識ベースの補足などのシナリオで広く使用でき、アクセス層、コンピューティング層、ストレージ層に至るフルライフサイクル AI を提供する中国初のベクトルデータベースです。
業界では大規模モデルの「海馬」として知られるベクトル データベースは、ベクトル データの保存とクエリを行うために特別に設計されています。レポートによると、Tencent Cloud のベクトル データベースは、遅延がミリ秒レベルで制御され、最大 10 億のベクトル検索スケールをサポートしており、従来のスタンドアロンのプラグイン データベースと比較して、検索スケールは 10 倍に増加し、最大クエリ容量は 100 万レベル/秒 (QPS) です。
Tencent Cloud が AI ネイティブ ベクトル データベースを定義
ビッグ モデル時代の到来により、企業にとってビッグ モデルを採用することが不可欠になりました。
ベクトル データベースは、データをベクトル化して保存することで、効率を大幅に向上させ、コストを削減できます。大規模モデルの高い事前トレーニング コスト、「長期記憶」の欠如、不十分な知識更新、複雑なプロンプト ワード エンジニアリングの問題を解決でき、大規模モデルの時間と空間の制限を突破し、大規模なモデルの実装を加速します。業界シナリオのモデル。
統計によると、大規模なモデルの事前トレーニング データの分類、重複排除、クリーニングに Tencent クラウド ベクトル データベースを使用すると、従来の方法と比較して効率が 10 倍向上することが示されています。ベクトル データベースをモデルの外部ナレッジ ベースとして使用する場合そうすれば、コストは 2 ~ 4 桁削減できると考えられます。
Tencent Cloud が AI ネイティブの開発パラダイムを再定義し、アクセス層、コンピューティング層、ストレージ層に包括的な AI ソリューションを提供し、ユーザーがライフサイクル全体を通じてベクトル データベースを使用できるようにしたことは注目に値します。 AI の機能。
具体的には、Tencent Cloud Vector Database は、アクセス層で自然言語テキストの入力をサポートし、「スカラー ベクトル」クエリ方式を採用し、フル メモリ インデックスをサポートし、1 秒あたり最大 100 万クエリ (QPS) をサポートします。コンピューティング層では、AIネイティブ開発パラダイムにより本格的なデータAI計算を実現し、企業がプライベートドメインのナレッジベースを構築する際のテキストセグメンテーション(セグメンテーション)やベクトル化(エンベディング)などの問題をワンストップで解決します。 Tencent Cloud Vector データベースは、データのインテリジェントなストレージ分散をサポートし、企業のストレージ コストを 50% 削減するのに役立ちます。
企業が大規模なモデルにアクセスするには、これまで約 1 か月かかっていましたが、Tencent Cloud Vector Database を使用した後は 3 日で完了できるようになり、企業のアクセス コストが大幅に削減されました。
Tencent Cloud Vector Database のベクトル化 (埋め込み) 能力は権威ある組織によって何度も認められており、2021 年には MS MARCO リストのトップとなり、関連結果は NLP Summit ACL で発表されました。
Tencent Cloud Database副ゼネラルマネージャーのLuo Yun氏は、「AIネイティブの時代が到来した。ベクターデータベースの大規模モデルデータ」とその3つが「フライホイール効果」を生み出し、共同で企業のAI参入を支援すると述べた。ネイティブ時代。)時代。
Tencent Cloud Vector Database により、データ アクセス効率が 10 倍向上します
Tencent Cloud Vector Database は Tencent Group のベクトル エンジン (OLAMA) をベースにしており、毎日数千億件の検索を処理します Tencent 社内の大規模シナリオでの実践後、AI へのデータ アクセスの効率も 10 倍高くなります従来のソリューションと比較して動作安定性が 99.99% と高く、Tencent Video、QQ Browser、QQ Music など 30 以上の国家レベルの製品で使用されています。
Tencent Cloud ベクトル データベースは、製品の運用効率の向上に効果的に役立ちます。データによると、Tencent Cloud Vector Database の使用後、QQ Music の 1 人当たりの聴取時間は 3.2% 増加し、Tencent Video の 1 人当たりの有効露出時間は 1.74% 増加し、QQ Browser のコストは 37.9% 減少しました。
Tencent Video のアプリケーションを例に挙げると、ビデオ ライブラリ内の画像、音声、タイトル テキストなどのコンテンツは Tencent Cloud ベクトル データベースを使用しており、月間平均検索および計算量は最大 200 億回であり、効率的に要件を満たしています。著作権保護とオリジナル識別の必要性、類似性検索、その他のシナリオ要件。
大規模モデル加速ベクトル データベースは急速な発展期に入っています。東北証券の予測によると、世界のベクトル データベース市場は 2030 年までに 500 億米ドルに達し、国内のベクトル データベース市場は 60 人民元を超えると予想されています。十億。
ベクトル データベースは、企業が大規模モデルをより効率的かつ便利に使用してデータの価値を最大化するのに役立ちます。大規模モデルの継続的な開発と普及により、AI ネイティブ ベクトル データベースが企業データ処理の標準になるでしょう。
以上が大型モデルの'ゴールデンパートナー”が登場! Tencent Cloud が AI ネイティブ ベクトル データベースを正式リリースし、10 億レベルのベクトル検索機能を提供の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。