Maison Périphériques technologiques IA Le « partenaire en or » des grands modèles est là ! Tencent Cloud lance officiellement une base de données vectorielles native d'IA, offrant des capacités de récupération de vecteurs de niveau 1 milliard

Le « partenaire en or » des grands modèles est là ! Tencent Cloud lance officiellement une base de données vectorielles native d'IA, offrant des capacités de récupération de vecteurs de niveau 1 milliard

Jul 06, 2023 am 08:37 AM
大模型 ai原生 向量数据库

Le 4 juillet, Tencent Cloud a officiellement publié la base de données vectorielles AI Native (AI Native) Tencent Cloud VectorDB. Cette base de données peut être largement utilisée dans des scénarios tels que la formation de grands modèles, le raisonnement et la supplémentation de la base de connaissances. Il s'agit de la première base de données vectorielle en Chine qui fournit une IA sur le cycle de vie complet, depuis la couche d'accès, la couche informatique jusqu'à la couche de stockage.

Connues dans l'industrie comme « l'hippocampe » des grands modèles, les bases de données vectorielles sont spécifiquement conçues pour stocker et interroger des données vectorielles. Selon les rapports, la base de données vectorielles de Tencent Cloud prend en charge une échelle de récupération allant jusqu'à 1 milliard de vecteurs, avec une latence contrôlée au niveau de la milliseconde. Par rapport à l'échelle de récupération de base de données de plug-in autonome traditionnelle, l'échelle de récupération est multipliée par 10, et elle également. a une capacité de requête maximale d’un million de niveaux par seconde (QPS).

Tencent Cloud définit la base de données vectorielles AI Native

Avec l'arrivée de l'ère des grands modèles, adopter les grands modèles est devenu une nécessité pour les entreprises.

Les bases de données vectorielles peuvent améliorer considérablement l'efficacité et réduire les coûts en vectorisant les données. Il peut résoudre les problèmes liés aux coûts élevés de pré-formation pour les grands modèles, à l'absence de « mémoire à long terme », aux mises à jour insuffisantes des connaissances et à l'ingénierie complexe des mots d'invite, à briser les limitations temporelles et spatiales des grands modèles et à accélérer la mise en œuvre de grands modèles. modèles dans des scénarios industriels.

Les statistiques montrent que l'utilisation de Tencent Cloud Vector Database pour la classification, la déduplication et le nettoyage des données de pré-entraînement de grands modèles peut atteindre une efficacité 10 fois supérieure par rapport aux méthodes traditionnelles si la base de données vectorielle est utilisée comme base de connaissances externe pour le raisonnement du modèle. cela peut réduire les coûts de 2 à 4 ordres de grandeur.

Il convient de noter que Tencent Cloud a redéfini le paradigme de développement d'AI Native et a fourni une solution d'IA complète pour la couche d'accès, la couche informatique et la couche de stockage, permettant aux utilisateurs de l'appliquer à l'ensemble du cycle de vie de l'utilisation des bases de données vectorielles. capacités.

Plus précisément, au niveau de la couche d'accès, Tencent Cloud Vector Database prend en charge la saisie de texte en langage naturel, adopte la méthode de requête « scalaire + vecteur », prend en charge l'indexation complète de la mémoire et prend en charge jusqu'à un million de requêtes par seconde (QPS) ; couche informatique, le paradigme de développement AI Native peut réaliser des calculs d'IA de données à grande échelle et résoudre des problèmes tels que la segmentation de texte (segmentation) et la vectorisation (intégration) lorsque les entreprises construisent des bases de connaissances du domaine privé au niveau de la couche de stockage, Tencent ; Cloud Vector La base de données prend en charge la distribution intelligente du stockage des données, aidant les entreprises à réduire les coûts de stockage de 50 %.

Le « partenaire en or » des grands modèles est là ! Tencent Cloud lance officiellement une base de données vectorielles native dIA, offrant des capacités de récupération de vecteurs de niveau 1 milliard

Auparavant, il fallait environ un mois aux entreprises pour accéder à un grand modèle. Après avoir utilisé Tencent Cloud Vector Database, cela peut être complété en 3 jours, ce qui réduit considérablement les coûts d'accès de l'entreprise.

Il est entendu que la capacité de vectorisation (intégration) de Tencent Cloud Vector Database a été reconnue à plusieurs reprises par des organisations faisant autorité. En 2021, elle était en tête de la liste MS MARCO et les résultats associés ont été publiés dans le NLP Summit ACL.

Luo Yun, directeur général adjoint de Tencent Cloud Database, a déclaré que l'ère de l'IA Native est arrivée. « Base de données vectorielle + grand modèle + données » produira un « effet volant » et aidera conjointement les entreprises à entrer dans l'ère de l'IA Native. )ère.

La base de données vectorielles Tencent Cloud contribue à améliorer de 10 fois l'efficacité de l'accès aux données

Tencent Cloud Vector Database est basé sur le moteur vectoriel du groupe Tencent (OLAMA) qui traite des centaines de milliards de recherches chaque jour. Après une pratique dans les scénarios massifs internes de Tencent, l'efficacité de l'accès aux données de l'IA est également 10 fois supérieure à celle des solutions traditionnelles. , et la stabilité opérationnelle atteint 99,99 %, a été utilisé dans plus de 30 produits au niveau national tels que Tencent Video, QQ Browser et QQ Music.

La base de données vectorielles Tencent Cloud peut aider efficacement les produits à améliorer leur efficacité opérationnelle. Les données montrent qu'après avoir utilisé Tencent Cloud Vector Database, la durée d'écoute par habitant de QQ Music a augmenté de 3,2 %, la durée d'exposition effective par habitant de Tencent Video a augmenté de 1,74 % et le coût du navigateur QQ a diminué de 37,9 %.

Prenons l'exemple de l'application Tencent Video. Les images, l'audio, le texte du titre et d'autres contenus de la vidéothèque utilisent la base de données vectorielles Tencent Cloud. Le volume mensuel moyen de récupération et de calcul atteint 20 milliards de fois, ce qui répond efficacement aux exigences du droit d'auteur. protection, identification originale, similarité, etc. Récupération sexuelle et autres besoins de la scène.

Les bases de données vectorielles accélérées de grands modèles sont entrées dans une période de développement rapide. Selon Northeast Securities, le marché mondial des bases de données vectorielles devrait atteindre 50 milliards de dollars américains d'ici 2030, et le marché national des bases de données vectorielles devrait dépasser 60 milliards de RMB.

La base de données vectorielles peut aider les entreprises à utiliser les grands modèles de manière plus efficace et plus pratique, en maximisant la valeur des données. Avec le développement et la vulgarisation continus des grands modèles, la base de données vectorielles AI Native deviendra la norme pour le traitement des données d'entreprise.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Repo: Comment relancer ses coéquipiers
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Comment obtenir des graines géantes
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Lancement du grand modèle Bytedance Beanbao, le service d'IA complet Volcano Engine aide les entreprises à se transformer intelligemment Lancement du grand modèle Bytedance Beanbao, le service d'IA complet Volcano Engine aide les entreprises à se transformer intelligemment Jun 05, 2024 pm 07:59 PM

Tan Dai, président de Volcano Engine, a déclaré que les entreprises qui souhaitent bien mettre en œuvre de grands modèles sont confrontées à trois défis clés : l'effet de modèle, le coût d'inférence et la difficulté de mise en œuvre : elles doivent disposer d'un bon support de base de grands modèles pour résoudre des problèmes complexes, et elles doivent également avoir une inférence à faible coût. Les services permettent d'utiliser largement de grands modèles, et davantage d'outils, de plates-formes et d'applications sont nécessaires pour aider les entreprises à mettre en œuvre des scénarios. ——Tan Dai, président de Huoshan Engine 01. Le grand modèle de pouf fait ses débuts et est largement utilisé. Le polissage de l'effet de modèle est le défi le plus critique pour la mise en œuvre de l'IA. Tan Dai a souligné que ce n'est que grâce à une utilisation intensive qu'un bon modèle peut être poli. Actuellement, le modèle Doubao traite 120 milliards de jetons de texte et génère 30 millions d'images chaque jour. Afin d'aider les entreprises à mettre en œuvre des scénarios de modèles à grande échelle, le modèle à grande échelle beanbao développé indépendamment par ByteDance sera lancé à travers le volcan.

L'application de grands modèles Tencent Yuanbao est en ligne ! Hunyuan est mis à niveau pour créer un assistant IA complet pouvant être transporté n'importe où L'application de grands modèles Tencent Yuanbao est en ligne ! Hunyuan est mis à niveau pour créer un assistant IA complet pouvant être transporté n'importe où Jun 09, 2024 pm 10:38 PM

Le 30 mai, Tencent a annoncé une mise à niveau complète de son modèle Hunyuan. L'application « Tencent Yuanbao » basée sur le modèle Hunyuan a été officiellement lancée et peut être téléchargée sur les magasins d'applications Apple et Android. Par rapport à la version de l'applet Hunyuan lors de la phase de test précédente, Tencent Yuanbao fournit des fonctionnalités de base telles que la recherche IA, le résumé IA et l'écriture IA pour les scénarios d'efficacité du travail ; pour les scénarios de la vie quotidienne, le gameplay de Yuanbao est également plus riche et fournit de multiples fonctionnalités d'application IA. , et de nouvelles méthodes de jeu telles que la création d'agents personnels sont ajoutées. « Tencent ne s'efforcera pas d'être le premier à créer un grand modèle. » Liu Yuhong, vice-président de Tencent Cloud et responsable du grand modèle Tencent Hunyuan, a déclaré : « Au cours de l'année écoulée, nous avons continué à promouvoir les capacités de Tencent. Grand modèle Tencent Hunyuan. Dans la technologie polonaise riche et massive dans des scénarios commerciaux tout en obtenant un aperçu des besoins réels des utilisateurs.

Découverte du framework d'inférence de grands modèles NVIDIA : TensorRT-LLM Découverte du framework d'inférence de grands modèles NVIDIA : TensorRT-LLM Feb 01, 2024 pm 05:24 PM

1. Positionnement du produit TensorRT-LLM TensorRT-LLM est une solution d'inférence évolutive développée par NVIDIA pour les grands modèles de langage (LLM). Il crée, compile et exécute des graphiques de calcul basés sur le cadre de compilation d'apprentissage en profondeur TensorRT et s'appuie sur l'implémentation efficace des noyaux dans FastTransformer. De plus, il utilise NCCL pour la communication entre les appareils. Les développeurs peuvent personnaliser les opérateurs pour répondre à des besoins spécifiques en fonction du développement technologique et des différences de demande, comme le développement de GEMM personnalisés basés sur le coutelas. TensorRT-LLM est la solution d'inférence officielle de NVIDIA, engagée à fournir des performances élevées et à améliorer continuellement sa praticité. TensorRT-LL

Nouveau benchmark de test publié, le Llama 3 open source le plus puissant est gêné Nouveau benchmark de test publié, le Llama 3 open source le plus puissant est gêné Apr 23, 2024 pm 12:13 PM

Si les questions du test sont trop simples, les meilleurs étudiants et les mauvais étudiants peuvent obtenir 90 points, et l'écart ne peut pas être creusé... Avec la sortie plus tard de modèles plus puissants tels que Claude3, Llama3 et même GPT-5, l'industrie est en besoin urgent d'un modèle de référence plus difficile et différencié. LMSYS, l'organisation à l'origine du grand modèle Arena, a lancé la référence de nouvelle génération, Arena-Hard, qui a attiré une large attention. Il existe également la dernière référence pour la force des deux versions affinées des instructions Llama3. Par rapport à MTBench, qui avait des scores similaires auparavant, la discrimination Arena-Hard est passée de 22,6 % à 87,4 %, ce qui est plus fort et plus faible en un coup d'œil. Arena-Hard est construit à partir de données humaines en temps réel provenant de l'arène et a un taux de cohérence de 89,1 % avec les préférences humaines.

Référence GPT-4 ! Le grand modèle Jiutian de China Mobile a passé le double enregistrement Référence GPT-4 ! Le grand modèle Jiutian de China Mobile a passé le double enregistrement Apr 04, 2024 am 09:31 AM

Selon des informations du 4 avril, l'Administration du cyberespace de Chine a récemment publié une liste de grands modèles enregistrés, et le « Grand modèle d'interaction du langage naturel Jiutian » de China Mobile y a été inclus, indiquant que le grand modèle Jiutian AI de China Mobile peut officiellement fournir des informations artificielles génératives. services de renseignement vers le monde extérieur. China Mobile a déclaré qu'il s'agit du premier modèle à grande échelle développé par une entreprise centrale à avoir réussi à la fois le double enregistrement national « Enregistrement du service d'intelligence artificielle générative » et le double enregistrement « Enregistrement de l'algorithme de service de synthèse profonde domestique ». Selon les rapports, le grand modèle d'interaction en langage naturel de Jiutian présente les caractéristiques de capacités, de sécurité et de crédibilité améliorées de l'industrie, et prend en charge la localisation complète. Il a formé plusieurs versions de paramètres telles que 9 milliards, 13,9 milliards, 57 milliards et 100 milliards. et peut être déployé de manière flexible dans le Cloud, la périphérie et la fin sont des situations différentes

Afin de fournir un nouveau système de référence et d'évaluation de questions-réponses scientifiques et complexes pour les grands modèles, l'UNSW, Argonne, l'Université de Chicago et d'autres institutions ont lancé conjointement le cadre SciQAG. Afin de fournir un nouveau système de référence et d'évaluation de questions-réponses scientifiques et complexes pour les grands modèles, l'UNSW, Argonne, l'Université de Chicago et d'autres institutions ont lancé conjointement le cadre SciQAG. Jul 25, 2024 am 06:42 AM

L'ensemble de données ScienceAI Question Answering (QA) joue un rôle essentiel dans la promotion de la recherche sur le traitement du langage naturel (NLP). Des ensembles de données d'assurance qualité de haute qualité peuvent non seulement être utilisés pour affiner les modèles, mais également évaluer efficacement les capacités des grands modèles linguistiques (LLM), en particulier la capacité à comprendre et à raisonner sur les connaissances scientifiques. Bien qu’il existe actuellement de nombreux ensembles de données scientifiques d’assurance qualité couvrant la médecine, la chimie, la biologie et d’autres domaines, ces ensembles de données présentent encore certaines lacunes. Premièrement, le formulaire de données est relativement simple, et la plupart sont des questions à choix multiples. Elles sont faciles à évaluer, mais limitent la plage de sélection des réponses du modèle et ne peuvent pas tester pleinement la capacité du modèle à répondre aux questions scientifiques. En revanche, les questions et réponses ouvertes

Pratique avancée du graphe de connaissances industrielles Pratique avancée du graphe de connaissances industrielles Jun 13, 2024 am 11:59 AM

1. Introduction au contexte Tout d’abord, présentons l’historique du développement de la technologie Yunwen. Yunwen Technology Company... 2023 est la période où les grands modèles prédominent. De nombreuses entreprises pensent que l'importance des graphiques a été considérablement réduite après les grands modèles et que les systèmes d'information prédéfinis étudiés précédemment ne sont plus importants. Cependant, avec la promotion du RAG et la prévalence de la gouvernance des données, nous avons constaté qu'une gouvernance des données plus efficace et des données de haute qualité sont des conditions préalables importantes pour améliorer l'efficacité des grands modèles privatisés. Par conséquent, de plus en plus d'entreprises commencent à y prêter attention. au contenu lié à la construction des connaissances. Cela favorise également la construction et le traitement des connaissances à un niveau supérieur, où de nombreuses techniques et méthodes peuvent être explorées. On voit que l'émergence d'une nouvelle technologie ne détruit pas toutes les anciennes technologies, mais peut également intégrer des technologies nouvelles et anciennes.

Xiaomi Byte unit ses forces ! Un grand modèle de l'accès de Xiao Ai à Doubao : déjà installé sur les téléphones mobiles et SU7 Xiaomi Byte unit ses forces ! Un grand modèle de l'accès de Xiao Ai à Doubao : déjà installé sur les téléphones mobiles et SU7 Jun 13, 2024 pm 05:11 PM

Selon les informations du 13 juin, selon le compte public « Volcano Engine » de Byte, l'assistant d'intelligence artificielle de Xiaomi « Xiao Ai » a conclu une coopération avec Volcano Engine. Les deux parties réaliseront une expérience interactive d'IA plus intelligente basée sur le grand modèle beanbao. . Il est rapporté que le modèle beanbao à grande échelle créé par ByteDance peut traiter efficacement jusqu'à 120 milliards de jetons de texte et générer 30 millions de contenus chaque jour. Xiaomi a utilisé le grand modèle Doubao pour améliorer les capacités d'apprentissage et de raisonnement de son propre modèle et créer un nouveau « Xiao Ai Classmate », qui non seulement saisit plus précisément les besoins des utilisateurs, mais offre également une vitesse de réponse plus rapide et des services de contenu plus complets. Par exemple, lorsqu'un utilisateur pose une question sur un concept scientifique complexe, &ldq

See all articles