Maison > Périphériques technologiques > IA > le corps du texte

La version préliminaire de la base de données vectorielle Amazon Cloud Technology est désormais en vente, les hautes performances contribuent à accélérer les applications d'IA

WBOY
Libérer: 2023-11-20 14:43:11
avant
772 Les gens l'ont consulté

Amazon Cloud Technology a lancé sept projets d'innovation en matière d'IA générative lors du sommet de New York du 26 juillet 2023, qui ont encore abaissé le seuil d'utilisation de l'IA générative, permettant aux entreprises de se concentrer davantage sur leur cœur de métier et d'améliorer l'efficacité de leur production. L’un des projets les plus accrocheurs concerne les prochaines innovations liées aux bases de données vectorielles d’Amazon Cloud Technology, pour lesquelles ils ont publié une version préliminaire du moteur vectoriel d’Amazon Cloud Technology

La version préliminaire de la base de données vectorielle Amazon Cloud Technology est désormais en vente, les hautes performances contribuent à accélérer les applications dIA

Récemment, Amazon Cloud Technology a publié une version préliminaire du moteur vectoriel Amazon OpenSearch Serverless. Cette version marque une avancée majeure dans les services de recherche cloud, offrant aux utilisateurs des fonctionnalités de recherche de similarité simples, performantes et évolutives

En février 2023, Amazon Cloud Technology a été classée leader des systèmes de gestion de bases de données cloud par Gartner pendant huit années consécutives. Un tel honneur n'est pas un hasard, mais une pleine affirmation de la quête incessante d'Amazon Cloud Technology en matière d'innovation et d'excellence technologiques.

Alors, quelles sont les performances de la version préliminaire du moteur vectoriel d'Amazon Cloud Technology ? Peut-elle répondre aux attentes du public ?

Nous savons tous qu'à notre époque, l'IA générative est rapidement adoptée par diverses industries car elle peut traiter le Big Data, automatiser la génération de contenu et fournir des réponses interactives de type humain. Les applications d'IA telles que les chatbots intégrés, les systèmes de questions-réponses et les recommandations personnalisées utilisent la recherche et les requêtes en langage naturel pour comprendre la sémantique, l'intention de l'utilisateur et générer des réponses anthropomorphes, qui ont révolutionné l'expérience utilisateur et l'interaction sur les plateformes numériques.

Les applications de recherche d'apprentissage automatique et d'IA générative nécessitent l'utilisation d'intégrations vectorielles pour représenter des formes numériques de texte, d'images, d'audio et de vidéo afin de générer du contenu dynamique. Ces intégrations sont formées sur les données utilisateur pour exprimer la sémantique et le contexte des informations. Ce processus n'a pas besoin de s'appuyer sur des sources de données ou des applications externes. Les utilisateurs espèrent que la base de données vectorielles pourra être facilement créée et rapidement déplacée du prototype vers l'environnement de production afin qu'ils puissent se concentrer sur des applications différenciées

.

La version préliminaire de la base de données vectorielle Amazon Cloud Technology est désormais en vente, les hautes performances contribuent à accélérer les applications dIA

Le moteur vectoriel Amazon OpenSearch Serverless a été lancé en fonction de ces changements de besoins. Il étend les capacités de recherche d'Amazon OpenSearch et peut stocker, rechercher et tracer des milliards d'intégrations vectorielles en temps réel, permettant ainsi la correspondance de similarité et la recherche sémantique sans y penser. . Problèmes d'infrastructures

Par conséquent, ses performances peuvent être résumées grossièrement par les caractéristiques suivantes :

Le contenu réécrit est le suivant : Premièrement, la version d'essai du moteur vectoriel Amazon OpenSearch Serverless est naturellement robuste. Les utilisateurs n’ont pas à se soucier de la sélection, de l’optimisation et de la mise à l’échelle de l’infrastructure backend. Le moteur ajuste automatiquement les ressources pour s'adapter à l'évolution des charges de travail et des demandes, garantissant ainsi des performances rapides et une bonne évolutivité à tout moment. Que le nombre de vecteurs passe de milliers à des centaines de millions, le moteur peut évoluer de manière transparente sans réindexation ni rechargement des données, ce qui rend l'expansion de l'infrastructure plus pratique

Contenu réécrit : Deuxièmement, des ressources informatiques indépendantes. Le moteur vectoriel fournit des ressources informatiques indépendantes pour l'indexation et la recherche de charges de travail, permettant une acquisition, une mise à jour et une suppression transparentes des vecteurs en temps réel, garantissant que les performances des requêtes des utilisateurs ne sont pas affectées. Les données sont stockées à long terme dans Amazon S3 avec les mêmes garanties de durabilité des données. Bien qu'en avant-première, le moteur est conçu pour les environnements de production et dispose de mécanismes de redondance pour faire face aux pannes et aux pannes

Troisièmement, les résultats fournis sont précis et fiables. Les clients utilisent la recherche OpenSearch kNN dans les clusters gérés pour mettre en œuvre une recherche sémantique et des recommandations personnalisées pour les applications. Le moteur vectoriel offre la même expérience utilisateur que l'environnement sans serveur et est simple et facile à utiliser. Le moteur vectoriel sans serveur Amazon OpenSearch est basé sur la fonction de recherche k-plus proche voisin (kNN) du projet OpenSearch. Il prend en charge des indicateurs de distance tels que la distance euclidienne, la distance cosinus et le produit scalaire. Il peut prendre en charge 16 000 dimensions et convient à diverses dimensions de base. modèles et modèles AI/ML peuvent fournir aux utilisateurs des résultats de recherche précis et fiables

.

La version préliminaire de la base de données vectorielle Amazon Cloud Technology est désormais en vente, les hautes performances contribuent à accélérer les applications dIA

Amazon Cloud Technology prévoit de lancer deux fonctionnalités pour réduire les coûts de première collecte des clients. En plus des excellentes performances mentionnées ci-dessus, ils lanceront tout d'abord une nouvelle option de test de développement qui permettra aux utilisateurs de lancer des collections sans sauvegardes ni répliques, réduisant ainsi le coût d'entrée de 50 %. La pérennité des données est toujours assurée via le moteur vectoriel enregistré dans Amazon S3. Deuxièmement, ils fourniront également une configuration de phase initiale de 0,5 ressources OCU, qui pourront être étendues en fonction des besoins réels en matière de charge de travail afin de réduire davantage les coûts. Cette fonctionnalité fonctionne avec des dizaines à des centaines de milliers de vecteurs (selon les dimensions). De plus, Amazon Cloud Technology a réduit l'OCU minimum requis de 4 par heure à 1 par heure pour fournir plus d'assistance

Les ambitions d'Amazon Cloud Technology ne s'arrêtent certainement pas là. Ils continuent également à travailler dur pour optimiser les performances et l'utilisation de la mémoire des graphiques vectoriels, notamment en améliorant des fonctions telles que la mise en cache et la fusion

.

Dans un avenir proche, nous attendons avec impatience qu'Amazon Cloud Technology lance officiellement le moteur vectoriel OpenSearch Serverless. D’ici là, l’IA générative pourrait entrer dans un tout nouveau domaine

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:sohu.com
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal