


Langer Text kann RAG nicht töten: SQL+-Vektor steuert große Modelle und das neue Paradigma von Big Data, die MyScale AI-Datenbank ist offiziell Open Source
Die Kombination aus großen Modellen und KI-Datenbanken ist zu einer Erfolgsformel geworden, um die Kosten zu senken, die Effizienz großer Modelle zu steigern und Big Data wirklich intelligent zu machen.
Spezialisierte Vektordatenbanken, vertreten durch Pinecone/Weaviate/Milvus, sind von Anfang an für die Vektorabfrage konzipiert und gebaut, aber die allgemeine Datenverwaltungsfunktion ist schwach. Die von Elasticsearch/OpenSearch repräsentierten Schlüsselwort- und Vektor-Retrieval-Systeme werden aufgrund ihrer vollständigen Schlüsselwort-Retrieval-Funktionen häufig in der Produktion eingesetzt. Sie beanspruchen jedoch viele Systemressourcen und die gemeinsame Abfragegenauigkeit und Leistung von Schlüsselwörtern und Vektoren sind nicht zufriedenstellend . Die Leute bekommen, was sie wollen. SQL-Vektordatenbanken, dargestellt durch pgvector (Vektorsuch-Plug-in für PostgreSQL) und MyScale AI-Datenbank, basieren auf SQL und verfügen über leistungsstarke Datenverwaltungsfunktionen. Aufgrund der Nachteile der PostgreSQL-Zeilenspeicherung und der Einschränkungen von Vektoralgorithmen weist pgvector jedoch eine geringe Genauigkeit bei komplexen Vektorabfragen auf.
Dank der langfristigen Politur der SQL-Datenbank in Szenarios mit massiven strukturierten Daten unterstützt MyScaleDB
In tatsächlichen komplexen KI-Anwendungsszenarien kann die Kombination von SQL und Vektoren die Flexibilität der Datenmodellierung erheblich erhöhen und den Entwicklungsprozess vereinfachen. Im Science Navigator-Projekt, das zwischen dem MyScale-Team und dem Beijing Institute of Scientific Intelligence kooperiert, wird MyScaleDB beispielsweise verwendet, um umfangreiche wissenschaftliche Literaturdaten abzurufen und intelligente Fragen zu beantworten. Es gibt mehr als 10 Haupt-SQL-Tabellenstrukturen, von denen viele etabliert sind Vektoren und invertierter Tabellenindex, und verwenden Sie den Primärschlüssel und den Fremdschlüssel, um die Zuordnung herzustellen. Bei tatsächlichen Abfragen umfasst das System auch gemeinsame Abfragen von strukturierten Daten, Vektor- und Schlüsselwortdaten sowie zugehörige Abfragen mehrerer Tabellen. Diese Modellierung und Korrelationen sind in einer dedizierten Vektordatenbank schwer zu erreichen, was auch zu einer langsamen Iteration des endgültigen Systems, ineffizienten Abfragen und schwieriger Wartung führt.
Schematische Darstellung der Haupttabellenstruktur von NScience Navigator (Spalten mit fett gedruckten Körpern erstellen Vektorindizes oder invertierte Indizes) Genauigkeit und Wirkung des Abrufs sind die größten Engpässe, die seine Umsetzung einschränken. Dies erfordert, dass die KI-Datenbank gemeinsame Abfragen von Struktur-, Vektor- und Schlüsselwortdaten effizient unterstützt, um die Abrufgenauigkeit umfassend zu verbessern.
und kann
. Das MyScale-Team hat bereits die Implementierung dieser Lösung in der wissenschaftlichen Forschung, im Finanzwesen, in der Industrie, in der Medizin und in anderen Bereichen untersucht.
Das obige ist der detaillierte Inhalt vonLanger Text kann RAG nicht töten: SQL+-Vektor steuert große Modelle und das neue Paradigma von Big Data, die MyScale AI-Datenbank ist offiziell Open Source. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Anzeichen einer Erholung im NFT -Markt! Der Mocaverse-Bodenpreis stieg mit einer 24-Stunden-Steigerung von bis zu 79%. Dieses erhebliche Wachstum hat vom Markt weit verbreitet. Der Mokaverse -Bodenpreisdiagramm NFT -Sektor führt die Daten von Crypto Market Coingecko aus, dass der gesamte Krypto -Markt in den letzten 24 Stunden gestiegen ist, während der NFT -Sektor die Liste mit einem Anstieg von 8,53%antritt. Einige Projekte sind besonders gut

In der Bibliothek, die für den Betrieb der Schwimmpunktnummer in der GO-Sprache verwendet wird, wird die Genauigkeit sichergestellt, wie die Genauigkeit ...

Forscher der Shanghai Jiaotong University, Shanghai Ailab und der chinesischen Universität von Hongkong haben das Open-Source-Projekt zur Visual-RFT (visuelle Verbesserung der Feinabstimmung) gestartet, für das nur eine geringe Datenmenge erforderlich ist, um die Leistung des visuellen Sprachen-Big-Modells (LVLM) signifikant zu verbessern. Visual-RFT kombiniert geschickt die regelbasierte Verstärkungslernansatz von Deepseek-R1 mit dem RFT-Paradigma (Verstärkung der Verstärkung der Verstärkung) und erweitert diesen Ansatz erfolgreich vom Textfeld auf das Gesichtsfeld. Durch die Gestaltung der entsprechenden Regelprämien für Aufgaben wie die visuelle Unterkategorisierung und Objekterkennung überwindet die visuelle RFT die Einschränkungen der Deepseek-R1-Methode, die auf Text, mathematisches Denken und andere Bereiche beschränkt ist und eine neue Möglichkeit für das LVLM-Training bietet. Vis

Wöchentliche Beobachtung: Unternehmen, die Bitcoin horten - ein Brauenwechsel Ich weise oft auf einige übersehene Markttrends in wöchentlichen Memos. Der Schritt von MicroStrategy ist ein starkes Beispiel. Viele Menschen mögen sagen: "Microstrategy und Michaelsaylor sind bereits bekannt, worauf werden Sie achten?" Diese Ansicht ist einseitig. Eingehende Untersuchungen zur Einführung von Bitcoin als Reserve-Vermögenswert in den letzten Monaten zeigen, dass dies kein isolierter Fall ist, sondern ein wichtiger Trend, der sich herausstellt. Ich gehe davon aus, dass in den nächsten 12 bis 18 Monaten Hunderte von Unternehmen dem Beispiel folgen und große Mengen Bitcoin kaufen werden

GitePages statische Website -Bereitstellung fehlgeschlagen: 404 Fehlerbehebung und Auflösung bei der Verwendung von Gitee ...

Welche Bibliotheken in GO werden von großen Unternehmen oder bekannten Open-Source-Projekten entwickelt? Bei der Programmierung in Go begegnen Entwickler häufig auf einige häufige Bedürfnisse, ...

Frage Beschreibung: Wie erhalten Sie die Daten der Versandregion der Überseeversion? Gibt es bereitgestellte Ressourcen? Werden Sie im grenzüberschreitenden E-Commerce oder im globalisierten Geschäft genau ...

Ausführen des H5 -Projekts erfordert die folgenden Schritte: Installation der erforderlichen Tools wie Webserver, Node.js, Entwicklungstools usw. Erstellen Sie eine Entwicklungsumgebung, erstellen Sie Projektordner, initialisieren Sie Projekte und schreiben Sie Code. Starten Sie den Entwicklungsserver und führen Sie den Befehl mit der Befehlszeile aus. Vorschau des Projekts in Ihrem Browser und geben Sie die Entwicklungsserver -URL ein. Veröffentlichen Sie Projekte, optimieren Sie Code, stellen Sie Projekte bereit und richten Sie die Webserverkonfiguration ein.
