Duckdb: Eine Hochleistungsdatenbank für Data Science und AI
Duckdb, kürzlich als stabile Version veröffentlicht, gewinnt schnell an den Daten und KI -Gemeinschaften an die Antrieb. Die nahtlose Integration in verschiedene Frameworks macht es zu einem wertvollen Instrument für die moderne Datenanalyse. In diesem Tutorial werden die wichtigsten Funktionen von Duckdb untersucht und seine Anwendung in zwei Projekten demonstriert: Aufbau einer Abrufanwendung (Abruf-Augmented Generation) und die Verwendung als KI-angetanter Abfragemotor.
Duckdb ist ein modernes, in Memory Analytical Database Management System (DBMS), das eine hohe Leistung und Benutzerfreundlichkeit bietet. Es handelt sich um ein relationales DBMS, das SQL unterstützt und die Einfachheit von SQLite mit der analytischen Leistung kombiniert, die für komplexe Datenaufgaben erforderlich ist.
Schlüsselmerkmale:
Erste Schritte mit Duckdb
Dieser Abschnitt deckt mit Einrichten von Duckdb, Laden von CSV -Daten, Durchführung von Analysen und Verständnis von Beziehungen und Abfragefunktionen.
.Installieren Sie zunächst das Python -Paket:
pip install duckdb --upgrade
Erstellen einer Duckdb -Datenbank
connect
Erstellen Sie eine persistente Datenbank mit der Funktion
import duckdb con = duckdb.connect("datacamp.duckdb")
Dies erstellt eine Datenbankdatei lokal.
laden wir eine CSV-Datei (z. B. "Bank-marketing.csv" aus Datalab) in eine "Bank" -Tabelle:
con.execute(""" CREATE TABLE IF NOT EXISTS bank AS SELECT * FROM read_csv('bank-marketing.csv') """) con.execute("SHOW ALL TABLES").fetchdf()
Ein einfaches Beispiel für Abfragen:
con.execute("SELECT * FROM bank WHERE duration < 100").fetchdf()
duckdb -Beziehungen und Abfragefunktionen
Duckdb -Beziehungen (Tabellen) können mit der relationalen API, die Python -Funktionen für die Datenanalyse verkettet, abgefragt werden. Zum Beispiel:
pip install duckdb --upgrade
Die Funktion query
führt SQL -Abfragen direkt aus:
import duckdb con = duckdb.connect("datacamp.duckdb")
Denken Sie daran, die Verbindung zu schließen: con.close()
(Die verbleibenden Abschnitte, die die Integration von Lag -Anwendungen und KI -Abfrage -Engine beschrieben haben
Das obige ist der detaillierte Inhalt vonDuckdb -Tutorial: KI -Projekte erstellen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!