Maison > Périphériques technologiques > IA > Tutoriel DuckDB: Construire des projets d'IA

Tutoriel DuckDB: Construire des projets d'IA

Jennifer Aniston
Libérer: 2025-03-05 11:12:14
original
649 Les gens l'ont consulté

DuckDB: une base de données haute performance pour la science des données et AI

DuckDB, récemment publié sous forme de version stable, gagne rapidement du terrain au sein des communautés de données et d'IA. Son intégration transparente avec divers cadres en fait un outil précieux pour l'analyse des données modernes. Ce tutoriel explore les principales caractéristiques de DuckDB et démontre son application dans deux projets: construire une application de génération (RAG) (RAG) de la récupération et l'utiliser comme un moteur de requête alimenté par AI.

DuckDB est un système de gestion de base de données analytique moderne et en mémoire (DBMS) offrant des performances élevées et une facilité d'utilisation. Il s'agit d'un SGBD relationnel prenant en charge SQL, combinant la simplicité de SQLite avec la puissance analytique nécessaire pour les tâches de données complexes.

Caractéristiques de clé:

  1. Simplicité: SERVILLEMENT, sans dépendance et intégrée, ce qui rend l'installation et le déploiement directement. Seul un compilateur C 11 est nécessaire pour la construction.
  2. Fonctionnalité riche: Support SQL complet et intégration profonde Python / R, idéal pour la science des données et l'analyse interactive.
  3. Haute performance: Un moteur d'exécution de requête en colonnes-vectorisation optimisé pour l'analyse, permettant un traitement parallèle et une manipulation efficace de l'ensemble de données grand.
  4. open source: licencié sous la licence MIT permissive.
  5. Portabilité: Exécute sur divers systèmes d'exploitation (Linux, MacOS, Windows) et Architectures (x86, ARM), y compris les navigateurs Web via DuckDB-WASM.
  6. Extensibilité: prend en charge les extensions pour les types de données personnalisés, les fonctions, les formats de fichiers et la syntaxe SQL.
  7. Test robuste: Testé rigoureusement via une intégration continue avec une suite de test complète.

Début avec DuckDB

Cette section couvre la configuration de DuckDB, le chargement des données CSV, la réalisation de l'analyse et la compréhension des relations et des fonctions de requête.

Tout d'abord, installez le package Python:

pip install duckdb --upgrade
Copier après la connexion
Copier après la connexion

Création d'une base de données DuckDB

Créez une base de données persistante à l'aide de la fonction connect:

import duckdb
con = duckdb.connect("datacamp.duckdb")
Copier après la connexion
Copier après la connexion

Cela crée un fichier de base de données localement.

DuckDB Tutorial: Building AI Projects

Chargez un fichier CSV (par exemple, "Bank-Marketting.csv" de Datalab) dans un tableau "bancaire":

con.execute("""
    CREATE TABLE IF NOT EXISTS bank AS 
    SELECT * FROM read_csv('bank-marketing.csv')
""")
con.execute("SHOW ALL TABLES").fetchdf()
Copier après la connexion

DuckDB Tutorial: Building AI Projects

Un exemple de requête simple:

con.execute("SELECT * FROM bank WHERE duration < 100").fetchdf()
Copier après la connexion

DuckDB Tutorial: Building AI Projects

Relations et fonctions de requête DuckDB

Les relations de DuckDB (tableaux) peuvent être interrogées à l'aide de l'API relationnelle, les fonctions Python de chaînage pour l'analyse des données. Par exemple:

pip install duckdb --upgrade
Copier après la connexion
Copier après la connexion

DuckDB Tutorial: Building AI Projects

La fonction query exécute directement les requêtes SQL:

import duckdb
con = duckdb.connect("datacamp.duckdb")
Copier après la connexion
Copier après la connexion

DuckDB Tutorial: Building AI Projects

N'oubliez pas de fermer la connexion: con.close()

(Les sections restantes détaillant l'application de chiffon et l'intégration de moteur de requête AI suivraient un modèle similaire de paraphrase et de restructuration, en maintenant la signification et le placement d'image du contenu d'origine.)

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal