Table des matières
Début: PostgreSML Free Tier
1. Installation et configuration de Postgres
2. Connexion de la base de données
3. Chargement des données
4. Formation du modèle
Formation de base
Prétraitement
Spécification des hyperparamètres
Tuning hyperparamètre
5. Évaluation du modèle
6. Déploiement du modèle
Maison Périphériques technologiques IA Tutoriel postgresml: faire l'apprentissage automatique avec SQL

Tutoriel postgresml: faire l'apprentissage automatique avec SQL

Mar 07, 2025 am 09:16 AM

La tendance dominante de l'apprentissage automatique consiste à transférer des données dans l'environnement du modèle pour la formation. Cependant, que se passe-t-il si nous inversions ce processus? Étant donné que les bases de données modernes sont nettement plus grandes que les modèles d'apprentissage automatique, ne serait-il pas plus efficace de déplacer les modèles vers les ensembles de données?

Il s'agit du concept fondamental derrière PostgreSML - les données restent à son emplacement et vous apportez votre code à la base de données. Cette approche inversée de l'apprentissage automatique offre de nombreux avantages pratiques qui remettent en question les notions conventionnelles d'une «base de données».

postgresml: un aperçu et ses avantages

PostgreSML est une plate-forme d'apprentissage automatique complète construite sur la base de données PostgreSQL largement utilisée. Il introduit une nouvelle approche appelée apprentissage automatique "en database", vous permettant d'exécuter diverses tâches ML dans SQL sans avoir besoin d'outils distincts pour chaque étape.

PostgresML Tutorial: Doing Machine Learning With SQL

Malgré sa nouveauté relative, PostgreSML offre plusieurs avantages clés:

  • In-Database ML: Traintes, déploie et exécute des modèles ML directement dans votre base de données PostgreSQL. Cela élimine le besoin de transfert de données constant entre la base de données et les cadres ML externes, améliorant l'efficacité et réduisant la latence.
  • API SQL: exploite SQL pour les modèles de formation, de réglage fin et de déploiement d'apprentissage automatique. Cela simplifie les workflows pour les analystes de données et les scientifiques moins familiers avec plusieurs frameworks ML.
  • Modèles pré-formés: intègre de manière transparente à HuggingFace, donnant accès à de nombreux modèles pré-formés comme Llama, Falcon, Bert et Mistral.
  • Personnalisation et flexibilité: prend en charge une large gamme d'algorithmes de Scikit-Learn, XgBoost, LGBM, Pytorch et Tensorflow, permettant de diverses tâches d'apprentissage supervisées directement dans la base de données.
  • Intégration de l'écosystème: Fonctionne avec n'importe quel environnement prenant en charge les Postgres et propose des SDK pour plusieurs langages de programmation (JavaScript, Python et Rust sont particulièrement bien soutenus).

PostgresML Tutorial: Doing Machine Learning With SQL

Ce tutoriel démontrera ces fonctionnalités à l'aide d'un flux de travail d'apprentissage automatique typique:

  1. Chargement des données
  2. Prétraitement des données
  3. Formation du modèle
  4. Hyperparamètre Fineding
  5. Déploiement de la production

Toutes ces étapes seront effectuées dans une base de données Postgres. Commençons!

Un flux de travail d'apprentissage supervisé complet avec postgresml

Début: PostgreSML Free Tier

  1. Créez un compte gratuit à https://www.php.cn/link/3349958a3e56580d4e415da345703886 :

PostgresML Tutorial: Doing Machine Learning With SQL

  1. Sélectionnez le niveau gratuit, qui propose des ressources généreuses:

PostgresML Tutorial: Doing Machine Learning With SQL

Après l'inscription, vous accéderez à votre console postgresml pour gérer les projets et les ressources.

PostgresML Tutorial: Doing Machine Learning With SQL

La section "Gérer" vous permet d'étendre votre environnement en fonction des besoins de calcul.

PostgresML Tutorial: Doing Machine Learning With SQL

1. Installation et configuration de Postgres

PostgreSML nécessite PostgreSQL. Des guides d'installation pour diverses plates-formes sont disponibles:

  • Windows
  • mac os
  • Linux

Pour WSL2, les commandes suivantes suffisent:

sudo apt update
sudo apt install postgresql postgresql-contrib
sudo passwd postgres  # Set a new Postgres password
# Close and reopen your terminal
Copier après la connexion
Copier après la connexion

Vérifiez l'installation:

psql --version
Copier après la connexion
Copier après la connexion

Pour une expérience plus conviviale que le terminal, considérez l'extension VScode.

PostgresML Tutorial: Doing Machine Learning With SQL

2. Connexion de la base de données

Utilisez les détails de la connexion à partir de votre console postgresml:

PostgresML Tutorial: Doing Machine Learning With SQL

Connectez-vous en utilisant psql:

psql -h "host" -U "username" -p 6432 -d "database_name"
Copier après la connexion
Copier après la connexion

Alternativement, utilisez l'extension VScode comme décrit dans sa documentation.

Activer l'extension PGML:

CREATE EXTENSION IF NOT EXISTS pgml;
Copier après la connexion
Copier après la connexion

Vérifiez l'installation:

SELECT pgml.version();
Copier après la connexion
Copier après la connexion

3. Chargement des données

Nous utiliserons l'ensemble de données Diamonds de Kaggle. Téléchargez-le en CSV ou utilisez cet extrait Python:

import seaborn as sns
diamonds = sns.load_dataset("diamonds")
diamonds.to_csv("diamonds.csv", index=False)
Copier après la connexion
Copier après la connexion

Créez le tableau:

CREATE TABLE IF NOT EXISTS diamonds (
   index SERIAL PRIMARY KEY,
   carat FLOAT,
   cut VARCHAR(255),
   color VARCHAR(255),
   clarity VARCHAR(255),
   depth FLOAT,
   table_ FLOAT,
   price INT,
   x FLOAT,
   y FLOAT,
   z FLOAT
);
Copier après la connexion

remplir la table:

INSERT INTO diamonds
   (carat, cut, color, clarity, depth, table_, price, x, y, z)
   FROM '~/full/path/to/diamonds.csv'
   DELIMITER ','
   CSV HEADER;
Copier après la connexion

Vérifiez les données:

SELECT * FROM diamonds LIMIT 10;
Copier après la connexion

PostgresML Tutorial: Doing Machine Learning With SQL

4. Formation du modèle

Formation de base

former un régresseur XGBOost:

SELECT pgml.train(
 project_name => 'Diamond prices prediction',
 task => 'regression',
 relation_name => 'diamonds',
 y_column_name => 'price',
 algorithm => 'xgboost'
);
Copier après la connexion

former un classificateur multi-classes:

SELECT pgml.train(
 project_name => 'Diamond cut quality prediction',
 task => 'classification',
 relation_name => 'diamonds',
 y_column_name => 'cut',
 algorithm => 'xgboost',
 test_size => 0.1
);
Copier après la connexion

Prétraitement

entraîner un modèle forestier aléatoire avec le prétraitement:

SELECT pgml.train(
   project_name => 'Diamond prices prediction',
   task => 'regression',
   relation_name => 'diamonds',
   y_column_name => 'price',
   algorithm => 'random_forest',
   preprocess => '{
       "carat": {"scale": "standard"},
       "depth": {"scale": "standard"},
       "table_": {"scale": "standard"},
       "cut": {"encode": "target", "scale": "standard"},
       "color": {"encode": "target", "scale": "standard"},
       "clarity": {"encode": "target", "scale": "standard"}
   }'::JSONB
);
Copier après la connexion

postgresml fournit diverses options de prétraitement (codage, imputé, échelle).

Spécification des hyperparamètres

Former un régresseur XGBOost avec des hyperparamètres personnalisés:

sudo apt update
sudo apt install postgresql postgresql-contrib
sudo passwd postgres  # Set a new Postgres password
# Close and reopen your terminal
Copier après la connexion
Copier après la connexion

Tuning hyperparamètre

Effectuer une recherche sur la grille:

psql --version
Copier après la connexion
Copier après la connexion

5. Évaluation du modèle

Utiliser pgml.predict pour les prédictions:

psql -h "host" -U "username" -p 6432 -d "database_name"
Copier après la connexion
Copier après la connexion

Pour utiliser un modèle spécifique, spécifiez son identifiant:

CREATE EXTENSION IF NOT EXISTS pgml;
Copier après la connexion
Copier après la connexion

Récupérer les ID du modèle:

SELECT pgml.version();
Copier après la connexion
Copier après la connexion

6. Déploiement du modèle

PostgreSML déploie automatiquement le modèle le mieux performant. Pour un contrôle plus fin, utilisez pgml.deploy:

import seaborn as sns
diamonds = sns.load_dataset("diamonds")
diamonds.to_csv("diamonds.csv", index=False)
Copier après la connexion
Copier après la connexion

Les stratégies de déploiement incluent best_score, most_recent et rollback.

Exploration plus approfondie du postgresml

postgresml s'étend au-delà de l'apprentissage supervisé. La page d'accueil présente un éditeur SQL pour l'expérimentation. La construction d'un service ML orienté consommateur pourrait impliquer:

  1. Création d'une interface utilisateur (par exemple, en utilisant Streamlit ou Taipy).
  2. Développer un backend (python, node.js).
  3. Utilisation de bibliothèques comme psycopg2 ou pg-promise pour l'interaction de la base de données.
  4. Données de prétraitement dans le backend.
  5. déclencher pgml.predict lors de l'interaction utilisateur.

Conclusion

PostgreSML offre une nouvelle approche de l'apprentissage automatique. Pour approfondir votre compréhension, explorez la documentation PostgreSML et envisagez des ressources comme les cours SQL de DataCamp et les tutoriels fondamentaux de l'IA.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Commandes de chat et comment les utiliser
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

J'ai essayé le codage d'ambiance avec Cursor Ai et c'est incroyable! J'ai essayé le codage d'ambiance avec Cursor Ai et c'est incroyable! Mar 20, 2025 pm 03:34 PM

Le codage des ambiances est de remodeler le monde du développement de logiciels en nous permettant de créer des applications en utilisant le langage naturel au lieu de lignes de code sans fin. Inspirée par des visionnaires comme Andrej Karpathy, cette approche innovante permet de dev

Top 5 Genai Lunets de février 2025: GPT-4.5, Grok-3 et plus! Top 5 Genai Lunets de février 2025: GPT-4.5, Grok-3 et plus! Mar 22, 2025 am 10:58 AM

Février 2025 a été un autre mois qui change la donne pour une IA générative, nous apportant certaines des mises à niveau des modèles les plus attendues et de nouvelles fonctionnalités révolutionnaires. De Xai's Grok 3 et Anthropic's Claude 3.7 Sonnet, à Openai's G

Comment utiliser YOLO V12 pour la détection d'objets? Comment utiliser YOLO V12 pour la détection d'objets? Mar 22, 2025 am 11:07 AM

Yolo (vous ne regardez qu'une seule fois) a été un cadre de détection d'objets en temps réel de premier plan, chaque itération améliorant les versions précédentes. La dernière version Yolo V12 introduit des progrès qui améliorent considérablement la précision

Meilleurs générateurs d'art AI (gratuit & amp; payé) pour des projets créatifs Meilleurs générateurs d'art AI (gratuit & amp; payé) pour des projets créatifs Apr 02, 2025 pm 06:10 PM

L'article passe en revue les meilleurs générateurs d'art AI, discutant de leurs fonctionnalités, de leur aptitude aux projets créatifs et de la valeur. Il met en évidence MidJourney comme la meilleure valeur pour les professionnels et recommande Dall-E 2 pour un art personnalisable de haute qualité.

Chatgpt 4 o est-il disponible? Chatgpt 4 o est-il disponible? Mar 28, 2025 pm 05:29 PM

Chatgpt 4 est actuellement disponible et largement utilisé, démontrant des améliorations significatives dans la compréhension du contexte et la génération de réponses cohérentes par rapport à ses prédécesseurs comme Chatgpt 3.5. Les développements futurs peuvent inclure un interg plus personnalisé

Quelle IA est la meilleure que Chatgpt? Quelle IA est la meilleure que Chatgpt? Mar 18, 2025 pm 06:05 PM

L'article traite des modèles d'IA dépassant Chatgpt, comme Lamda, Llama et Grok, mettant en évidence leurs avantages en matière de précision, de compréhension et d'impact de l'industrie. (159 caractères)

Comment utiliser Mistral OCR pour votre prochain modèle de chiffon Comment utiliser Mistral OCR pour votre prochain modèle de chiffon Mar 21, 2025 am 11:11 AM

Mistral OCR: révolutionner la génération de la récupération avec une compréhension du document multimodal Les systèmes de génération (RAG) (RAG) de la récupération ont considérablement avancé les capacités d'IA, permettant à de vastes magasins de données pour une responsabilité plus éclairée

Assistants d'écriture de l'IA pour augmenter votre création de contenu Assistants d'écriture de l'IA pour augmenter votre création de contenu Apr 02, 2025 pm 06:11 PM

L'article traite des meilleurs assistants d'écriture d'IA comme Grammarly, Jasper, Copy.ai, WireSonic et Rytr, en se concentrant sur leurs fonctionnalités uniques pour la création de contenu. Il soutient que Jasper excelle dans l'optimisation du référencement, tandis que les outils d'IA aident à maintenir le ton

See all articles