Tutorial Postgresml: Melakukan Pembelajaran Mesin dengan SQL
Trend semasa dalam pembelajaran mesin melibatkan pemindahan data ke persekitaran model untuk latihan. Walau bagaimanapun, bagaimana jika kita membalikkan proses ini? Memandangkan pangkalan data moden jauh lebih besar daripada model pembelajaran mesin, tidakkah lebih efisien untuk memindahkan model ke dataset?
Ini adalah konsep asas di sebalik PostgreSML - data kekal di lokasinya, dan anda membawa kod anda ke pangkalan data. Pendekatan terbalik kepada pembelajaran mesin menawarkan banyak kelebihan praktikal yang mencabar tanggapan konvensional mengenai "pangkalan data."
postgresml: gambaran keseluruhan dan kelebihannya
PostgreSML adalah platform pembelajaran mesin yang komprehensif yang dibina di atas pangkalan data PostgreSQL yang digunakan secara meluas. Ia memperkenalkan pendekatan novel yang disebut pembelajaran mesin "dalam-data", membolehkan anda melaksanakan pelbagai tugas ML dalam SQL tanpa memerlukan alat berasingan untuk setiap langkah.
- in-data ML: Keretapi, menyebarkan, dan menjalankan model ML secara langsung dalam pangkalan data PostgreSQL anda. Ini menghapuskan keperluan pemindahan data yang berterusan antara pangkalan data dan rangka kerja ML luaran, meningkatkan kecekapan dan mengurangkan latensi.
- SQL API: Leverages SQL untuk latihan, penalaan halus, dan menggunakan model pembelajaran mesin. Ini memudahkan aliran kerja untuk penganalisis data dan saintis kurang akrab dengan pelbagai rangka ML.
- Model pra-terlatih: mengintegrasikan dengan lancar dengan Huggingface, memberikan akses kepada banyak model pra-terlatih seperti Llama, Falcon, Bert, dan Mistral. Penyesuaian dan fleksibiliti: menyokong pelbagai algoritma dari Scikit-learn, XGBoost, LGBM, Pytorch, dan Tensorflow, yang membolehkan pelbagai tugas pembelajaran yang diselia secara langsung dalam pangkalan data. Integrasi Ekosistem
- : Bekerja dengan mana-mana persekitaran yang menyokong postgres dan menawarkan SDK untuk pelbagai bahasa pengaturcaraan (JavaScript, Python, dan Rust sangat disokong dengan baik).
-
pemuatan data
Preprocessing data
- Latihan Model
- HyperParameter Fine-penalaan
- Pengeluaran Pengeluaran
- Semua langkah ini akan dilakukan dalam pangkalan data Postgres. Mari kita mulakan!
- aliran kerja pembelajaran yang diselia lengkap dengan postgresml
Bermula: Postgresml Free Tier
- Buat akaun percuma di https://www.php.cn/link/3349958a3e56580d4e415da345703886 :
- Pilih Tier Percuma, yang menawarkan sumber yang murah hati:
Selepas mendaftar, anda akan mengakses konsol PostgreSML anda untuk menguruskan projek dan sumber.
Bahagian "Mengurus" membolehkan anda skala persekitaran anda berdasarkan keperluan pengiraan.
Postgresml memerlukan PostgreSQL. Panduan pemasangan untuk pelbagai platform boleh didapati:
Windows
mac os
- Linux
- Untuk WSL2, perintah berikut cukup:
- Sahkan pemasangan:
Untuk pengalaman yang lebih mesra pengguna daripada terminal, pertimbangkan lanjutan vscode.
sudo apt update sudo apt install postgresql postgresql-contrib sudo passwd postgres # Set a new Postgres password # Close and reopen your terminal
psql --version
Gunakan butiran sambungan dari konsol postgresml anda:
Sambung menggunakan
:
Sebagai alternatif, gunakan sambungan vSCode seperti yang diterangkan dalam dokumentasinya.
psql
psql -h "host" -U "username" -p 6432 -d "database_name"
3. Pemuatan data
Kami akan menggunakan dataset Diamonds dari Kaggle. Muat turunnya sebagai CSV atau gunakan coretan python ini:
CREATE EXTENSION IF NOT EXISTS pgml;
Buat jadual:
SELECT pgml.version();
mengisi jadual:
Sahkan data:
import seaborn as sns diamonds = sns.load_dataset("diamonds") diamonds.to_csv("diamonds.csv", index=False)
CREATE TABLE IF NOT EXISTS diamonds ( index SERIAL PRIMARY KEY, carat FLOAT, cut VARCHAR(255), color VARCHAR(255), clarity VARCHAR(255), depth FLOAT, table_ FLOAT, price INT, x FLOAT, y FLOAT, z FLOAT );
4. Latihan Model
INSERT INTO diamonds (carat, cut, color, clarity, depth, table_, price, x, y, z) FROM '~/full/path/to/diamonds.csv' DELIMITER ',' CSV HEADER;
melatih regressor xgboost:
SELECT * FROM diamonds LIMIT 10;
melatih pengelas pelbagai kelas:
preprocessing
Melatih model hutan rawak dengan pra -proses:
SELECT pgml.train( project_name => 'Diamond prices prediction', task => 'regression', relation_name => 'diamonds', y_column_name => 'price', algorithm => 'xgboost' );
Menentukan HyperParameters
SELECT pgml.train( project_name => 'Diamond cut quality prediction', task => 'classification', relation_name => 'diamonds', y_column_name => 'cut', algorithm => 'xgboost', test_size => 0.1 );
melatih regressor xgboost dengan hiperparameter tersuai:
sudo apt update sudo apt install postgresql postgresql-contrib sudo passwd postgres # Set a new Postgres password # Close and reopen your terminal
HyperParameter Tuning
Lakukan carian grid:
psql --version
5. Penilaian Model
Gunakan pgml.predict
untuk ramalan:
psql -h "host" -U "username" -p 6432 -d "database_name"
Untuk menggunakan model tertentu, tentukan IDnya:
CREATE EXTENSION IF NOT EXISTS pgml;
Ambil ID Model:
SELECT pgml.version();
6. Model Deployment
PostgreSml secara automatik menggunakan model yang terbaik. Untuk kawalan yang lebih baik, gunakan pgml.deploy
:
import seaborn as sns diamonds = sns.load_dataset("diamonds") diamonds.to_csv("diamonds.csv", index=False)
strategi penempatan termasuk best_score
, most_recent
, dan rollback
.
Penjelajahan lanjut Postgresml
Postgresml melangkaui pembelajaran yang diawasi. Laman web ini mempunyai editor SQL untuk percubaan. Membina perkhidmatan ML yang dihadapi pengguna mungkin melibatkan:
- Membuat antara muka pengguna (mis., Menggunakan Streamlit atau Taipy).
- Membangunkan backend (python, node.js).
- menggunakan perpustakaan seperti
psycopg2
ataupg-promise
untuk interaksi pangkalan data. - data pra -proses di backend.
- mencetuskan
pgml.predict
apabila interaksi pengguna.
Kesimpulan
Postgresml menawarkan pendekatan baru untuk pembelajaran mesin. Untuk melanjutkan pemahaman anda, terokai dokumentasi PostgreSML dan pertimbangkan sumber seperti kursus SQL DataCamp dan tutorial Fundamental AI.
Atas ialah kandungan terperinci Tutorial Postgresml: Melakukan Pembelajaran Mesin dengan SQL. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Artikel ini mengkaji semula penjana seni AI atas, membincangkan ciri -ciri mereka, kesesuaian untuk projek kreatif, dan nilai. Ia menyerlahkan Midjourney sebagai nilai terbaik untuk profesional dan mengesyorkan Dall-E 2 untuk seni berkualiti tinggi dan disesuaikan.

Meta's Llama 3.2: Lompat ke hadapan dalam Multimodal dan Mobile AI META baru -baru ini melancarkan Llama 3.2, kemajuan yang ketara dalam AI yang memaparkan keupayaan penglihatan yang kuat dan model teks ringan yang dioptimumkan untuk peranti mudah alih. Membina kejayaan o

Artikel ini membandingkan chatbots AI seperti Chatgpt, Gemini, dan Claude, yang memberi tumpuan kepada ciri -ciri unik mereka, pilihan penyesuaian, dan prestasi dalam pemprosesan bahasa semula jadi dan kebolehpercayaan.

Artikel ini membincangkan pembantu penulisan AI terkemuka seperti Grammarly, Jasper, Copy.ai, WriteSonic, dan Rytr, yang memberi tumpuan kepada ciri -ciri unik mereka untuk penciptaan kandungan. Ia berpendapat bahawa Jasper cemerlang dalam pengoptimuman SEO, sementara alat AI membantu mengekalkan nada terdiri

Memo CEO Shopify Tobi Lütke baru -baru ini dengan berani mengisytiharkan penguasaan AI sebagai harapan asas bagi setiap pekerja, menandakan peralihan budaya yang signifikan dalam syarikat. Ini bukan trend seketika; Ini adalah paradigma operasi baru yang disatukan ke p

Hei ada, pengekodan ninja! Apa tugas yang berkaitan dengan pengekodan yang anda telah merancang untuk hari itu? Sebelum anda menyelam lebih jauh ke dalam blog ini, saya ingin anda memikirkan semua kesengsaraan yang berkaitan dengan pengekodan anda-lebih jauh menyenaraikan mereka. Selesai? - Let ’

Landskap AI minggu ini: Badai kemajuan, pertimbangan etika, dan perdebatan pengawalseliaan. Pemain utama seperti Openai, Google, Meta, dan Microsoft telah melepaskan kemas kini, dari model baru yang terobosan ke peralihan penting di LE

Artikel ini mengulas penjana suara AI atas seperti Google Cloud, Amazon Polly, Microsoft Azure, IBM Watson, dan Descript, memberi tumpuan kepada ciri -ciri mereka, kualiti suara, dan kesesuaian untuk keperluan yang berbeza.
