Rumah pembangunan bahagian belakang tutorial php Pembelajaran Mesin dalam PHP: Bina Pengelas Berita Menggunakan Rubix ML

Pembelajaran Mesin dalam PHP: Bina Pengelas Berita Menggunakan Rubix ML

Nov 03, 2024 am 03:33 AM

Machine Learning in PHP: Build a News Classifier Using Rubix ML

pengenalan

Pembelajaran mesin ada di mana-mana—mengesyorkan filem, menandai imej dan kini juga mengklasifikasikan artikel berita. Bayangkan jika anda boleh melakukannya dalam PHP! Dengan Rubix ML, anda boleh membawa kuasa pembelajaran mesin kepada PHP dengan cara yang mudah dan boleh diakses. Panduan ini akan membimbing anda membina pengelas berita mudah yang menyusun artikel ke dalam kategori seperti "Sukan" atau "Teknologi." Pada akhirnya, anda akan mempunyai pengelas berfungsi yang boleh meramalkan kategori untuk artikel baharu berdasarkan kandungannya.

Projek ini sesuai untuk pemula yang ingin menyelami pembelajaran mesin menggunakan PHP dan anda boleh mengikuti kod lengkap di GitHub.

Jadual Kandungan

  1. Apakah itu Rubix ML?
  2. Menyediakan Projek
  3. Mencipta Kelas Klasifikasi Berita
  4. Melatih Model
  5. Meramalkan Sampel Baharu
  6. Pemikiran Akhir

Apakah Rubix ML?

Rubix ML ialah perpustakaan pembelajaran mesin untuk PHP yang membawa alatan dan algoritma ML ke dalam persekitaran mesra PHP. Sama ada anda sedang mengusahakan klasifikasi, regresi, pengelompokan atau pemprosesan bahasa semula jadi, Rubix ML telah membantu anda. Ia membolehkan anda memuatkan dan mempraproses data, melatih model dan menilai prestasi—semuanya dalam PHP.

Rubix ML menyokong pelbagai tugas pembelajaran mesin, seperti:

  • Klasifikasi: Mengkategorikan data, seperti melabelkan e-mel sebagai spam atau bukan spam.
  • Regression: Meramalkan nilai berterusan, seperti harga perumahan.
  • Pengumpulan: Mengumpulkan data tanpa label, seperti mencari segmen pelanggan.
  • Pemprosesan Bahasa Asli (NLP): Bekerja dengan data teks, seperti token dan mengubahnya menjadi format yang boleh digunakan untuk ML.

Mari kita mendalami cara anda boleh menggunakan Rubix ML untuk membina pengelas berita mudah dalam PHP!

Menyediakan Projek

Kami akan mulakan dengan menyediakan projek PHP baharu dengan Rubix ML dan mengkonfigurasi autoloading.

Langkah 1: Mulakan Direktori Projek

Buat direktori projek baharu dan navigasi ke dalamnya:

mkdir NewsClassifier
cd NewsClassifier
Salin selepas log masuk
Salin selepas log masuk

Langkah 2: Pasang Rubix ML dengan Komposer

Pastikan anda telah memasang Komposer, kemudian tambah Rubix ML pada projek anda dengan menjalankan:

composer require rubix/ml
Salin selepas log masuk
Salin selepas log masuk

Langkah 3: Konfigurasikan Autoloading dalam composer.json

Untuk automuat kelas daripada direktori src projek kami, buka atau cipta fail composer.json dan tambahkan konfigurasi berikut:

{
    "autoload": {
        "psr-4": {
            "NewsClassifier\": "src/"
        }
    },
    "require": {
        "rubix/ml": "^2.5"
    }
}
Salin selepas log masuk
Salin selepas log masuk

Ini memberitahu Komposer untuk memuatkan secara automatik mana-mana kelas dalam folder src di bawah ruang nama NewsClassifier.

Langkah 4: Jalankan Dump Autoload Komposer

Selepas menambah konfigurasi autoload, jalankan arahan berikut untuk menjana semula autoloader Komposer:

mkdir NewsClassifier
cd NewsClassifier
Salin selepas log masuk
Salin selepas log masuk

Langkah 5: Struktur Direktori

Direktori projek anda sepatutnya kelihatan seperti ini:

composer require rubix/ml
Salin selepas log masuk
Salin selepas log masuk
  • src/: Mengandungi skrip PHP anda.
  • storan/: Tempat model terlatih akan disimpan.
  • vendor/: Mengandungi kebergantungan yang dipasang oleh Komposer.

Mencipta Kelas Klasifikasi Berita

Dalam src/, buat fail yang dipanggil Classification.php. Fail ini akan mengandungi kaedah untuk melatih model dan meramalkan kategori berita.

{
    "autoload": {
        "psr-4": {
            "NewsClassifier\": "src/"
        }
    },
    "require": {
        "rubix/ml": "^2.5"
    }
}
Salin selepas log masuk
Salin selepas log masuk

Kelas Pengelasan ini mengandungi kaedah untuk:

  • Latih: Cipta dan latih model berasaskan saluran paip.
  • Simpan Model: Simpan model terlatih ke laluan yang ditentukan.
  • Ramalkan: Muatkan model yang disimpan dan ramalkan kategori untuk sampel baharu.

Melatih Model

Buat skrip dipanggil train.php dalam src/ untuk melatih model.

composer dump-autoload
Salin selepas log masuk

Jalankan skrip ini untuk melatih model:

NewsClassifier/
├── src/
│   ├── Classification.php
│   └── train.php
├── storage/
├── vendor/
├── composer.json
└── composer.lock
Salin selepas log masuk

Jika berjaya, anda akan melihat:

<?php

namespace NewsClassifier;

use Rubix\ML\Classifiers\KNearestNeighbors;
use Rubix\ML\Datasets\Labeled;
use Rubix\ML\Datasets\Unlabeled;
use Rubix\ML\PersistentModel;
use Rubix\ML\Pipeline;
use Rubix\ML\Tokenizers\Word;
use Rubix\ML\Transformers\TfIdfTransformer;
use Rubix\ML\Transformers\WordCountVectorizer;
use Rubix\ML\Persisters\Filesystem;

class Classification
{
    private $modelPath;

    public function __construct($modelPath)
    {
        $this->modelPath = $modelPath;
    }

    public function train()
    {
        // Sample data and corresponding labels
        $samples = [
            ['The team played an amazing game of soccer'],
            ['The new programming language has been released'],
            ['The match between the two teams was incredible'],
            ['The new tech gadget has been launched'],
        ];

        $labels = [
            'sports',
            'technology',
            'sports',
            'technology',
        ];

        // Create a labeled dataset
        $dataset = new Labeled($samples, $labels);

        // Set up the pipeline with a text transformer and K-Nearest Neighbors classifier
        $estimator = new Pipeline([
            new WordCountVectorizer(10000, 1, 1, new Word()),
            new TfIdfTransformer(),
        ], new KNearestNeighbors(4));

        // Train the model
        $estimator->train($dataset);

        // Save the model
        $this->saveModel($estimator);

        echo "Training completed and model saved.\n";
    }

    private function saveModel($estimator)
    {
        $persister = new Filesystem($this->modelPath);
        $model = new PersistentModel($estimator, $persister);
        $model->save();
    }

    public function predict(array $samples)
    {
        // Load the saved model
        $persister = new Filesystem($this->modelPath);
        $model = PersistentModel::load($persister);

        // Predict categories for new samples
        $dataset = new Unlabeled($samples);
        return $model->predict($dataset);
    }
}
Salin selepas log masuk

Meramalkan Sampel Baharu

Buat skrip lain, predict.php, dalam src/ untuk mengklasifikasikan artikel baharu berdasarkan model terlatih.

<?php

require __DIR__ . '/../vendor/autoload.php';

use NewsClassifier\Classification;

// Define the model path
$modelPath = __DIR__ . '/../storage/model.rbx';

// Initialize the Classification object
$classifier = new Classification($modelPath);

// Train the model and save it
$classifier->train();
Salin selepas log masuk

Jalankan skrip ramalan untuk mengklasifikasikan sampel:

php src/train.php
Salin selepas log masuk

Output hendaklah menunjukkan setiap teks sampel dengan kategori ramalannya.

Fikiran Akhir

Dengan panduan ini, anda telah berjaya membina pengelas berita mudah dalam PHP menggunakan Rubix ML! Ini menunjukkan bagaimana PHP boleh menjadi lebih serba boleh daripada yang anda fikirkan, membawa masuk keupayaan pembelajaran mesin untuk tugas seperti klasifikasi teks, sistem pengesyoran dan banyak lagi. Kod penuh untuk projek ini tersedia di GitHub.

Percubaan dengan algoritma atau data yang berbeza untuk mengembangkan pengelas. Siapa tahu PHP boleh melakukan pembelajaran mesin? Sekarang anda melakukannya.
Selamat mengekod!

Atas ialah kandungan terperinci Pembelajaran Mesin dalam PHP: Bina Pengelas Berita Menggunakan Rubix ML. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Jelaskan JSON Web Tokens (JWT) dan kes penggunaannya dalam PHP API. Jelaskan JSON Web Tokens (JWT) dan kes penggunaannya dalam PHP API. Apr 05, 2025 am 12:04 AM

JWT adalah standard terbuka berdasarkan JSON, yang digunakan untuk menghantar maklumat secara selamat antara pihak, terutamanya untuk pengesahan identiti dan pertukaran maklumat. 1. JWT terdiri daripada tiga bahagian: header, muatan dan tandatangan. 2. Prinsip kerja JWT termasuk tiga langkah: menjana JWT, mengesahkan JWT dan muatan parsing. 3. Apabila menggunakan JWT untuk pengesahan di PHP, JWT boleh dijana dan disahkan, dan peranan pengguna dan maklumat kebenaran boleh dimasukkan dalam penggunaan lanjutan. 4. Kesilapan umum termasuk kegagalan pengesahan tandatangan, tamat tempoh, dan muatan besar. Kemahiran penyahpepijatan termasuk menggunakan alat debugging dan pembalakan. 5. Pengoptimuman prestasi dan amalan terbaik termasuk menggunakan algoritma tandatangan yang sesuai, menetapkan tempoh kesahihan dengan munasabah,

Bagaimanakah sesi merampas kerja dan bagaimana anda dapat mengurangkannya dalam PHP? Bagaimanakah sesi merampas kerja dan bagaimana anda dapat mengurangkannya dalam PHP? Apr 06, 2025 am 12:02 AM

Sesi rampasan boleh dicapai melalui langkah -langkah berikut: 1. Dapatkan ID Sesi, 2. Gunakan ID Sesi, 3. Simpan sesi aktif. Kaedah untuk mengelakkan rampasan sesi dalam PHP termasuk: 1. Gunakan fungsi Sesi_Regenerate_ID () untuk menjana semula ID Sesi, 2. Data sesi stor melalui pangkalan data, 3.

Apakah penghitungan (enums) dalam Php 8.1? Apakah penghitungan (enums) dalam Php 8.1? Apr 03, 2025 am 12:05 AM

Fungsi penghitungan dalam Php8.1 meningkatkan kejelasan dan jenis keselamatan kod dengan menentukan pemalar yang dinamakan. 1) Penghitungan boleh menjadi bilangan bulat, rentetan atau objek, meningkatkan kebolehbacaan kod dan keselamatan jenis. 2) Penghitungan adalah berdasarkan kelas dan menyokong ciri-ciri berorientasikan objek seperti traversal dan refleksi. 3) Penghitungan boleh digunakan untuk perbandingan dan tugasan untuk memastikan keselamatan jenis. 4) Penghitungan menyokong penambahan kaedah untuk melaksanakan logik kompleks. 5) Pemeriksaan jenis dan pengendalian ralat yang ketat boleh mengelakkan kesilapan biasa. 6) Penghitungan mengurangkan nilai sihir dan meningkatkan keupayaan, tetapi memberi perhatian kepada pengoptimuman prestasi.

Huraikan prinsip -prinsip yang kukuh dan bagaimana ia memohon kepada pembangunan PHP. Huraikan prinsip -prinsip yang kukuh dan bagaimana ia memohon kepada pembangunan PHP. Apr 03, 2025 am 12:04 AM

Penerapan prinsip pepejal dalam pembangunan PHP termasuk: 1. Prinsip Tanggungjawab Tunggal (SRP): Setiap kelas bertanggungjawab untuk hanya satu fungsi. 2. Prinsip Terbuka dan Tutup (OCP): Perubahan dicapai melalui lanjutan dan bukannya pengubahsuaian. 3. Prinsip Penggantian Lisch (LSP): Subkelas boleh menggantikan kelas asas tanpa menjejaskan ketepatan program. 4. Prinsip Pengasingan Antara Muka (ISP): Gunakan antara muka halus untuk mengelakkan kebergantungan dan kaedah yang tidak digunakan. 5. Prinsip Inversi Ketergantungan (DIP): Modul peringkat tinggi dan rendah bergantung kepada abstraksi dan dilaksanakan melalui suntikan ketergantungan.

Bagaimana cara debug mod CLI dalam phpstorm? Bagaimana cara debug mod CLI dalam phpstorm? Apr 01, 2025 pm 02:57 PM

Bagaimana cara debug mod CLI dalam phpstorm? Semasa membangun dengan PHPStorm, kadang -kadang kita perlu debug PHP dalam mod Interface Line Command (CLI) ...

Bagaimana cara menghantar permintaan pos yang mengandungi data JSON menggunakan perpustakaan php curl? Bagaimana cara menghantar permintaan pos yang mengandungi data JSON menggunakan perpustakaan php curl? Apr 01, 2025 pm 03:12 PM

Menghantar data JSON menggunakan perpustakaan Curl PHP dalam pembangunan PHP, sering kali perlu berinteraksi dengan API luaran. Salah satu cara biasa ialah menggunakan perpustakaan curl untuk menghantar post ...

Terangkan pengikatan statik lewat dalam php (statik: :). Terangkan pengikatan statik lewat dalam php (statik: :). Apr 03, 2025 am 12:04 AM

Mengikat statik (statik: :) Melaksanakan pengikatan statik lewat (LSB) dalam PHP, yang membolehkan kelas panggilan dirujuk dalam konteks statik dan bukannya menentukan kelas. 1) Proses parsing dilakukan pada masa runtime, 2) Cari kelas panggilan dalam hubungan warisan, 3) ia boleh membawa overhead prestasi.

See all articles