


Kelaskan data dalam Python menggunakan Mesin Vektor Sokongan (SVM)
Mesin Vektor Sokongan (SVM) ialah algoritma pembelajaran diselia yang boleh digunakan untuk tugas klasifikasi dan regresi.
SVM ialah algoritma berkuasa yang boleh digunakan untuk menyelesaikan pelbagai masalah. Ia amat sesuai untuk menyelesaikan masalah di mana data boleh dipisahkan secara linear. Walau bagaimanapun, SVM juga boleh menyelesaikan masalah data yang tidak boleh dipisahkan secara linear dengan menggunakan teknik kernel.
Dalam artikel ini, kami akan meneroka teori di sebalik SVM dan menunjukkan cara melaksanakannya dalam Python untuk klasifikasi data. Kami akan memberikan penjelasan terperinci tentang kod dan outputnya, dan membincangkan teori yang diperlukan.
Ketahui tentang Mesin Vektor Sokongan (SVM)
Mesin vektor sokongan ialah model pembelajaran diselia yang boleh melaksanakan tugas klasifikasi dan regresi. Untuk klasifikasi, matlamat SVM adalah untuk mencari hyperplane optimum yang memisahkan titik data kelas yang berbeza. Hyperplane dengan margin terbesar dari titik data terdekat dianggap sebagai pemisah terbaik. Titik data terdekat ini, juga dikenali sebagai vektor sokongan, memainkan peranan penting dalam menentukan sempadan keputusan.
SVM berfungsi dengan menggunakan fungsi kernel untuk memetakan titik data ke ruang dimensi yang lebih tinggi. Walaupun data tidak boleh dipisahkan secara linear dalam ruang ciri asal, transformasi ini membenarkan pemisahan linear dalam ruang dimensi tinggi. Fungsi kernel yang paling biasa digunakan termasuk linear, polinomial, fungsi asas jejari (RBF), dan sigmoid.
Kelebihan menggunakan SVM
SVM sangat tepat.
SVM sangat teguh kepada bunyi bising.
SVM boleh digunakan untuk menyelesaikan masalah di mana data tidak boleh dipisahkan secara linear.
Kelemahan penggunaan SVM
SVM boleh jadi mahal dari segi pengiraan.
SVM boleh menjadi sensitif kepada hiperparameter.
Contoh 1
SVM boleh dilaksanakan dalam Python menggunakan perpustakaan scikit-learn. Kod berikut menunjukkan cara membuat pengelas SVM dan melatihnya pada set data:
import numpy as np from sklearn.svm import SVC # Load the data data = np.loadtxt("data.csv", delimiter=",") # Split the data into training and test sets X_train, X_test, y_train, y_test = train_test_split(data, data[:, -1], test_size=0.25) # Create an SVM classifier clf = SVC() # Train the classifier clf.fit(X_train, y_train) # Predict the labels of the test set y_pred = clf.predict(X_test) # Evaluate the accuracy of the classifier accuracy = np.mean(y_pred == y_test) print("Accuracy:", accuracy)
Arahan
Barisan pertama mengimport perpustakaan numpy dan sklearn.svm.
Barisan kedua memuatkan data daripada data fail.csv ke dalam pembolehubah bernama data.
Barisan ketiga membahagikan data kepada set latihan dan set ujian. Set latihan digunakan untuk melatih pengelas, dan set ujian digunakan untuk menilai ketepatan pengelas.
Barisan keempat mencipta pengelas SVM.
Barisan kelima melatih pengelas pada set latihan.
Baris keenam meramalkan label set ujian.
Baris ketujuh menilai ketepatan pengelas dengan mengira purata ramalan yang sepadan dengan label set ujian.
Baris kelapan mencetak ketepatan pengelas.
Output
Accuracy: 0.95
Contoh 2
Dalam contoh ini, kami akan menggunakan perpustakaan scikit-learn untuk mengklasifikasikan set data Iris. Set data Iris mengandungi empat ciri: panjang sepal, lebar sepal, panjang kelopak dan lebar kelopak. Matlamatnya adalah untuk mengklasifikasikan setiap bunga sebagai bunga setosa, versicolor, atau virginica.
import numpy as np from sklearn.datasets import load_iris from sklearn.svm import SVC # Load the Iris dataset iris = load_iris() # Create an SVM classifier clf = SVC() # Train the classifier clf.fit(iris.data, iris.target) # Predict the labels of the test set y_pred = clf.predict(iris.data) # Evaluate the accuracy of the classifier accuracy = np.mean(y_pred == iris.target) print("Accuracy:", accuracy)
Arahan
Barisan pertama mengimport perpustakaan numpy dan sklearn.datasets.
Barisan kedua memuatkan set data Iris daripada pustaka sklearn.datasets ke dalam pembolehubah bernama iris.
Barisan ketiga mencipta pengelas SVM.
Barisan keempat melatih pengelas pada set data Iris.
Baris kelima meramalkan label set data Iris.
Baris 6 menilai ketepatan pengelas dengan mengira purata ramalan yang sepadan dengan label set data Iris.
Baris ketujuh mencetak ketepatan pengelas.
Output
Accuracy: 1.0
Kesimpulan
Dalam artikel ini, kami meneroka konsep Mesin Vektor Sokongan (SVM) dan menunjukkan cara melaksanakan klasifikasi SVM dalam Python menggunakan scikit-learn. Kami memperkenalkan teori yang diperlukan di sebalik mesin vektor sokongan, termasuk idea mencari hyperplanes optimum untuk memisahkan kelas mata data yang berbeza. Dengan memanfaatkan pelaksanaan SVM yang disediakan oleh scikit-learn, kami dapat melatih pengelas SVM pada set data Iris dan menilai prestasinya menggunakan skor ketepatan.
Atas ialah kandungan terperinci Kelaskan data dalam Python menggunakan Mesin Vektor Sokongan (SVM). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Penyelesaian kepada Isu Kebenaran Semasa Melihat Versi Python di Terminal Linux Apabila anda cuba melihat versi Python di Terminal Linux, masukkan Python ...

Apabila menggunakan Perpustakaan Pandas Python, bagaimana untuk menyalin seluruh lajur antara dua data data dengan struktur yang berbeza adalah masalah biasa. Katakan kita mempunyai dua DAT ...

Bagaimana Mengajar Asas Pengaturcaraan Pemula Komputer Dalam masa 10 jam? Sekiranya anda hanya mempunyai 10 jam untuk mengajar pemula komputer beberapa pengetahuan pengaturcaraan, apa yang akan anda pilih untuk mengajar ...

Cara mengelakkan dikesan semasa menggunakan fiddlerevery di mana untuk bacaan lelaki-dalam-pertengahan apabila anda menggunakan fiddlerevery di mana ...

Ekspresi biasa adalah alat yang berkuasa untuk memadankan corak dan manipulasi teks dalam pengaturcaraan, meningkatkan kecekapan dalam pemprosesan teks merentasi pelbagai aplikasi.

Bagaimanakah Uvicorn terus mendengar permintaan HTTP? Uvicorn adalah pelayan web ringan berdasarkan ASGI. Salah satu fungsi terasnya ialah mendengar permintaan HTTP dan teruskan ...

Artikel ini membincangkan perpustakaan Python yang popular seperti Numpy, Pandas, Matplotlib, Scikit-Learn, Tensorflow, Django, Flask, dan Permintaan, memperincikan kegunaan mereka dalam pengkomputeran saintifik, analisis data, visualisasi, pembelajaran mesin, pembangunan web, dan h

Di Python, bagaimana untuk membuat objek secara dinamik melalui rentetan dan panggil kaedahnya? Ini adalah keperluan pengaturcaraan yang biasa, terutamanya jika perlu dikonfigurasikan atau dijalankan ...
