Rumah pembangunan bahagian belakang Tutorial Python Contoh analisis komponen utama dalam Python

Contoh analisis komponen utama dalam Python

Jun 10, 2023 am 08:19 AM
analisis data pengaturcaraan python Analisis komponen utama (pca)

Contoh Analisis Komponen Utama dalam Python

Analisis Komponen Utama (PCA) ialah kaedah yang biasa digunakan untuk pengurangan dimensi data Ia boleh mengurangkan dimensi data berdimensi tinggi kepada berdimensi rendah sambil mengekalkan seberapa banyak data mungkin lebih banyak maklumat variasi data. Python menyediakan banyak perpustakaan dan alatan untuk melaksanakan PCA Artikel ini menggunakan contoh untuk memperkenalkan cara menggunakan perpustakaan sklearn dalam Python untuk melaksanakan PCA.

Pertama, kita perlu menyediakan set data. Artikel ini akan menggunakan set data Iris, yang mengandungi 150 data sampel Setiap sampel mempunyai 4 nilai ciri (panjang dan lebar kelopak, panjang dan lebar kelopak), dan label (jenis. bunga iris). Matlamat kami adalah untuk mengurangkan dimensi empat ciri ini dan mencari komponen utama yang paling penting.

Pertama, kita perlu mengimport pustaka dan set data yang diperlukan.

from sklearn.datasets import load_iris
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt

iris = load_iris()
X = iris.data
y = iris.target
Salin selepas log masuk

Kini kita boleh mencipta objek PCA dan menerapkannya.

pca = PCA(n_components=2)
X_pca = pca.fit_transform(X)
Salin selepas log masuk

Objek PCA di sini menetapkan n_components=2, yang bermaksud bahawa kami hanya mahu memaparkan data kami yang diproses pada satah dua dimensi. Kami menggunakan fit_transform pada data asal X dan mendapatkan set data yang diproses X_pca.

Kini kita boleh merancang hasilnya.

plt.scatter(X_pca[:, 0], X_pca[:, 1], c=y)
plt.xlabel('Component 1')
plt.ylabel('Component 2')
plt.show()
Salin selepas log masuk

Dalam rajah ini, kita dapat melihat taburan set data Iris dalam ruang dua dimensi yang dikurangkan. Setiap titik mewakili sampel bunga iris, dan warna mewakili jenis bunga iris.

Sekarang mari kita lihat komponen utama yang sepatutnya.

print(pca.components_)
Salin selepas log masuk

Ini akan mengeluarkan dua vektor, dipanggil "Komponen 1" dan "Komponen 2".

[[ 0.36158968 -0.08226889 0.85657211 0.35884393]
[-0.65653988 -0.72971237 0.1757674] Setiap satu <1757674 mewakili berat ciri dalam data asal. Dalam erti kata lain, kita boleh memikirkan komponen utama sebagai vektor yang digunakan untuk menggabungkan ciri asal secara linear. Setiap vektor dalam hasil adalah vektor unit.

Kita juga boleh melihat jumlah varians dalam data yang dijelaskan oleh setiap komponen.

print(pca.explained_variance_ratio_)
Salin selepas log masuk

Output ini akan menunjukkan perkadaran varians dalam data yang dijelaskan oleh setiap komponen.

[0.92461621 0.05301557]

Kita dapat lihat bahawa kedua-dua komponen ini menerangkan sejumlah 94% varians dalam data. Ini bermakna kita boleh menangkap ciri-ciri data dengan sangat tepat.

Satu perkara yang perlu diambil perhatian ialah PCA akan mengalih keluar semua ciri daripada data asal. Oleh itu, jika kita perlu mengekalkan ciri tertentu, kita perlu mengalih keluarnya secara manual sebelum menggunakan PCA.

Ini ialah contoh cara melaksanakan PCA menggunakan perpustakaan sklearn dalam Python. PCA boleh digunakan pada semua jenis data dan membantu kami menemui komponen paling penting daripada data berdimensi tinggi. Jika anda boleh memahami kod dalam artikel ini, anda juga akan dapat menggunakan PCA pada set data anda sendiri.

Atas ialah kandungan terperinci Contoh analisis komponen utama dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Baca fail CSV dan lakukan analisis data menggunakan panda Baca fail CSV dan lakukan analisis data menggunakan panda Jan 09, 2024 am 09:26 AM

Pandas ialah alat analisis data yang berkuasa yang boleh membaca dan memproses pelbagai jenis fail data dengan mudah. Antaranya, fail CSV ialah salah satu daripada format fail data yang paling biasa dan biasa digunakan. Artikel ini akan memperkenalkan cara menggunakan Panda untuk membaca fail CSV dan melakukan analisis data serta memberikan contoh kod khusus. 1. Import perpustakaan yang diperlukan Mula-mula, kita perlu mengimport perpustakaan Pandas dan perpustakaan lain yang berkaitan yang mungkin diperlukan, seperti yang ditunjukkan di bawah: importpandasaspd 2. Baca fail CSV menggunakan Pan

Pengenalan kepada kaedah analisis data Pengenalan kepada kaedah analisis data Jan 08, 2024 am 10:22 AM

Kaedah analisis data biasa: 1. Kaedah analisis perbandingan 3. Kaedah analisis silang 5. Kaedah analisis sebab dan akibat , Kaedah analisis komponen utama 9. Kaedah analisis serakan 10. Kaedah analisis matriks. Pengenalan terperinci: 1. Kaedah analisis perbandingan: Analisis perbandingan dua atau lebih data untuk mencari perbezaan dan corak 2. Kaedah analisis struktur: Kaedah analisis perbandingan antara setiap bahagian keseluruhan dan keseluruhan; , dsb.

Penggunaan fungsi sqrt() dalam Python Penggunaan fungsi sqrt() dalam Python Feb 21, 2024 pm 03:09 PM

Contoh penggunaan dan kod fungsi sqrt() dalam Python 1. Fungsi dan pengenalan fungsi sqrt() Dalam pengaturcaraan Python, fungsi sqrt() ialah fungsi dalam modul matematik, dan fungsinya adalah untuk mengira punca kuasa dua bagi nombor. Punca kuasa dua bermaksud nombor yang didarab dengan sendirinya sama dengan kuasa dua nombor itu, iaitu, x*x=n, maka x ialah punca kuasa dua bagi n. Fungsi sqrt() boleh digunakan dalam atur cara untuk mengira punca kuasa dua. 2. Cara menggunakan fungsi sqrt() dalam Python, sq

11 pengedaran asas yang saintis data menggunakan 95% masa 11 pengedaran asas yang saintis data menggunakan 95% masa Dec 15, 2023 am 08:21 AM

Berikutan inventori terakhir "11 Saintis Data Carta Asas Menggunakan 95% Masa", hari ini kami akan membawakan kepada anda 11 pengedaran asas yang digunakan oleh saintis data 95% daripada masa. Menguasai pengedaran ini membantu kami memahami sifat data dengan lebih mendalam dan membuat inferens dan ramalan yang lebih tepat semasa analisis data dan membuat keputusan. 1. Taburan Normal Taburan Normal, juga dikenali sebagai Taburan Gaussian, ialah taburan kebarangkalian berterusan. Ia mempunyai lengkung berbentuk loceng simetri dengan min (μ) sebagai pusat dan sisihan piawai (σ) sebagai lebar. Taburan normal mempunyai nilai aplikasi penting dalam banyak bidang seperti statistik, teori kebarangkalian, dan kejuruteraan.

Bagaimana untuk melakukan pemprosesan dan pengecaman imej dalam Python Bagaimana untuk melakukan pemprosesan dan pengecaman imej dalam Python Oct 20, 2023 pm 12:10 PM

Cara melakukan pemprosesan dan pengecaman imej dalam Python Ringkasan: Teknologi moden telah menjadikan pemprosesan dan pengecaman imej sebagai alat penting dalam banyak bidang. Python ialah bahasa pengaturcaraan yang mudah dipelajari dan digunakan dengan pemprosesan imej yang kaya dan perpustakaan pengecaman. Artikel ini akan memperkenalkan cara menggunakan Python untuk pemprosesan dan pengecaman imej, serta memberikan contoh kod khusus. Pemprosesan imej: Pemprosesan imej ialah proses melaksanakan pelbagai operasi dan transformasi pada imej untuk meningkatkan kualiti imej, mengekstrak maklumat daripada imej, dsb. Perpustakaan PIL dalam Python (Pi

11 Visualisasi Lanjutan untuk Analisis Data dan Pembelajaran Mesin 11 Visualisasi Lanjutan untuk Analisis Data dan Pembelajaran Mesin Oct 25, 2023 am 08:13 AM

Visualisasi ialah alat yang berkuasa untuk menyampaikan corak dan hubungan data yang kompleks dengan cara yang intuitif dan mudah difahami. Mereka memainkan peranan penting dalam analisis data, memberikan cerapan yang selalunya sukar untuk dibezakan daripada data mentah atau perwakilan berangka tradisional. Visualisasi adalah penting untuk memahami corak dan perhubungan data yang kompleks, dan kami akan memperkenalkan 11 carta paling penting dan mesti diketahui yang membantu mendedahkan maklumat dalam data dan menjadikan data kompleks lebih mudah difahami dan bermakna. 1. KSPlotKSPlot digunakan untuk menilai perbezaan taburan. Idea teras adalah untuk mengukur jarak maksimum antara fungsi pengedaran kumulatif (CDF) dua pengedaran. Semakin kecil jarak maksimum, semakin besar kemungkinan mereka tergolong dalam pengedaran yang sama. Oleh itu, ia terutamanya ditafsirkan sebagai "sistem" untuk menentukan perbezaan pengedaran.

Pembelajaran mesin dan analisis data menggunakan bahasa Go Pembelajaran mesin dan analisis data menggunakan bahasa Go Nov 30, 2023 am 08:44 AM

Dalam masyarakat pintar hari ini, pembelajaran mesin dan analisis data merupakan alat yang sangat diperlukan yang boleh membantu orang ramai memahami dan menggunakan sejumlah besar data dengan lebih baik. Dalam bidang ini, bahasa Go juga telah menjadi bahasa pengaturcaraan yang telah menarik perhatian ramai. Artikel ini memperkenalkan cara menggunakan bahasa Go untuk pembelajaran mesin dan analisis data. 1. Ekosistem pembelajaran mesin bahasa Go tidak sekaya Python dan R. Walau bagaimanapun, apabila semakin ramai orang mula menggunakannya, beberapa perpustakaan dan rangka kerja pembelajaran mesin

Cara menggunakan antara muka ECharts dan php untuk melaksanakan analisis data dan ramalan carta statistik Cara menggunakan antara muka ECharts dan php untuk melaksanakan analisis data dan ramalan carta statistik Dec 17, 2023 am 10:26 AM

Cara menggunakan antara muka ECharts dan PHP untuk melaksanakan analisis data dan ramalan carta statistik Analisis dan ramalan data memainkan peranan penting dalam pelbagai bidang. Ia boleh membantu kami memahami arah aliran dan corak data dan menyediakan rujukan untuk keputusan masa hadapan. ECharts ialah perpustakaan visualisasi data sumber terbuka yang menyediakan komponen carta yang kaya dan fleksibel yang boleh memuatkan dan memproses data secara dinamik dengan menggunakan antara muka PHP. Artikel ini akan memperkenalkan kaedah pelaksanaan analisis data carta statistik dan ramalan berdasarkan ECharts dan antara muka php, dan menyediakan

See all articles