Prinsip dan kaedah pelaksanaan melaksanakan algoritma pepohon keputusan dalam Python-Tutorial Python-php.cn

Jadual Kandungan

Idea algoritma pokok keputusan

Melaksanakan algoritma pepohon keputusan dalam Python

Rumah

pembangunan bahagian belakang

Tutorial Python

Prinsip dan kaedah pelaksanaan melaksanakan algoritma pepohon keputusan dalam Python

PHPz

Jan 22, 2024 pm 07:24 PM

Konsep algoritma

决策树算法原理 Python实现决策树算法

Algoritma pohon keputusan tergolong dalam kategori algoritma pembelajaran diselia, sesuai untuk pembolehubah output berterusan dan kategori, dan biasanya digunakan untuk menyelesaikan masalah klasifikasi dan regresi.

Pokok keputusan ialah struktur pepohon yang serupa dengan carta alir, di mana setiap nod dalaman mewakili ujian atribut, setiap cawangan mewakili hasil ujian dan setiap nod sepadan dengan label kelas.

Idea algoritma pokok keputusan

Mulakan dengan menganggap keseluruhan set latihan sebagai punca.

Untuk mendapatkan maklumat, diandaikan bahawa atribut adalah kategori, dan untuk indeks Gini, diandaikan bahawa atribut adalah berterusan.

Rekod diedarkan secara rekursif berdasarkan nilai atribut.

Gunakan kaedah statistik untuk mengisih atribut kepada nod akar.

Cari atribut terbaik dan letakkan pada nod akar pokok.

Sekarang, bahagikan set latihan set data kepada subset. Apabila membuat subset, pastikan setiap subset set data latihan harus mempunyai nilai atribut yang sama.

Cari nod daun di semua cabang dengan mengulangi 1 dan 2 pada setiap subset.

Melaksanakan algoritma pepohon keputusan dalam Python

memerlukan dua fasa pembinaan dan operasi:

fasa pembinaan dan set data prapemprosesan. Pisahkan set data daripada latihan dan ujian menggunakan pakej Python sklearn. Latih pengelas.

Dalam peringkat operasi, buat ramalan. Ketepatan pengiraan.

Import data, untuk mengimport dan memanipulasi data, kami menggunakan pakej panda yang disediakan dalam python.

Di sini, kami menggunakan URL untuk mendapatkan set data terus dari tapak UCI tanpa memuat turun set data. Apabila anda cuba menjalankan kod ini pada sistem anda, pastikan sistem harus mempunyai sambungan Internet yang aktif.

Memandangkan set data dipisahkan oleh ",", kita perlu menghantar nilai parameter sep sebagai.

Satu lagi perkara yang perlu diambil perhatian ialah set data tidak mengandungi pengepala, jadi kami menghantar nilai parameter Pengepala sebagai tiada. Jika kita tidak lulus parameter pengepala, maka ia akan mempertimbangkan baris pertama set data sebagai pengepala.

Pemotongan data, sebelum melatih model, kita perlu membahagikan set data kepada set data latihan dan ujian.

Untuk membahagikan set data untuk latihan dan ujian, kami menggunakan modul sklearn train_test_split

Pertama, kami perlu memisahkan pembolehubah sasaran daripada atribut dalam set data.

X=balance_data.values[:,1:5]
Y=balance_data.values[:,0]

Salin selepas log masuk

Di atas ialah baris kod yang memisahkan set data. Pembolehubah X mengandungi atribut, manakala pembolehubah Y mengandungi pembolehubah sasaran set data.

Langkah seterusnya ialah membahagikan set data untuk tujuan latihan dan ujian.

X_train,X_test,y_train,y_test=train_test_split(
X,Y,test_size=0.3,random_state=100)

Salin selepas log masuk

Barisan sebelumnya membahagikan set data untuk latihan dan ujian. Memandangkan kami membahagikan set data pada nisbah 70:30 antara latihan dan ujian, kami menghantar nilai parameter test_size sebagai 0.3.

pembolehubah keadaan_rawak ialah keadaan penjana nombor rawak pseudo yang digunakan untuk pensampelan rawak.

Atas ialah kandungan terperinci Prinsip dan kaedah pelaksanaan melaksanakan algoritma pepohon keputusan dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Akan R.E.P.O. Ada Crossplay?

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7554

Tutorial CakePHP

1382

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Analisis mendalam tentang Algoritma Pengoptimuman Serigala Kelabu (GWO) serta kekuatan dan kelemahannya Jan 19, 2024 pm 07:48 PM

Algoritma Pengoptimuman Serigala Kelabu (GWO) ialah algoritma metaheuristik berasaskan populasi yang menyerupai hierarki kepimpinan dan mekanisme memburu serigala kelabu dalam alam semula jadi. Inspirasi Algoritma Serigala Kelabu 1. Serigala kelabu dianggap sebagai pemangsa puncak dan berada di bahagian atas rantai makanan. 2. Serigala kelabu suka hidup dalam kumpulan (hidup berkumpulan), dengan purata 5-12 serigala dalam setiap pek. 3. Serigala kelabu mempunyai hierarki penguasaan sosial yang sangat ketat, seperti yang ditunjukkan di bawah: Serigala alfa: Serigala alfa menduduki kedudukan dominan dalam keseluruhan kumpulan serigala kelabu dan mempunyai hak untuk memerintah seluruh kumpulan serigala kelabu. Dalam aplikasi algoritma, Alpha Wolf adalah salah satu penyelesaian terbaik, penyelesaian optimum yang dihasilkan oleh algoritma pengoptimuman. Serigala beta: Serigala beta melaporkan kepada serigala Alpha dengan kerap dan membantu serigala Alpha membuat keputusan yang terbaik. Dalam aplikasi algoritma, Beta Wolf boleh

Terokai prinsip asas dan proses pelaksanaan algoritma pensampelan bersarang Jan 22, 2024 pm 09:51 PM

Algoritma persampelan bersarang ialah algoritma inferens statistik Bayesian yang cekap digunakan untuk mengira kamiran atau penjumlahan di bawah taburan kebarangkalian kompleks. Ia berfungsi dengan menguraikan ruang parameter kepada berbilang hiperkubus dengan isipadu yang sama, dan secara beransur-ansur dan berulang "menolak keluar" salah satu hiperkubus volum terkecil, dan kemudian mengisi hiperkubus dengan sampel rawak untuk menganggarkan nilai kamiran taburan kebarangkalian dengan lebih baik. Melalui lelaran berterusan, algoritma pensampelan bersarang boleh memperoleh nilai kamiran ketepatan tinggi dan sempadan ruang parameter, yang boleh digunakan untuk masalah statistik seperti perbandingan model, anggaran parameter, dan pemilihan model. Idea teras algoritma ini adalah untuk mengubah masalah penyepaduan kompleks kepada satu siri masalah penyepaduan mudah, dan mendekati nilai kamiran sebenar dengan mengurangkan jumlah ruang parameter secara beransur-ansur. Setiap langkah lelaran mengambil sampel secara rawak daripada ruang parameter

Menganalisis prinsip, model dan komposisi Algoritma Carian Sparrow (SSA) Jan 19, 2024 pm 10:27 PM

Algoritma Carian Sparrow (SSA) ialah algoritma pengoptimuman meta-heuristik berdasarkan tingkah laku anti-pemangsaan dan mencari makan burung pipit. Tingkah laku mencari makan burung pipit boleh dibahagikan kepada dua jenis utama: pengeluar dan pemulung. Pengeluar secara aktif mencari makanan, manakala pemulung bersaing untuk mendapatkan makanan daripada pengeluar. Prinsip Algoritma Pencarian Sparrow (SSA) Dalam Algoritma Pencarian Sparrow (SSA), setiap burung pipit sangat memperhatikan tingkah laku jiran-jirannya. Dengan menggunakan strategi mencari makan yang berbeza, individu dapat menggunakan tenaga tertahan dengan cekap untuk mengejar lebih banyak makanan. Selain itu, burung lebih terdedah kepada pemangsa dalam ruang carian mereka, jadi mereka perlu mencari lokasi yang lebih selamat. Burung di tengah koloni boleh meminimumkan pelbagai bahaya mereka sendiri dengan tinggal dekat dengan jiran mereka. Apabila burung mengesan pemangsa, ia membuat panggilan penggera

Penjelasan terperinci algoritma Bellman Ford dan pelaksanaan dalam Python Jan 22, 2024 pm 07:39 PM

Algoritma Bellman Ford boleh mencari laluan terpendek dari nod sasaran ke nod lain dalam graf berwajaran. Ini sangat serupa dengan algoritma Dijkstra Algoritma Bellman-Ford boleh mengendalikan graf dengan pemberat negatif dan agak mudah dari segi pelaksanaan. Penjelasan terperinci tentang prinsip algoritma Bellman Ford Algoritma Bellman Ford secara lelaran mencari laluan baharu yang lebih pendek daripada laluan yang terlebih anggaran dengan membuat anggaran terlebih panjang laluan dari bucu permulaan kepada semua bucu lain. Kerana kita ingin merekodkan jarak laluan setiap nod, kita boleh menyimpannya dalam tatasusunan saiz n, di mana n juga mewakili bilangan nod. Contoh Rajah 1. Pilih nod permulaan, tetapkan ia kepada semua bucu lain tanpa terhingga, dan rekod nilai laluan. 2. Lawati setiap tepi dan lakukan operasi kelonggaran untuk mengemas kini laluan terpendek secara berterusan. 3. Kita perlukan

Pengenalan kepada algoritma Wu-Manber dan arahan pelaksanaan Python Jan 23, 2024 pm 07:03 PM

Algoritma Wu-Manber ialah algoritma pemadanan rentetan yang digunakan untuk mencari rentetan dengan cekap. Ia adalah algoritma hibrid yang menggabungkan kelebihan algoritma Boyer-Moore dan Knuth-Morris-Pratt untuk menyediakan padanan corak yang pantas dan tepat. Langkah algoritma Wu-Manber 1. Cipta jadual cincang yang memetakan setiap subrentetan yang mungkin bagi corak ke kedudukan corak di mana subrentetan itu berlaku. 2. Jadual cincang ini digunakan untuk mengenal pasti potensi lokasi permulaan corak dalam teks dengan cepat. 3. Lelaran melalui teks dan bandingkan setiap aksara dengan aksara yang sepadan dalam corak. 4. Jika aksara sepadan, anda boleh beralih ke aksara seterusnya dan meneruskan perbandingan. 5. Jika aksara tidak sepadan, anda boleh menggunakan jadual cincang untuk menentukan watak berpotensi seterusnya dalam corak.

Prinsip pengoptimuman berangka dan analisis Algoritma Pengoptimuman Paus (WOA) Jan 19, 2024 pm 07:27 PM

Algoritma Pengoptimuman Paus (WOA) ialah algoritma pengoptimuman metaheuristik yang diilhamkan oleh alam semula jadi yang menyerupai tingkah laku memburu ikan paus bungkuk dan digunakan untuk pengoptimuman masalah berangka. Algoritma Pengoptimuman Paus (WOA) bermula dengan satu set penyelesaian rawak dan mengoptimumkan berdasarkan ejen carian yang dipilih secara rawak atau penyelesaian terbaik setakat ini melalui kemas kini kedudukan ejen carian dalam setiap lelaran. Inspirasi Algoritma Pengoptimuman Paus Algoritma Pengoptimuman Paus diinspirasikan oleh tingkah laku memburu ikan paus bungkuk. Paus bungkuk lebih suka makanan yang terdapat berhampiran permukaan, seperti krill dan kumpulan ikan. Oleh itu, paus bungkuk mengumpulkan makanan bersama-sama untuk membentuk rangkaian gelembung dengan meniup buih dalam lingkaran bawah ke atas semasa memburu. Dalam gerakan "lingkaran ke atas", ikan paus bungkuk menyelam kira-kira 12m, kemudian mula membentuk gelembung lingkaran di sekeliling mangsanya dan berenang ke atas.

Apakah peranan perolehan maklumat dalam algoritma id3? Jan 23, 2024 pm 11:27 PM

Algoritma ID3 adalah salah satu algoritma asas dalam pembelajaran pokok keputusan. Ia memilih titik perpecahan terbaik dengan mengira keuntungan maklumat setiap ciri untuk menjana pepohon keputusan. Keuntungan maklumat ialah konsep penting dalam algoritma ID3, yang digunakan untuk mengukur sumbangan ciri kepada tugas pengelasan. Artikel ini akan memperkenalkan secara terperinci konsep, kaedah pengiraan dan aplikasi perolehan maklumat dalam algoritma ID3. 1. Konsep entropi maklumat Entropi maklumat ialah konsep dalam teori maklumat, yang mengukur ketidakpastian pembolehubah rawak. Untuk nombor pembolehubah rawak diskret, dan p(x_i) mewakili kebarangkalian bahawa pembolehubah rawak X mengambil nilai x_i. surat

Algoritma Ciri Invarian Skala (SIFT). Jan 22, 2024 pm 05:09 PM

Algoritma Scale Invariant Feature Transform (SIFT) ialah algoritma pengekstrakan ciri yang digunakan dalam bidang pemprosesan imej dan penglihatan komputer. Algoritma ini telah dicadangkan pada tahun 1999 untuk meningkatkan pengecaman objek dan prestasi pemadanan dalam sistem penglihatan komputer. Algoritma SIFT adalah teguh dan tepat dan digunakan secara meluas dalam pengecaman imej, pembinaan semula tiga dimensi, pengesanan sasaran, penjejakan video dan medan lain. Ia mencapai invarian skala dengan mengesan titik utama dalam ruang skala berbilang dan mengekstrak deskriptor ciri tempatan di sekitar titik utama. Langkah-langkah utama algoritma SIFT termasuk pembinaan ruang skala, pengesanan titik utama, kedudukan titik utama, penetapan arah dan penjanaan deskriptor ciri. Melalui langkah-langkah ini, algoritma SIFT boleh mengekstrak ciri yang teguh dan unik, dengan itu mencapai pemprosesan imej yang cekap.

See all articles