Bagaimana untuk melaksanakan algoritma pepohon keputusan menggunakan Python?
Algoritma pepohon keputusan ialah algoritma pembelajaran mesin yang biasa digunakan yang boleh mengelaskan dan meramal data. Dalam Python, terdapat banyak perpustakaan yang boleh digunakan untuk melaksanakan algoritma pepohon keputusan, seperti scikit-learn dan tensorflow. Artikel ini akan mengambil perpustakaan scikit-learn sebagai contoh untuk memperkenalkan cara menggunakan Python untuk melaksanakan algoritma pepohon keputusan dan memberikan contoh kod khusus.
1. Pasang perpustakaan bergantung
Pertama, untuk menggunakan Python untuk melaksanakan algoritma pepohon keputusan, anda perlu memasang perpustakaan scikit-learn. Anda boleh menggunakan arahan pip untuk memasang:
pip install -U scikit-learn
2 Import perpustakaan
Selepas pemasangan selesai, anda boleh menggunakan pernyataan import untuk mengimport perpustakaan ke dalam program Python:
import numpy as np from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier
3 , anda boleh menggunakan data yang disediakan oleh set perpustakaan scikit-learn, atau sediakan set data itu sendiri. Di sini kita mengambil set data iris sebagai contoh Gunakan fungsi load_iris untuk memuatkan set data:
iris = datasets.load_iris() X = iris.data y = iris.target
Untuk melatih dan menguji model, set data perlu dibahagikan kepada latihan. set dan set ujian. Ini boleh dicapai menggunakan fungsi train_test_split:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
Seterusnya, anda boleh menggunakan kelas DecisionTreeClassifier untuk mencipta model pohon keputusan dan melatihnya menggunakan kaedah fit:
clf = DecisionTreeClassifier() clf.fit(X_train, y_train)
Selepas latihan selesai, anda boleh menggunakan ramalan kaedah untuk melakukan set ujian Ramalan:
y_pred = clf.predict(X_test)
Akhir sekali, anda boleh menggunakan kaedah skor untuk menilai ketepatan model:
accuracy = clf.score(X_test, y_test) print("准确率:", accuracy)
import numpy as np from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier # 加载数据集 iris = datasets.load_iris() X = iris.data y = iris.target # 拆分数据集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 创建决策树模型并训练 clf = DecisionTreeClassifier() clf.fit(X_train, y_train) # 预测结果 y_pred = clf.predict(X_test) # 评估模型 accuracy = clf.score(X_test, y_test) print("准确率:", accuracy)
Atas ialah kandungan terperinci Bagaimana untuk melaksanakan algoritma pepohon keputusan menggunakan Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!