Artikel ini membincangkan menggunakan LazyPredict untuk mencipta model ML mudah. Ciri penciptaan model pembelajaran mesin LazyPredict ialah ia tidak memerlukan banyak kod, dan pada masa yang sama, ia boleh memuatkan berbilang model tanpa mengubah suai parameter, dengan itu memilih model berprestasi terbaik antara banyak model.
Artikel ini membincangkan menggunakan LazyPredict untuk mencipta model ML mudah. Ciri penciptaan model pembelajaran mesin LazyPredict ialah ia tidak memerlukan banyak kod dan boleh melakukan pemasangan berbilang model tanpa mengubah suai parameter, dengan itu memilih model berprestasi terbaik di antara banyak model.
Artikel ini termasuk kandungan berikut:
LazyPredict dikenali sebagai pakej perisian Python paling maju , dan kelahirannya ialah Revolusikan cara model pembelajaran mesin dibangunkan. Dengan menggunakan LazyPredict, pelbagai model asas boleh dibuat dengan cepat tanpa pengekodan, membebaskan masa untuk memilih model yang paling sesuai dengan data kami.
Kelebihan utama LazyPredict ialah ia menjadikan pemilihan model lebih mudah tanpa memerlukan penalaan parameter model yang meluas. LazyPredict menyediakan cara yang pantas dan cekap untuk mencari dan menyesuaikan model terbaik dengan data anda.
Seterusnya, mari kita teroka dan ketahui lebih lanjut tentang penggunaan LazyPredict melalui artikel ini.
Pemasangan perpustakaan LazyPredict ialah tugas yang sangat mudah. Sama seperti memasang mana-mana perpustakaan Python lain, ia semudah satu baris kod.
!pip install lazypredict
Dalam contoh ini kita akan menggunakan set data kanser payudara daripada pakej Sklearn.
Sekarang, mari muatkan data.
from sklearn.datasets import load_breast_cancer from lazypredict.Supervised import LazyClassifier data = load_breast_cancer() X = data.data y= data.target
Untuk memilih model pengelas terbaik, mari kita gunakan algoritma "LazyClassifier". Ciri-ciri dan parameter input ini sesuai untuk kelas ini.
LazyClassifier( verbose=0, ignore_warnings=True, custom_metric=None, predictions=False, random_state=42, classifiers='all', )
Kemudian gunakan model pada data yang dimuatkan dan muatkannya.
from lazypredict.Supervised import LazyClassifier from sklearn.model_selection import train_test_split # split the data X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=0.3,random_state =0) # build the lazyclassifier clf = LazyClassifier(verbose=0,ignore_warnings=True, custom_metric=None) # fit it models, predictions = clf.fit(X_train, X_test, y_train, y_test) # print the best models print(models)
Selepas melaksanakan kod di atas, keputusan berikut diperoleh:
Kemudian, kita boleh melakukan perkara berikut untuk melihat butiran model.
model_dictionary = clf.provide_models(X_train,X_test,y_train,y_test)
Seterusnya, tetapkan nama model untuk memaparkan maklumat langkah terperinci.
model_dictionary['LGBMClassifier']
Di sini kita dapat melihat bahawa SimpleImputer digunakan untuk keseluruhan set data dan kemudian StandardScaler digunakan untuk ciri berangka. Tiada ciri kategori atau ordinal dalam set data ini, tetapi jika ada, OneHotEncoder dan OrdinalEncoder akan digunakan masing-masing. Model LGBMClassifier menerima data selepas transformasi dan pengelasan.
Model pembelajaran mesin dalaman LazyClassifier menggunakan kotak alat sci-kit-learn untuk penilaian dan pemasangan. Apabila fungsi LazyClassifier dipanggil, ia akan membina dan memuatkan pelbagai model secara automatik pada data kami, termasuk pepohon keputusan, hutan rawak, mesin vektor sokongan, dsb. Satu set metrik prestasi yang anda berikan, seperti ketepatan, ingat semula atau skor F1, digunakan untuk menilai model ini. Set latihan digunakan untuk pemasangan, manakala set ujian digunakan untuk penilaian.
Selepas menilai dan menyesuaikan model, LazyClassifier akan menyediakan ringkasan keputusan penilaian (seperti yang ditunjukkan dalam jadual di atas), serta senarai model teratas dan metrik prestasi untuk setiap model. Memandangkan tidak perlu menala atau memilih model secara manual, anda boleh menilai prestasi banyak model dengan cepat dan mudah serta memilih model yang paling sesuai dengan data anda.
Menggunakan fungsi "LazyRegressor", kerja yang sama boleh dilakukan semula untuk model regresi. Mari import set data yang sesuai untuk tugas regresi (menggunakan set data Boston).
Sekarang, mari gunakan LazyRegressor untuk memuatkan data kami.
from lazypredict.Supervised import LazyRegressor from sklearn import datasets from sklearn.utils import shuffle import numpy as np # load the data boston = datasets.load_boston() X, y = shuffle(boston.data, boston.target, random_state=0) X = X.astype(np.float32) # split the data X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=0.3,random_state =0) # fit the lazy object reg = LazyRegressor(verbose=0, ignore_warnings=False, custom_metric=None) models, predictions = reg.fit(X_train, X_test, y_train, y_test) # print the results in a table print(models)
Hasil pelaksanaan kod adalah seperti berikut:
以下是对最佳回归模型的详细描述:
model_dictionary = reg.provide_models(X_train,X_test,y_train,y_test) model_dictionary['ExtraTreesRegressor']
这里可以看到SimpleImputer被用于整个数据集,然后是StandardScaler用于数字特征。这个数据集中没有分类或序数特征,但如果有的话,会分别使用OneHotEncoder和OrdinalEncoder。ExtraTreesRegressor模型接收了转换和归类后的数据。
LazyPredict库对于任何从事机器学习行业的人来说都是一种有用的资源。LazyPredict通过自动创建和评估模型的过程来节省选择模型的时间和精力,这大大提高了模型选择过程的有效性。LazyPredict提供了一种快速而简单的方法来比较几个模型的有效性,并确定哪个模型系列最适合我们的数据和问题,因为它能够同时拟合和评估众多模型。
阅读本文之后希望你现在对LazyPredict库有了直观的了解,这些概念将帮助你建立一些真正有价值的项目。
崔皓,51CTO社区编辑,资深架构师,拥有18年的软件开发和架构经验,10年分布式架构经验。
原文标题:LazyPredict: A Utilitarian Python Library to Shortlist the Best ML Models for a Given Use Case,作者:Sanjay Kumar
Atas ialah kandungan terperinci LazyPredict: Pilih model ML terbaik untuk anda!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!