Jadual Kandungan
Langkah 1: Sediakan data
Langkah 2: Tentukan entiti dan perhubungan
Langkah 3: Buat set entiti
Langkah 4: Tentukan perhubungan
Langkah 5: Jalankan algoritma sintesis ciri dalam
Langkah 6: Bina model
Ringkasan:
Rumah Peranti teknologi AI Laksanakan kejuruteraan ciri automatik menggunakan Featuretools

Laksanakan kejuruteraan ciri automatik menggunakan Featuretools

Jan 22, 2024 pm 03:18 PM
kejuruteraan ciri

Laksanakan kejuruteraan ciri automatik menggunakan Featuretools

Featuretools ialah perpustakaan Python untuk kejuruteraan ciri automatik. Ia bertujuan untuk memudahkan proses kejuruteraan ciri dan meningkatkan prestasi model pembelajaran mesin. Perpustakaan secara automatik boleh mengekstrak ciri berguna daripada data mentah, membantu pengguna menjimatkan masa dan usaha sambil meningkatkan ketepatan model.

Berikut ialah langkah tentang cara menggunakan Featuretools untuk mengautomasikan kejuruteraan ciri:

Langkah 1: Sediakan data

Sebelum menggunakan Featuretools, anda perlu menyediakan set data. Set data mestilah dalam format Pandas DataFrame, di mana setiap baris mewakili pemerhatian dan setiap lajur mewakili ciri. Bagi masalah klasifikasi dan regresi, set data mestilah mengandungi pembolehubah sasaran, manakala bagi masalah pengelompokan, set data tidak memerlukan pembolehubah sasaran. Oleh itu, apabila menggunakan Featuretools, pastikan set data memenuhi keperluan ini supaya kejuruteraan ciri dan penjanaan ciri dapat dilakukan dengan cekap.

Langkah 2: Tentukan entiti dan perhubungan

Apabila menggunakan Featuretools untuk kejuruteraan ciri, anda perlu mentakrifkan entiti dan perhubungan terlebih dahulu. Entiti ialah subset set data yang mengandungi set ciri yang berkaitan. Contohnya, pada tapak web e-dagang, pesanan, pengguna, produk, pembayaran, dll. boleh dianggap sebagai entiti yang berbeza. Perhubungan ialah sambungan antara entiti Contohnya, pesanan mungkin dikaitkan dengan pengguna dan pengguna boleh membeli berbilang produk. Dengan mentakrifkan entiti dan perhubungan dengan jelas, struktur set data boleh difahami dengan lebih baik, yang memudahkan penjanaan ciri dan analisis data.

Langkah 3: Buat set entiti

Menggunakan Featuretools, anda boleh mencipta set entiti dengan mentakrifkan entiti dan perhubungan. Set entiti ialah koleksi berbilang entiti. Dalam langkah ini, anda perlu menentukan nama, set data, indeks, jenis pembolehubah dan cap masa bagi setiap entiti. Contohnya, set entiti yang mengandungi pesanan dan entiti pengguna boleh dibuat menggunakan kod berikut:

import featuretools as ft

# Create entity set
es=ft.EntitySet(id='ecommerce')

# Define entities
orders=ft.Entity(id='orders',dataframe=orders_df,index='order_id',time_index='order_time')
users=ft.Entity(id='users',dataframe=users_df,index='user_id')

# Add entities to entity set
es=es.entity_from_dataframe(entity_id='orders',dataframe=orders_df,index='order_id',time_index='order_time')
es=es.entity_from_dataframe(entity_id='users',dataframe=users_df,index='user_id')
Salin selepas log masuk

Di sini, kami menggunakan EntitySet untuk mencipta set entiti bernama "e-dagang" dan mentakrifkan dua entiti menggunakan Entiti, Pesanan dan Pengguna . Untuk entiti pesanan, kami menetapkan ID pesanan sebagai indeks dan masa pesanan sebagai cap waktu. Untuk entiti pengguna, kami hanya menentukan ID pengguna sebagai indeks.

Langkah 4: Tentukan perhubungan

Dalam langkah ini, anda perlu mentakrifkan perhubungan antara entiti. Menggunakan Featuretools, perhubungan boleh ditakrifkan melalui pembolehubah yang dikongsi, cap masa, dsb. antara entiti. Sebagai contoh, pada tapak web e-dagang, setiap pesanan dikaitkan dengan pengguna. Hubungan antara pesanan dan pengguna boleh ditakrifkan menggunakan kod berikut:

# Define relationships
r_order_user = ft.Relationship(orders['user_id'], users['user_id'])
es = es.add_relationship(r_order_user)
Salin selepas log masuk

Di sini, kami telah mentakrifkan hubungan antara pesanan dan pengguna menggunakan Perhubungan dan menambahkannya pada set entiti menggunakan add_relationship.

Langkah 5: Jalankan algoritma sintesis ciri dalam

Selepas melengkapkan langkah di atas, anda boleh menggunakan algoritma sintesis ciri dalam Featuretools untuk menjana ciri secara automatik. Algoritma ini secara automatik mencipta ciri baharu seperti pengagregatan, transformasi dan gabungan. Anda boleh menggunakan kod berikut untuk menjalankan algoritma sintesis ciri mendalam:

# Run deep feature synthesis algorithm
features, feature_names = ft.dfs(entityset=es, target_entity='orders', max_depth=2)
Salin selepas log masuk

Di sini, kami menggunakan fungsi dfs untuk menjalankan algoritma sintesis ciri mendalam, menentukan entiti sasaran sebagai entiti pesanan dan menetapkan kedalaman maksimum kepada 2. Fungsi ini mengembalikan DataFrame yang mengandungi ciri baharu dan senarai nama ciri.

Langkah 6: Bina model

Selepas anda memperoleh ciri baharu, anda boleh menggunakannya untuk melatih model pembelajaran mesin. Ciri baharu boleh ditambah pada set data asal menggunakan kod berikut:

# Add new features to original dataset
df=pd.merge(orders_df,features,left_on='order_id',right_on='order_id')
Salin selepas log masuk

Di sini, kami menggunakan fungsi gabungan untuk menambah ciri baharu pada set data asal untuk latihan dan ujian. Ciri baharu kemudiannya boleh digunakan untuk melatih model pembelajaran mesin, contohnya:

# Split dataset into train and test sets
X_train, X_test, y_train, y_test = train_test_split(df[feature_names], df['target'], test_size=0.2, random_state=42)

# Train machine learning model
model = RandomForestClassifier()
model.fit(X_train, y_train)

# Evaluate model performance
y_pred = model.predict(X_test)
accuracy_score(y_test, y_pred)
Salin selepas log masuk

Di sini, kami menggunakan pengelas hutan rawak sebagai model pembelajaran mesin dan menggunakan set latihan untuk melatih model. Kami kemudian menggunakan set ujian untuk menilai prestasi model, menggunakan ketepatan sebagai metrik penilaian.

Ringkasan:

Langkah-langkah untuk menggunakan Featuretools untuk mengautomasikan kejuruteraan ciri termasuk menyediakan data, menentukan entiti dan perhubungan, mencipta set entiti, mentakrifkan perhubungan, menjalankan algoritma sintesis ciri yang mendalam dan membina model. Featuretools boleh mengekstrak ciri berguna secara automatik daripada data mentah, membantu pengguna menjimatkan banyak masa dan usaha serta meningkatkan prestasi model pembelajaran mesin.

Atas ialah kandungan terperinci Laksanakan kejuruteraan ciri automatik menggunakan Featuretools. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Arahan sembang dan cara menggunakannya
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Laksanakan kejuruteraan ciri automatik menggunakan Featuretools Laksanakan kejuruteraan ciri automatik menggunakan Featuretools Jan 22, 2024 pm 03:18 PM

Featuretools ialah perpustakaan Python untuk kejuruteraan ciri automatik. Ia bertujuan untuk memudahkan proses kejuruteraan ciri dan meningkatkan prestasi model pembelajaran mesin. Perpustakaan secara automatik boleh mengekstrak ciri berguna daripada data mentah, membantu pengguna menjimatkan masa dan usaha sambil meningkatkan ketepatan model. Berikut ialah langkah tentang cara menggunakan Featuretools untuk mengautomasikan kejuruteraan ciri: Langkah 1: Sediakan data Sebelum menggunakan Featuretools, anda perlu menyediakan set data. Set data mestilah dalam format PandasDataFrame, di mana setiap baris mewakili pemerhatian dan setiap lajur mewakili ciri. Untuk masalah klasifikasi dan regresi, set data mesti mengandungi pembolehubah sasaran, manakala untuk masalah clustering, set data tidak perlu

Algoritma Ciri Invarian Skala (SIFT). Algoritma Ciri Invarian Skala (SIFT). Jan 22, 2024 pm 05:09 PM

Algoritma Scale Invariant Feature Transform (SIFT) ialah algoritma pengekstrakan ciri yang digunakan dalam bidang pemprosesan imej dan penglihatan komputer. Algoritma ini telah dicadangkan pada tahun 1999 untuk meningkatkan pengecaman objek dan prestasi pemadanan dalam sistem penglihatan komputer. Algoritma SIFT adalah teguh dan tepat dan digunakan secara meluas dalam pengecaman imej, pembinaan semula tiga dimensi, pengesanan sasaran, penjejakan video dan medan lain. Ia mencapai invarian skala dengan mengesan titik utama dalam ruang skala berbilang dan mengekstrak deskriptor ciri tempatan di sekitar titik utama. Langkah-langkah utama algoritma SIFT termasuk pembinaan ruang skala, pengesanan titik utama, kedudukan titik utama, penetapan arah dan penjanaan deskriptor ciri. Melalui langkah-langkah ini, algoritma SIFT boleh mengekstrak ciri yang teguh dan unik, dengan itu mencapai pemprosesan imej yang cekap.

Teknologi AI digunakan untuk perbandingan dokumen Teknologi AI digunakan untuk perbandingan dokumen Jan 22, 2024 pm 09:24 PM

Faedah perbandingan dokumen melalui AI ialah keupayaannya untuk mengesan dan membandingkan secara automatik perubahan dan perbezaan antara dokumen, menjimatkan masa dan tenaga kerja serta mengurangkan risiko kesilapan manusia. Selain itu, AI boleh memproses sejumlah besar data teks, meningkatkan kecekapan dan ketepatan pemprosesan serta boleh membandingkan versi dokumen yang berbeza untuk membantu pengguna mencari versi terkini dan kandungan yang diubah dengan cepat. Perbandingan dokumen AI biasanya merangkumi dua langkah utama: prapemprosesan teks dan perbandingan teks. Pertama, teks perlu dipraproses untuk menukarnya ke dalam bentuk yang boleh diproses komputer. Kemudian, perbezaan antara teks ditentukan dengan membandingkan persamaannya. Berikut akan mengambil perbandingan dua fail teks sebagai contoh untuk memperkenalkan proses ini secara terperinci. Prapemprosesan teks Pertama, kita perlu pramemproses teks. Ini termasuk mata

Algoritma RFE kaedah penghapusan ciri rekursif Algoritma RFE kaedah penghapusan ciri rekursif Jan 22, 2024 pm 03:21 PM

Penghapusan ciri rekursif (RFE) ialah teknik pemilihan ciri yang biasa digunakan yang boleh mengurangkan dimensi set data secara berkesan dan meningkatkan ketepatan dan kecekapan model. Dalam pembelajaran mesin, pemilihan ciri ialah langkah utama, yang boleh membantu kami menghapuskan ciri yang tidak relevan atau berlebihan, dengan itu meningkatkan keupayaan generalisasi dan kebolehtafsiran model. Melalui lelaran berperingkat, algoritma RFE melatih model dan menghapuskan ciri yang paling kurang penting, kemudian melatih model itu semula sehingga bilangan ciri tertentu dicapai atau metrik prestasi tertentu dicapai. Kaedah pemilihan ciri automatik ini bukan sahaja dapat meningkatkan prestasi model, tetapi juga mengurangkan penggunaan masa latihan dan sumber pengkomputeran. Secara keseluruhannya, RFE ialah alat berkuasa yang boleh membantu kami dalam proses pemilihan ciri RFE ialah kaedah berulang untuk model latihan.

Contoh kod untuk pemindahan gaya imej menggunakan rangkaian saraf konvolusi Contoh kod untuk pemindahan gaya imej menggunakan rangkaian saraf konvolusi Jan 22, 2024 pm 01:30 PM

Pemindahan gaya imej berdasarkan rangkaian neural konvolusi ialah teknologi yang menggabungkan kandungan dan gaya imej untuk menghasilkan imej baharu. Ia menggunakan model rangkaian neural convolutional (CNN) untuk menukar imej kepada vektor ciri gaya. Artikel ini akan membincangkan teknologi ini dari tiga aspek berikut: 1. Prinsip teknikal Pelaksanaan pemindahan gaya imej berdasarkan rangkaian saraf konvolusi bergantung pada dua konsep utama: perwakilan kandungan dan perwakilan gaya. Perwakilan kandungan merujuk kepada perwakilan abstrak objek dan objek dalam imej, manakala perwakilan gaya merujuk kepada perwakilan abstrak tekstur dan warna dalam imej. Dalam rangkaian neural konvolusi, kami menjana imej baharu dengan menggabungkan perwakilan kandungan dan perwakilan gaya untuk mengekalkan kandungan imej asal dan mempunyai gaya imej baharu. Untuk mencapai matlamat ini, kita boleh menggunakan kaedah yang dipanggil

Panduan untuk aplikasi mesin Boltzmann dalam pengekstrakan ciri Panduan untuk aplikasi mesin Boltzmann dalam pengekstrakan ciri Jan 22, 2024 pm 10:06 PM

Mesin Boltzmann (BM) ialah rangkaian neural berasaskan kebarangkalian yang terdiri daripada berbilang neuron dengan hubungan sambungan rawak antara neuron. Tugas utama BM adalah untuk mengekstrak ciri dengan mempelajari taburan kebarangkalian data. Artikel ini akan memperkenalkan cara menggunakan BM untuk pengekstrakan ciri dan menyediakan beberapa contoh aplikasi praktikal. 1. Struktur asas BM BM terdiri daripada lapisan nampak dan lapisan tersembunyi. Lapisan kelihatan menerima data mentah, dan lapisan tersembunyi memperoleh ekspresi ciri peringkat tinggi melalui pembelajaran. Dalam BM, setiap neuron mempunyai dua keadaan, 0 dan 1. Proses pembelajaran BM boleh dibahagikan kepada fasa latihan dan fasa ujian. Dalam fasa latihan, BM mempelajari taburan kebarangkalian data untuk menghasilkan sampel data baharu dalam fasa ujian.

Prinsip, fungsi dan aplikasi pengekstrak ciri cetek Prinsip, fungsi dan aplikasi pengekstrak ciri cetek Jan 22, 2024 pm 05:12 PM

Pengekstrak ciri cetek ialah pengekstrak ciri yang terletak pada lapisan yang lebih cetek dalam rangkaian saraf pembelajaran mendalam. Fungsi utamanya adalah untuk menukar data input kepada perwakilan ciri berdimensi tinggi untuk lapisan model seterusnya untuk melaksanakan tugas seperti klasifikasi dan regresi. Pengekstrak ciri cetek menggunakan operasi lilitan dan pengumpulan dalam rangkaian neural konvolusi (CNN) untuk mencapai pengekstrakan ciri. Melalui operasi konvolusi, pengekstrak ciri cetek boleh menangkap ciri tempatan data input, manakala operasi pengumpulan boleh mengurangkan dimensi ciri dan mengekalkan maklumat ciri penting. Dengan cara ini, pengekstrak ciri cetek boleh mengubah data mentah kepada perwakilan ciri yang lebih bermakna, meningkatkan prestasi tugasan seterusnya. Operasi lilitan adalah salah satu operasi teras dalam rangkaian neural konvolusi (CNN). Ia melakukan operasi lilitan pada data input dengan set kernel lilitan, daripada

Bagaimanakah ciri mempengaruhi pilihan jenis model? Bagaimanakah ciri mempengaruhi pilihan jenis model? Jan 24, 2024 am 11:03 AM

Ciri memainkan peranan penting dalam pembelajaran mesin. Apabila membina model, kita perlu berhati-hati memilih ciri untuk latihan. Pemilihan ciri secara langsung akan mempengaruhi prestasi dan jenis model. Artikel ini meneroka cara ciri mempengaruhi jenis model. 1. Bilangan ciri Bilangan ciri adalah salah satu faktor penting yang mempengaruhi jenis model. Apabila bilangan ciri adalah kecil, algoritma pembelajaran mesin tradisional seperti regresi linear, pepohon keputusan, dsb. biasanya digunakan. Algoritma ini sesuai untuk memproses sebilangan kecil ciri dan kelajuan pengiraan agak pantas. Walau bagaimanapun, apabila bilangan ciri menjadi sangat besar, prestasi algoritma ini biasanya merosot kerana mereka menghadapi kesukaran memproses data berdimensi tinggi. Oleh itu, dalam kes ini, kita perlu menggunakan algoritma yang lebih maju seperti mesin vektor sokongan, rangkaian saraf, dll. Algoritma ini mampu mengendalikan dimensi tinggi

See all articles