Python ialah bahasa pengaturcaraan yang berkuasa yang boleh digunakan untuk pelbagai tugas perlombongan data. Peraturan persatuan ialah salah satu teknik perlombongan data biasa, yang bertujuan untuk menemui perkaitan antara titik data yang berbeza untuk memahami set data dengan lebih baik. Dalam artikel ini, kita akan membincangkan cara menggunakan peraturan persatuan dalam Python untuk perlombongan data.
Apakah itu Peraturan Persatuan
Peraturan persatuan ialah teknologi perlombongan data yang digunakan untuk menemui perkaitan antara titik data yang berbeza. Ia sering digunakan dalam analisis bakul beli-belah, di mana kita boleh menemui item yang sering dibeli bersama-sama untuk menyusunnya di jabatan kedai di mana ia diletakkan.
Dalam peraturan persatuan, kami mempunyai dua jenis elemen: set item dan peraturan.
Set projek mengandungi berbilang projek dan peraturan ialah perhubungan logik. Contohnya, jika set item mengandungi A, B dan C, peraturan A->B bermakna apabila A berlaku, B juga berkemungkinan berlaku. Peraturan lain, B->C, bermakna apabila B muncul, C juga berkemungkinan muncul.
Langkah untuk menggunakan Python untuk perlombongan data peraturan persatuan
Untuk menggunakan Python untuk perlombongan data peraturan persatuan, kita perlu mengikuti langkah berikut:
1 >
Pertama, kita perlu menyediakan data yang ingin kita gunakan. Algoritma peraturan persatuan biasanya menggunakan data transaksi, seperti sejarah pembelian atau rekod interaksi dengan pelanggan. Dalam Python, kita boleh menggunakan bingkai data panda untuk memuatkan data dan kemudian menukarnya kepada format yang sesuai untuk algoritma. Format yang biasa digunakan ialah Senarai Senarai, di mana setiap subsenarai mewakili transaksi dan elemen mewakili item dalam transaksi. Sebagai contoh, kod berikut memuatkan fail CSV yang mengandungi contoh maklumat transaksi dan menukarkannya kepada format Senarai Senarai:import pandas as pd # Load data from CSV file data = pd.read_csv('transactions.csv') # Convert data to List of Lists format transactions = [] for i, row in data.iterrows(): transaction = [] for col in data.columns: if row[col] == 1: transaction.append(col) transactions.append(transaction)
Setelah kami menukar data kepada format yang sesuai untuk algoritma, kami boleh menggunakan mana-mana algoritma peraturan persatuan untuk mencari peraturan. Algoritma yang paling biasa ialah algoritma Apriori, yang mengikut langkah berikut:
from pymining import itemmining relim_input = itemmining.get_relim_input(transactions) item_sets = itemmining.relim(relim_input, min_support=2) print(item_sets)
from pymining import perftesting rules = perftesting.association_rules(item_sets, 0.6) for rule in rules: item1 = rule[0] item2 = rule[1] confidence = rule[2] support = rule[3] print(f'Rule: {item1} -> {item2}') print(f'Confidence: {confidence}') print(f'Support: {support} ')
Peraturan persatuan ialah salah satu teknik penting dalam perlombongan data, yang boleh membantu kami menemui perkaitan antara titik data. Dalam Python, kita boleh menggunakan algoritma peraturan persatuan dan metrik penilaian untuk mencari peraturan, menilai peraturan dan menganalisis serta meramal berdasarkan keputusan. Dalam amalan, kita mungkin perlu memvisualisasikan atau menyerahkan keputusan kepada model pembelajaran mesin untuk analisis lanjut bagi mendapatkan lebih banyak cerapan daripada data.
Atas ialah kandungan terperinci Bagaimana untuk menggunakan peraturan persatuan untuk perlombongan data dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!