Rumah pembangunan bahagian belakang Tutorial Python Penjelasan terperinci algoritma Apriori dalam Python

Penjelasan terperinci algoritma Apriori dalam Python

Jun 10, 2023 am 08:03 AM
perlombongan data pengaturcaraan python algoritma apriori

Algoritma Apriori ialah kaedah biasa untuk perlombongan peraturan persatuan dalam bidang perlombongan data, dan digunakan secara meluas dalam risikan perniagaan, pemasaran dan bidang lain. Sebagai bahasa pengaturcaraan umum, Python juga menyediakan berbilang perpustakaan pihak ketiga untuk melaksanakan algoritma Apriori Artikel ini akan memperkenalkan secara terperinci prinsip, pelaksanaan dan aplikasi algoritma Apriori dalam Python.

1. Prinsip algoritma Apriori

Sebelum memperkenalkan prinsip algoritma Apriori, mari kita pelajari dua konsep dalam perlombongan peraturan persatuan: set item kerap dan sokongan.

Set item kerap: merujuk kepada set item yang sering muncul bersama dalam set data tertentu.

Sokongan: Kekerapan set item yang muncul dalam semua transaksi dipanggil sokongan.

Sebagai contoh, dalam data transaksi pasar raya, kekerapan gabungan {susu, kek} dalam semua transaksi ialah 10%. Kemudian, sokongan untuk gabungan ini ialah 10%.

Algoritma Apriori adalah berdasarkan konsep set item kerap dan meneroka korelasi antara item dengan mencari set item kerap lapisan demi lapisan. Ideanya adalah seperti berikut:

  1. Melombong set item kerap dari bawah ke atas, bermula dari set item tunggal (iaitu, item yang dibeli secara individu).
  2. Hanya apabila sokongan set item memenuhi ambang sokongan minimum pratetap, ia boleh dianggap sebagai set item kerap.
  3. Bina set peraturan perkaitan yang kukuh berdasarkan set item yang kerap. Peraturan perkaitan yang kukuh merujuk kepada peraturan yang perkaitan antara item syarat dan item hasil dalam peraturan perkaitan adalah sangat rapat.

Secara khusus, proses pelaksanaan algoritma Apriori adalah seperti berikut:

  1. Kira semua item dan dapatkan kiraan sokongan bagi set item tunggal.
  2. Untuk setiap set item tunggal yang sokongannya memenuhi ambang sokongan minimum, set item tersebut boleh dianggap sebagai set item kerap.
  3. Untuk setiap set item yang kerap, jana semua subset bukan kosongnya dan hitung sokongan setiap subset dengan mengira semasa proses penjanaan.
  4. Jika sokongan subset yang dijana pada masa ini memenuhi ambang sokongan minimum, subset disimpan sebagai set item kerap.
  5. Bina set peraturan perkaitan yang kukuh berdasarkan set item yang kerap. Untuk set item yang kerap, anda boleh memilih subset sebagai syarat, dan bahagian yang tinggal sebagai hasilnya, dan mengira keyakinannya. Jika keyakinan memenuhi ambang keyakinan minimum, peraturan perkaitan disimpan sebagai peraturan yang kukuh.
  6. Lakukan langkah 3 hingga 5 secara berulang sehingga tiada set item kerap baharu atau peraturan kukuh.

Perlu diambil perhatian bahawa kerumitan masa algoritma Apriori adalah sangat tinggi kerana ia memerlukan pengiraan sokongan untuk setiap subset bukan kosong. Untuk mengurangkan jumlah pengiraan, beberapa teknik pengoptimuman boleh digunakan, seperti penggunaan jadual cincang dan pengurangan calon.

2. Python melaksanakan algoritma Apriori

Terdapat berbilang perpustakaan pihak ketiga dalam Python yang boleh melaksanakan algoritma Apriori, seperti mlxtend, Orange, dsb. Berikut menggunakan mlxtend sebagai contoh untuk memperkenalkan langkah pelaksanaan algoritma Apriori.

  1. Pasang perpustakaan mlxtend

Pasang mlxtend menggunakan pip:

pip install mlxtend
Salin selepas log masuk
  1. Import perpustakaan yang diperlukan

Import perpustakaan numpy dan perpustakaan mlxtend:

import numpy as np
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules
Salin selepas log masuk
  1. Sediakan data

Jana set data transaksi mudah, mengandungi 4 rekod transaksi, setiap rekod terdiri daripada beberapa item Komposisi:

dataset = [['牛奶', '面包', '啤酒', '尿布'],
           ['牛奶', '面包', '啤酒', '尿布'],
           ['面包', '啤酒', '尿布', '饼干'],
           ['牛奶', '尿布', '啤酒', '饼干']]
Salin selepas log masuk
  1. Tukar data kepada jadual Boolean

Gunakan TransactionEncoder untuk menukar data kepada jadual Boolean Langkah ini adalah untuk mengekstrak set item kerap daripada set data transaksi:

te = TransactionEncoder()
te_ary = te.fit(dataset).transform(dataset)
df = pd.DataFrame(te_ary, columns=te.columns_)
Salin selepas log masuk
  1. Melombong set item kerap

Gunakan fungsi Apriori untuk melombong set item kerap dari jadual Boolean:

frequent_itemsets = apriori(df, min_support=0.5, use_colnames=True)
Salin selepas log masuk

Dengan menetapkan parameter min_support, anda boleh mengawal kekerapan Sokongan minimum set item. Dalam kod di atas, sokongan minimum ditetapkan kepada 0.5.

  1. Bina set peraturan persatuan yang kukuh

Berdasarkan set item yang kerap, gunakan fungsi association_rules untuk membina set peraturan persatuan yang kukuh:

rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.7)
Salin selepas log masuk

Oleh menetapkan parameter metrik, anda boleh Kawal metrik yang digunakan untuk menilai kebaikan peraturan persatuan. Dalam kod di atas, keyakinan digunakan sebagai metrik penilaian dan ambang keyakinan minimum ditetapkan kepada 0.7.

3. Senario aplikasi algoritma Apriori

Algoritma Apriori boleh digunakan dalam banyak bidang, seperti pemasaran, sistem pengesyoran, analisis rangkaian sosial, dsb. Berikut mengambil platform e-dagang sebagai contoh untuk menunjukkan aplikasi algoritma Apriori dalam pengesyoran produk.

Platform e-dagang biasanya merekodkan rekod transaksi pengguna dan menggunakan rekod ini untuk mengesyorkan produk yang pengguna mungkin berminat. Melalui algoritma Apriori, kombinasi produk frekuensi tinggi boleh dilombong Contohnya, orang yang membeli produk A, B dan C mempunyai kebarangkalian yang tinggi untuk membeli produk D. Berdasarkan peraturan persatuan ini, platform e-dagang boleh mengesyorkan produk yang sepadan kepada pengguna untuk meningkatkan kadar transaksi dan pengalaman membeli-belah pengguna.

4. Kesimpulan

Algoritma Apriori ialah kaedah perlombongan peraturan persatuan yang biasa, dan terdapat berbilang perpustakaan pihak ketiga dalam Python yang boleh melaksanakan algoritma ini. Melalui perpustakaan ini, set item yang kerap dan peraturan persatuan boleh dilombong dengan mudah untuk menyediakan sokongan untuk analisis data dan membuat keputusan perniagaan.

Atas ialah kandungan terperinci Penjelasan terperinci algoritma Apriori dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Cara menggunakan Python untuk skrip dan pelaksanaan di Linux Cara menggunakan Python untuk skrip dan pelaksanaan di Linux Oct 05, 2023 am 11:45 AM

Cara menggunakan Python untuk menulis dan melaksanakan skrip dalam Linux Dalam sistem pengendalian Linux, kita boleh menggunakan Python untuk menulis dan melaksanakan pelbagai skrip. Python ialah bahasa pengaturcaraan ringkas dan berkuasa yang menyediakan banyak perpustakaan dan alatan untuk menjadikan skrip lebih mudah dan lebih cekap. Di bawah ini kami akan memperkenalkan langkah asas cara menggunakan Python untuk penulisan dan pelaksanaan skrip dalam Linux, dan menyediakan beberapa contoh kod khusus untuk membantu anda memahami dan menggunakannya dengan lebih baik. Pasang Python

Bagaimana untuk membangunkan pengimbas kerentanan dalam Python Bagaimana untuk membangunkan pengimbas kerentanan dalam Python Jul 01, 2023 am 08:10 AM

Gambaran keseluruhan cara membangunkan pengimbas kerentanan melalui Python Dalam persekitaran hari ini yang meningkatkan ancaman keselamatan Internet, pengimbas kerentanan telah menjadi alat penting untuk melindungi keselamatan rangkaian. Python ialah bahasa pengaturcaraan popular yang ringkas, mudah dibaca dan berkuasa, sesuai untuk membangunkan pelbagai alat praktikal. Artikel ini akan memperkenalkan cara menggunakan Python untuk membangunkan pengimbas kerentanan untuk menyediakan perlindungan masa nyata untuk rangkaian anda. Langkah 1: Tentukan Sasaran Imbasan Sebelum membangunkan pengimbas kerentanan, anda perlu menentukan sasaran yang ingin anda imbas. Ini boleh menjadi rangkaian anda sendiri atau apa sahaja yang anda mempunyai kebenaran untuk menguji

Penggunaan fungsi sqrt() dalam Python Penggunaan fungsi sqrt() dalam Python Feb 21, 2024 pm 03:09 PM

Contoh penggunaan dan kod fungsi sqrt() dalam Python 1. Fungsi dan pengenalan fungsi sqrt() Dalam pengaturcaraan Python, fungsi sqrt() ialah fungsi dalam modul matematik, dan fungsinya adalah untuk mengira punca kuasa dua bagi nombor. Punca kuasa dua bermaksud nombor yang didarab dengan sendirinya sama dengan kuasa dua nombor itu, iaitu, x*x=n, maka x ialah punca kuasa dua bagi n. Fungsi sqrt() boleh digunakan dalam atur cara untuk mengira punca kuasa dua. 2. Cara menggunakan fungsi sqrt() dalam Python, sq

Ajar anda cara menggunakan pengaturcaraan Python untuk merealisasikan dok antara muka pengecaman imej Baidu dan merealisasikan fungsi pengecaman imej. Ajar anda cara menggunakan pengaturcaraan Python untuk merealisasikan dok antara muka pengecaman imej Baidu dan merealisasikan fungsi pengecaman imej. Aug 25, 2023 pm 03:10 PM

Ajar anda menggunakan pengaturcaraan Python untuk melaksanakan dok antara muka pengecaman imej Baidu dan merealisasikan fungsi pengecaman imej Dalam bidang penglihatan komputer, teknologi pengecaman imej adalah teknologi yang sangat penting. Baidu menyediakan antara muka pengecaman imej yang berkuasa yang melaluinya kami boleh melaksanakan pengelasan imej, pelabelan, pengecaman muka dan fungsi lain dengan mudah. Artikel ini akan mengajar anda cara menggunakan bahasa pengaturcaraan Python untuk melaksanakan fungsi pengecaman imej dengan menyambung ke antara muka pengecaman imej Baidu. Pertama, kita perlu membuat aplikasi pada Platform Pembangun Baidu dan mendapatkan

Amalan pengaturcaraan Python: Cara menggunakan API Peta Baidu untuk menjana fungsi peta statik Amalan pengaturcaraan Python: Cara menggunakan API Peta Baidu untuk menjana fungsi peta statik Jul 30, 2023 pm 09:05 PM

Amalan pengaturcaraan Python: Cara menggunakan API Peta Baidu untuk menjana fungsi peta statik Pengenalan: Dalam masyarakat moden, peta telah menjadi bahagian yang amat diperlukan dalam kehidupan manusia. Apabila bekerja dengan peta, kami selalunya perlu mendapatkan peta statik kawasan tertentu untuk dipaparkan pada halaman web, apl mudah alih atau laporan. Artikel ini akan memperkenalkan cara menggunakan bahasa pengaturcaraan Python dan API Peta Baidu untuk menjana peta statik dan menyediakan contoh kod yang berkaitan. 1. Kerja-kerja penyediaan Bagi merealisasikan fungsi penjanaan peta statik menggunakan API Peta Baidu, I

Bagaimana untuk menulis algoritma analisis komponen utama PCA dalam Python? Bagaimana untuk menulis algoritma analisis komponen utama PCA dalam Python? Sep 20, 2023 am 10:34 AM

Bagaimana untuk menulis algoritma analisis komponen utama PCA dalam Python? PCA (Analisis Komponen Utama) ialah algoritma pembelajaran tanpa pengawasan yang biasa digunakan untuk mengurangkan dimensi data untuk memahami dan menganalisis data dengan lebih baik. Dalam artikel ini, kita akan belajar cara menulis algoritma analisis komponen utama PCA menggunakan Python dan memberikan contoh kod khusus. Langkah-langkah PCA adalah seperti berikut: Seragamkan data: Sifarkan min setiap ciri data dan laraskan varians kepada julat yang sama untuk memastikan

Pengaturcaraan Python untuk menganalisis fungsi penukaran koordinat dalam dokumentasi API Peta Baidu Pengaturcaraan Python untuk menganalisis fungsi penukaran koordinat dalam dokumentasi API Peta Baidu Aug 01, 2023 am 08:57 AM

Pengaturcaraan Python untuk menganalisis fungsi penukaran koordinat dalam dokumentasi API Peta Baidu Pengenalan: Dengan perkembangan pesat Internet, fungsi penentududukan peta telah menjadi bahagian yang amat diperlukan dalam kehidupan orang moden. Sebagai salah satu perkhidmatan peta paling popular di China, Peta Baidu menyediakan satu siri API untuk digunakan oleh pembangun. Artikel ini akan menggunakan pengaturcaraan Python untuk menganalisis fungsi penukaran koordinat dalam dokumentasi API Peta Baidu dan memberikan contoh kod yang sepadan. 1. Pengenalan Dalam pembangunan, kita kadangkala melibatkan isu penukaran koordinat. AP Peta Baidu

Bagaimana untuk melakukan pemprosesan dan pengecaman imej dalam Python Bagaimana untuk melakukan pemprosesan dan pengecaman imej dalam Python Oct 20, 2023 pm 12:10 PM

Cara melakukan pemprosesan dan pengecaman imej dalam Python Ringkasan: Teknologi moden telah menjadikan pemprosesan dan pengecaman imej sebagai alat penting dalam banyak bidang. Python ialah bahasa pengaturcaraan yang mudah dipelajari dan digunakan dengan pemprosesan imej yang kaya dan perpustakaan pengecaman. Artikel ini akan memperkenalkan cara menggunakan Python untuk pemprosesan dan pengecaman imej, serta memberikan contoh kod khusus. Pemprosesan imej: Pemprosesan imej ialah proses melaksanakan pelbagai operasi dan transformasi pada imej untuk meningkatkan kualiti imej, mengekstrak maklumat daripada imej, dsb. Perpustakaan PIL dalam Python (Pi

See all articles