Mengukur Kesamaan Rentetan dalam Python
Menentukan persamaan antara dua rentetan ialah tugas biasa dalam analisis data dan pemprosesan bahasa semula jadi. Dalam Python, perpustakaan difflib menyediakan cara yang mudah untuk mengukur persamaan rentetan menggunakan kelas SequenceMatcher.
Mengira Kebarangkalian Keserupaan
Untuk mengira kebarangkalian rentetan menjadi serupa dengan rentetan lain, gunakan langkah berikut:
def similar(a, b): return SequenceMatcher(None, a, b).ratio()
Kelas SequenceMatcher menyediakan kaedah nisbah() yang mengembalikan nilai perpuluhan antara 0 dan 1, dengan 1 menunjukkan padanan sempurna dan 0 menunjukkan tiada persamaan.
Contoh Penggunaan
Untuk mengira persamaan antara dua rentetan, seperti "Apple" dan "Appel", gunakan kod berikut:
result = similar("Apple", "Appel") print(result)
Ini akan mengeluarkan 0.8, menunjukkan nilai tinggi tahap persamaan. Untuk membandingkan rentetan yang kurang serupa, seperti "Apple" dan "Mango", kod itu akan mengeluarkan 0.0, menunjukkan tiada persamaan.
Dengan menggunakan kelas SequenceMatcher, anda boleh mengukur kesamaan antara rentetan dalam Python dengan berkesan dan memperoleh nilai kebarangkalian yang mengukur tahap persamaan antara dua rentetan.
Atas ialah kandungan terperinci Bagaimanakah Perpustakaan `difflib` Python Boleh Digunakan untuk Mengukur Kesamaan Rentetan dan Mengira Kebarangkalian Keserupaan?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!