Nama Syarikat Fuzzy Padanan dalam MySQL dengan PHP untuk Auto-Pelengkap
Pengenalan
Mencari padanan kabur untuk nama syarikat ialah tugas biasa dalam sistem autolengkap. Tugasan ini boleh mencabar kerana bilangan besar syarikat yang berpotensi sepadan dan keperluan untuk algoritma carian yang cekap.
Pengindeksan Soundex
Satu pendekatan untuk pemadanan kabur ialah menggunakan Soundex pengindeksan. Soundex ialah algoritma fonetik yang mengekod perkataan berdasarkan sebutannya. Ini membolehkan anggaran padanan perkataan, walaupun ia mempunyai ejaan yang berbeza. Walau bagaimanapun, pengindeksan Soundex mempunyai had, seperti tidak dapat membezakan antara rentetan yang lebih panjang dan memerlukan huruf pertama adalah sama.
Jarak Levenshtein
Pendekatan yang lebih maju kepada padanan kabur menggunakan jarak Levenshtein. Jarak Levenshtein mengukur bilangan sisipan, pemadaman atau penggantian yang diperlukan untuk mengubah satu rentetan kepada rentetan yang lain. Tidak seperti Soundex, kaedah ini tidak mempunyai kelemahan yang dinyatakan sebelum ini.
Menggunakan Jarak Levenshtein dalam PHP
Laman web codejanitor.com menyediakan contoh fungsi tersimpan MySQL yang mengira jarak Levenshtein. Anda boleh menggunakan fungsi ini untuk melakukan padanan kabur pada nama syarikat seperti berikut:
// Load MySQL stored function (if not already loaded) if (!function_exists('Levenshtein')) { $sql = "CREATE FUNCTION Levenshtein(s1 VARCHAR(255), s2 VARCHAR(255)) RETURNS INT BEGIN DECLARE lv_s1, lv_s2 VARCHAR(255); DECLARE lv_len1, lv_len2, lv_i, lv_j, lv_c, lv_cost INT; DECLARE lv_arr1[255] INT; SET lv_s1 = LOWER(s1); SET lv_s2 = LOWER(s2); SET lv_len1 = LENGTH(lv_s1); SET lv_len2 = LENGTH(lv_s2); -- Initialize the array SET lv_arr1[1] = 0; FOR lv_i = 1 TO lv_len1 DO SET lv_arr1[lv_i + 1] = lv_i; END FOR; -- Step 2 FOR lv_j = 1 TO lv_len2 DO SET lv_c = lv_j; FOR lv_i = 1 TO lv_len1 DO IF SUBSTRING(lv_s1, lv_i, 1) = SUBSTRING(lv_s2, lv_j, 1) THEN SET lv_cost = 0; ELSE SET lv_cost = 1; END IF; SET lv_c = LEAST(lv_c + 1, lv_arr1[lv_i] + lv_cost, lv_arr1[lv_i - 1] + 1); SET lv_arr1[lv_i] = lv_c; END FOR; END FOR; RETURN lv_c; END;"; $result = $mysqli->query($sql); } // Execute fuzzy matching query $numWords = 0; $userInput = "Microsift"; $query = "SELECT company_name, Levenshtein('$userInput', company_name) AS distance FROM companies ORDER BY distance ASC"; $result = $mysqli->query($query); // Display results while ($row = $result->fetch_assoc()) { $numWords++; echo $row['company_name'] . " (" . $row['distance'] . ")\n"; } if ($numWords == 0) { echo "No matches found.\n"; }
Atas ialah kandungan terperinci Bagaimanakah saya boleh melaksanakan padanan nama syarikat kabur dalam MySQL dengan PHP untuk pelengkapan automatik?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!