Rumah > pangkalan data > tutorial mysql > Bagaimanakah saya boleh melaksanakan padanan nama syarikat kabur dalam MySQL dengan PHP untuk pelengkapan automatik?

Bagaimanakah saya boleh melaksanakan padanan nama syarikat kabur dalam MySQL dengan PHP untuk pelengkapan automatik?

Patricia Arquette
Lepaskan: 2024-12-14 16:52:11
asal
201 orang telah melayarinya

How can I implement fuzzy company name matching in MySQL with PHP for auto-completion?

Nama Syarikat Fuzzy Padanan dalam MySQL dengan PHP untuk Auto-Pelengkap

Pengenalan

Mencari padanan kabur untuk nama syarikat ialah tugas biasa dalam sistem autolengkap. Tugasan ini boleh mencabar kerana bilangan besar syarikat yang berpotensi sepadan dan keperluan untuk algoritma carian yang cekap.

Pengindeksan Soundex

Satu pendekatan untuk pemadanan kabur ialah menggunakan Soundex pengindeksan. Soundex ialah algoritma fonetik yang mengekod perkataan berdasarkan sebutannya. Ini membolehkan anggaran padanan perkataan, walaupun ia mempunyai ejaan yang berbeza. Walau bagaimanapun, pengindeksan Soundex mempunyai had, seperti tidak dapat membezakan antara rentetan yang lebih panjang dan memerlukan huruf pertama adalah sama.

Jarak Levenshtein

Pendekatan yang lebih maju kepada padanan kabur menggunakan jarak Levenshtein. Jarak Levenshtein mengukur bilangan sisipan, pemadaman atau penggantian yang diperlukan untuk mengubah satu rentetan kepada rentetan yang lain. Tidak seperti Soundex, kaedah ini tidak mempunyai kelemahan yang dinyatakan sebelum ini.

Menggunakan Jarak Levenshtein dalam PHP

Laman web codejanitor.com menyediakan contoh fungsi tersimpan MySQL yang mengira jarak Levenshtein. Anda boleh menggunakan fungsi ini untuk melakukan padanan kabur pada nama syarikat seperti berikut:

// Load MySQL stored function (if not already loaded)
if (!function_exists('Levenshtein')) {
    $sql = "CREATE FUNCTION Levenshtein(s1 VARCHAR(255), s2 VARCHAR(255)) RETURNS INT
    BEGIN
        DECLARE lv_s1, lv_s2 VARCHAR(255);
        DECLARE lv_len1, lv_len2, lv_i, lv_j, lv_c, lv_cost INT;
        DECLARE lv_arr1[255] INT;
    
        SET lv_s1 = LOWER(s1);
        SET lv_s2 = LOWER(s2);
        SET lv_len1 = LENGTH(lv_s1);
        SET lv_len2 = LENGTH(lv_s2);
    
        -- Initialize the array
        SET lv_arr1[1] = 0;
        FOR lv_i = 1 TO lv_len1 DO
            SET lv_arr1[lv_i + 1] = lv_i;
        END FOR;
    
        -- Step 2
        FOR lv_j = 1 TO lv_len2 DO
            SET lv_c = lv_j;
            FOR lv_i = 1 TO lv_len1 DO
                IF SUBSTRING(lv_s1, lv_i, 1) = SUBSTRING(lv_s2, lv_j, 1) THEN
                    SET lv_cost = 0;
                ELSE
                    SET lv_cost = 1;
                END IF;
                SET lv_c = LEAST(lv_c + 1, lv_arr1[lv_i] + lv_cost, lv_arr1[lv_i - 1] + 1);
                SET lv_arr1[lv_i] = lv_c;
            END FOR;
        END FOR;
    
        RETURN lv_c;
    END;";
    $result = $mysqli->query($sql);
}

// Execute fuzzy matching query
$numWords = 0;
$userInput = "Microsift";
$query = "SELECT company_name, Levenshtein('$userInput', company_name) AS distance
          FROM companies
          ORDER BY distance ASC";
$result = $mysqli->query($query);

// Display results
while ($row = $result->fetch_assoc()) {
    $numWords++;
    echo $row['company_name'] . " (" . $row['distance'] . ")\n";
}

if ($numWords == 0) {
    echo "No matches found.\n";
}
Salin selepas log masuk

Atas ialah kandungan terperinci Bagaimanakah saya boleh melaksanakan padanan nama syarikat kabur dalam MySQL dengan PHP untuk pelengkapan automatik?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan