首頁 > 資料庫 > mysql教程 > MySQL中如何計算字串相似度百分比?

MySQL中如何計算字串相似度百分比?

Mary-Kate Olsen
發布: 2024-12-30 17:59:09
原創
220 人瀏覽過

How to Calculate String Similarity Percentage in MySQL?

如何在MySQL 中計算字串相似度

問題:

My決定它們的值相似度百分比。例如,給定字串“@a = 'Welcome to Stack Overflow'”和“@b = 'Hello to stack Overflow'”,您想要找到它們之間的相似性。

解決方案:

  1. 建立編輯距離函數:

    使用下列函數計算兩個字串之間的編輯距離:

    CREATE FUNCTION `levenshtein`(s1 text, s2 text) RETURNS int(11)
    DETERMINISTIC
    BEGIN 
    ...
    END
    登入後複製

    上述函數改編自提供的函數http://www.artfulsoftware.com/infotree/queries.php#552.

  2. 創建Levenshtein 相似度函數:

    至將 Levenshtein距離轉換成相似度,使用這個函數:

    CREATE FUNCTION `levenshtein_ratio`( s1 text, s2 text ) RETURNS int(11)
    DETERMINISTIC
    BEGIN 
    ...
    END
    登入後複製

用法:

要計算兩個字串之間的相似度百分比,請使用以下公式:

similarity_percentage = ((1 - LEVENSHTEIN(s1, s2) / MAX_LENGTH) * 100)
登入後複製
  • LEVENSHTEIN(s1, s2):計算兩個字串之間的編輯距離。
  • MAX_LENGTH:兩個字串的最大長度。

範例:

SELECT levenshtein_ratio('Welcome to Stack Overflow', 'Hello to stack overflow') AS similarity;
登入後複製

這個查詢會傳回兩個字串之間的相似度百分比,在本例中為 66%。

以上是MySQL中如何計算字串相似度百分比?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板