問題:
My決定它們的值相似度百分比。例如,給定字串“@a = 'Welcome to Stack Overflow'”和“@b = 'Hello to stack Overflow'”,您想要找到它們之間的相似性。
解決方案:
建立編輯距離函數:
使用下列函數計算兩個字串之間的編輯距離:
CREATE FUNCTION `levenshtein`(s1 text, s2 text) RETURNS int(11) DETERMINISTIC BEGIN ... END
上述函數改編自提供的函數http://www.artfulsoftware.com/infotree/queries.php#552.
創建Levenshtein 相似度函數:
至將 Levenshtein距離轉換成相似度,使用這個函數:
CREATE FUNCTION `levenshtein_ratio`( s1 text, s2 text ) RETURNS int(11) DETERMINISTIC BEGIN ... END
用法:
要計算兩個字串之間的相似度百分比,請使用以下公式:
similarity_percentage = ((1 - LEVENSHTEIN(s1, s2) / MAX_LENGTH) * 100)
範例:
SELECT levenshtein_ratio('Welcome to Stack Overflow', 'Hello to stack overflow') AS similarity;
這個查詢會傳回兩個字串之間的相似度百分比,在本例中為 66%。
以上是MySQL中如何計算字串相似度百分比?的詳細內容。更多資訊請關注PHP中文網其他相關文章!