문제:
MySQL에 두 개의 문자열이 있고 그 문자열을 결정해야 합니다. 유사성 비율. 예를 들어 "@a = '스택 오버플로에 오신 것을 환영합니다'" 및 "@b = '스택 오버플로에 오신 것을 환영합니다'"라는 문자열이 있는 경우 두 문자열 사이의 유사성을 찾으려고 합니다.
해결책:
레벤슈타인 거리 생성 함수:
두 문자열 사이의 Levenshtein 거리를 계산하려면 다음 함수를 사용하십시오.
CREATE FUNCTION `levenshtein`(s1 text, s2 text) RETURNS int(11) DETERMINISTIC BEGIN ... END
위 함수는 다음에서 제공된 함수에서 적용되었습니다. http://www.artfulsoftware.com/infotree/queries.php#552.
Levenshtein 유사성 비율 함수 생성:
To Levenshtein 거리를 유사 비율로 변환하고 이를 사용합니다. 함수:
CREATE FUNCTION `levenshtein_ratio`( s1 text, s2 text ) RETURNS int(11) DETERMINISTIC BEGIN ... END
사용법:
두 문자열 간의 유사성 비율을 계산하려면 다음 공식을 사용하세요.
similarity_percentage = ((1 - LEVENSHTEIN(s1, s2) / MAX_LENGTH) * 100)
예:
SELECT levenshtein_ratio('Welcome to Stack Overflow', 'Hello to stack overflow') AS similarity;
이것은 쿼리는 두 문자열 간의 유사성 비율을 반환합니다. 이 경우에는 다음과 같습니다. 66%.
위 내용은 MySQL에서 문자열 유사성 백분율을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!