> 데이터 베이스 > MySQL 튜토리얼 > MySQL에서 문자열 유사성 백분율을 계산하는 방법은 무엇입니까?

MySQL에서 문자열 유사성 백분율을 계산하는 방법은 무엇입니까?

Mary-Kate Olsen
풀어 주다: 2024-12-30 17:59:09
원래의
220명이 탐색했습니다.

How to Calculate String Similarity Percentage in MySQL?

MySQL에서 문자열 유사성을 계산하는 방법

문제:

MySQL에 두 개의 문자열이 있고 그 문자열을 결정해야 합니다. 유사성 비율. 예를 들어 "@a = '스택 오버플로에 오신 것을 환영합니다'" 및 "@b = '스택 오버플로에 오신 것을 환영합니다'"라는 문자열이 있는 경우 두 문자열 사이의 유사성을 찾으려고 합니다.

해결책:

  1. 레벤슈타인 거리 생성 함수:

    두 문자열 사이의 Levenshtein 거리를 계산하려면 다음 함수를 사용하십시오.

    CREATE FUNCTION `levenshtein`(s1 text, s2 text) RETURNS int(11)
    DETERMINISTIC
    BEGIN 
    ...
    END
    로그인 후 복사

    위 함수는 다음에서 제공된 함수에서 적용되었습니다. http://www.artfulsoftware.com/infotree/queries.php#552.

  2. Levenshtein 유사성 비율 함수 생성:

    To Levenshtein 거리를 유사 비율로 변환하고 이를 사용합니다. 함수:

    CREATE FUNCTION `levenshtein_ratio`( s1 text, s2 text ) RETURNS int(11)
    DETERMINISTIC
    BEGIN 
    ...
    END
    로그인 후 복사

사용법:

두 문자열 간의 유사성 비율을 계산하려면 다음 공식을 사용하세요.

similarity_percentage = ((1 - LEVENSHTEIN(s1, s2) / MAX_LENGTH) * 100)
로그인 후 복사
  • LEVENSHTEIN(s1, s2): 다음을 계산합니다. 두 문자열 사이의 Levenshtein 거리.
  • MAX_LENGTH: 두 문자열의 최대 길이.

예:

SELECT levenshtein_ratio('Welcome to Stack Overflow', 'Hello to stack overflow') AS similarity;
로그인 후 복사

이것은 쿼리는 두 문자열 간의 유사성 비율을 반환합니다. 이 경우에는 다음과 같습니다. 66%.

위 내용은 MySQL에서 문자열 유사성 백분율을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿