이진 문자열에 대한 SQL의 해밍 거리 계산
에 저장된 SHA256 해시 간의 해밍 거리를 계산하는 효율적인 방법을 찾는 데 문제가 발생합니다. BINARY(32) 열. 이진 문자열을 하위 문자열로 분해하여 정수로 변환하고 하위 문자열별 해밍 거리 계산을 수행하는 간단한 접근 방식은 번거롭고 비효율적으로 보입니다.
그러나 성능을 크게 향상시키는 대체 솔루션이 있습니다. 각각 원본 데이터의 8바이트 하위 문자열을 포함하는 4개의 BIGINT 열에 해시를 저장하면 다음 함수를 활용할 수 있습니다.
<code class="sql">CREATE FUNCTION HAMMINGDISTANCE( A0 BIGINT, A1 BIGINT, A2 BIGINT, A3 BIGINT, B0 BIGINT, B1 BIGINT, B2 BIGINT, B3 BIGINT ) RETURNS INT DETERMINISTIC RETURN BIT_COUNT(A0 ^ B0) + BIT_COUNT(A1 ^ B1) + BIT_COUNT(A2 ^ B2) + BIT_COUNT(A3 ^ B3);</code>
이 함수는 비트별 XOR 연산을 수행하여 해밍 거리를 계산합니다. 그리고 결과에서 1의 개수를 세어보세요. 이 접근 방식은 이진 문자열 분해 방법보다 상당히 빠릅니다.
또한 효율성 향상을 위해 BINARY 열 대신 BIGINT 열을 사용하여 해시를 저장하는 것이 좋습니다. BIGINT를 사용하는 이 대체 방법은 실행 속도를 100배 이상 향상시킬 수 있습니다.
위 내용은 SQL에서 SHA256 해시에 대한 해밍 거리를 효율적으로 계산하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!