백엔드 개발 PHP 튜토리얼 php-perl哈希算法实现(times33哈希算法)_PHP

php-perl哈希算法实现(times33哈希算法)_PHP

Jun 01, 2016 am 11:58 AM
해시 알고리즘

复制代码 代码如下:
APR_DECLARE_NONSTD(unsigned int) apr_hashfunc_default(const char *char_key,
                                                      apr_ssize_t *klen)
{
    unsigned int hash = 0;
    const unsigned char *key = (const unsigned char *)char_key;
    const unsigned char *p;
    apr_ssize_t i;

    /*
     * This is the popular `times 33' hash algorithm which is used by
     * perl and also appears in Berkeley DB. This is one of the best
     * known hash functions for strings because it is both computed
     * very fast and distributes very well.
     *
     * The originator may be Dan Bernstein but the code in Berkeley DB
     * cites Chris Torek as the source. The best citation I have found
     * is "Chris Torek, Hash function for text in C, Usenet message
     * in comp.lang.c , October, 1990." in Rich
     * Salz's USENIX 1992 paper about INN which can be found at
     * .
     *
     * The magic of number 33, i.e. why it works better than many other
     * constants, prime or not, has never been adequately explained by
     * anyone. So I try an explanation: if one experimentally tests all
     * multipliers between 1 and 256 (as I did while writing a low-level
     * data structure library some time ago) one detects that even
     * numbers are not useable at all. The remaining 128 odd numbers
     * (except for the number 1) work more or less all equally well.
     * They all distribute in an acceptable way and this way fill a hash
     * table with an average percent of approx. 86%.
     *
     * If one compares the chi^2 values of the variants (see
     * Bob Jenkins ``Hashing Frequently Asked Questions'' at
     * http://burtleburtle.net/bob/hash/hashfaq.html for a description
     * of chi^2), the number 33 not even has the best value. But the
     * number 33 and a few other equally good numbers like 17, 31, 63,
     * 127 and 129 have nevertheless a great advantage to the remaining
     * numbers in the large set of possible multipliers: their multiply
     * operation can be replaced by a faster operation based on just one
     * shift plus either a single addition or subtraction operation. And
     * because a hash function has to both distribute good _and_ has to
     * be very fast to compute, those few numbers should be preferred.
     *
     *                  -- Ralf S. Engelschall
     */

    if (*klen == APR_HASH_KEY_STRING) {
        for (p = key; *p; p++) {
            hash = hash * 33 + *p;
        }
        *klen = p - key;
    }
    else {
        for (p = key, i = *klen; i; i--, p++) {
            hash = hash * 33 + *p;
        }
    }
    return hash;
}

对函数注释部分的翻译: 这是很出名的times33哈希算法,此算法被perl语言采用并在Berkeley DB中出现.它是已知的最好的哈希算法之一,在处理以字符串为键值的哈希时,有着极快的计算效率和很好哈希分布.最早提出这个算法的是Dan Bernstein,但是源代码确实由Clris Torek在Berkeley DB出实作的.我找到的最确切的引文中这样说”Chris Torek,C语言文本哈希函数,Usenet消息 in comp.lang.c ,1990年十月.”在Rich Salz于1992年在USENIX报上发表的讨论INN的文章中提到.这篇文章可以在上找到. 33这个奇妙的数字,为什么它能够比其他数值效果更好呢?无论重要与否,却从来没有人能够充分说明其中的原因.因此在这里,我来试着解释一下.如果某人试着测试1到256之间的每个数字(就像我前段时间写的一个底层数据结构库那样),他会发现,没有哪一个数字的表现是特别突出的.其中的128个奇数(1除外)的表现都差不多,都能够达到一个能接受的哈希分布,平均分布率大概是86%. 如果比较这128个奇数中的方差值(gibbon:统计术语,表示随机变量与它的数学期望之间的平均偏离程度)的话(见Bob Jenkins的http://burtleburtle.net/bob/hash/hashfaq.html,中对平方差的描述),数字33并不是表现最好的一个.(gibbon:这里按照我的理解,照常理,应该是方差越小稳定,但是由于这里不清楚作者方差的计算公式,以及在哈希离散表,是不是离散度越大越好,所以不得而知这里的表现好是指方差值大还是指方差值小),但是数字33以及其他一些同样好的数字比如 17,31,63,127和129对于其他剩下的数字,在面对大量的哈希运算时,仍然有一个大大的优势,就是这些数字能够将乘法用位运算配合加减法来替换,这样的运算速度会提高.毕竟一个好的哈希算法要求既有好的分布,也要有高的计算速度,能同时达到这两点的数字很少.

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Golang 함수 해시, crc32, md5 및 sha1 계산 방법 Golang 함수 해시, crc32, md5 및 sha1 계산 방법 May 18, 2023 am 08:12 AM

Golang은 풍부한 표준 라이브러리와 내장 기능을 갖춘 새로운 고성능 프로그래밍 언어입니다. 여기에는 파일 확인, 데이터 확인 등을 위해 데이터의 해시 값을 생성하는 데 사용할 수 있는 해시 함수가 포함됩니다. 이번 글에서는 Golang에서 흔히 사용되는 hash, crc32, md5, sha1 함수의 계산 방법과 응용을 소개하겠습니다. 1. 해시 함수 Golang의 해시 함수에는 SHA-1, MD5, SHA-224, SHA-256, SH 등 다양한 해시 알고리즘이 포함되어 있습니다.

Java 함수 라이브러리에서 일반적으로 사용되는 해시 알고리즘 도구는 무엇입니까? Java 함수 라이브러리에서 일반적으로 사용되는 해시 알고리즘 도구는 무엇입니까? Apr 30, 2024 pm 03:21 PM

Java 함수 라이브러리에서 MessageDigest 클래스는 해시 알고리즘에 사용될 수 있으며 다음을 포함하여 MD5, SHA 및 기타 해시 알고리즘의 구현을 제공합니다. 1. MD5 알고리즘: 인스턴스를 얻으려면 MessageDigest.getInstance("MD5")를 사용합니다. 2.SHA 알고리즘: SHA-1, SHA-256, SHA-384 및 SHA-512를 포함하여 MessageDigest.getInstance("SHA-256")를 사용하여 인스턴스를 얻습니다. 3. 기타 해싱 알고리즘: Algorithms.MessageDigest 또는 BouncyCastle 라이브러리와 같은 타사 라이브러리를 사용할 수 있습니다.

Python 2.x에서 해시 알고리즘 계산을 위해 hashlib 모듈을 사용하는 방법 Python 2.x에서 해시 알고리즘 계산을 위해 hashlib 모듈을 사용하는 방법 Jul 29, 2023 pm 05:16 PM

Python 2.x에서 해시 알고리즘 계산을 위해 hashlib 모듈을 사용하는 방법 Python 프로그래밍에서 해시 알고리즘은 데이터의 고유 식별을 생성하는 데 일반적으로 사용되는 알고리즘입니다. Python은 해시 알고리즘 계산을 수행하기 위해 hashlib 모듈을 제공합니다. 이 기사에서는 hashlib 모듈을 사용하여 해시 알고리즘 계산을 수행하는 방법을 소개하고 몇 가지 샘플 코드를 제공합니다. hashlib 모듈은 Python 표준 라이브러리의 일부이며 MD5, SH와 같은 다양한 공통 해시 알고리즘을 제공합니다.

Python을 사용하여 SHA 해싱 알고리즘을 구현하는 방법은 무엇입니까? Python을 사용하여 SHA 해싱 알고리즘을 구현하는 방법은 무엇입니까? Sep 19, 2023 pm 12:42 PM

Python을 사용하여 SHA 해싱 알고리즘을 구현하는 방법은 무엇입니까? SHA(Secure Hash Algorithm)는 모든 길이의 데이터에 대해 고정 길이의 고유 해시 값을 생성하는 일반적으로 사용되는 암호화 해시 함수입니다. hashlib 모듈은 Python에서 제공되며, 여기에는 SHA 알고리즘을 포함하여 일반적으로 사용되는 해싱 알고리즘이 포함되어 있습니다. 이 기사에서는 Python을 사용하여 SHA 해시 알고리즘을 구현하는 방법을 자세히 소개하고 관련 코드 예제를 제공합니다. 먼저 hashlib 모듈을 가져와야 합니다. 다음은 hashlib 모듈을 가져오는 코드입니다.

공개된 Python 기반 기술: 해시 테이블 구현 방법 공개된 Python 기반 기술: 해시 테이블 구현 방법 Nov 08, 2023 am 11:53 AM

공개된 Python 기반 기술: 해시 테이블 구현 방법 해시 테이블은 컴퓨터 분야에서 매우 일반적이고 중요한 데이터 구조로, 많은 수의 키-값 쌍을 효율적으로 저장하고 검색할 수 있습니다. Python에서는 사전을 사용하여 해시 테이블을 사용할 수 있지만 구현 세부 사항을 깊이 이해하는 사람은 거의 없습니다. 이 기사에서는 Python에서 해시 테이블의 기본 구현 기술을 공개하고 구체적인 코드 예제를 제공합니다. 해시 테이블의 핵심 아이디어는 키를 단순히 순차적으로 저장하는 것이 아니라 해시 함수를 통해 고정된 크기의 배열로 매핑하는 것입니다.

PHP의 해시 알고리즘에 대한 자세한 설명 PHP의 해시 알고리즘에 대한 자세한 설명 Jul 07, 2023 pm 07:13 PM

PHP의 해시 알고리즘에 대한 자세한 설명 PHP 개발에서 해시 알고리즘은 일반적으로 사용되는 암호화 기술로, 어떤 길이의 데이터도 고정 길이의 해시 값으로 변환할 수 있습니다. 해시 알고리즘은 암호화, 데이터 무결성 확인 및 빠른 데이터 검색에 널리 사용됩니다. 이 기사에서는 PHP의 해싱 알고리즘을 자세히 소개하고 참조할 수 있는 몇 가지 코드 예제를 제공합니다. 1. 해시 알고리즘의 기본 원리 해시 알고리즘은 입력 데이터에 대해 일련의 수학적 연산을 수행하여 고정 길이의 해시 값을 생성합니다. 다음과 같은 기본 사항을 갖추고

Java를 사용하여 SHA 해시 알고리즘을 구현하는 방법 Java를 사용하여 SHA 해시 알고리즘을 구현하는 방법 Sep 20, 2023 pm 12:37 PM

Java를 사용하여 SHA 해시 알고리즘을 구현하는 방법 SHA(SecureHashAlgorithm)는 모든 길이의 데이터를 고정 길이 해시 값으로 변환하는 데 사용되는 일반적으로 사용되는 해시 알고리즘입니다. Java에서는 Java 표준 라이브러리의 MessageDigest 클래스를 사용하여 SHA 해싱 알고리즘을 구현할 수 있습니다. 아래에서는 SHA 해시 알고리즘을 Java로 구현하는 방법을 자세히 소개하고 해당 코드 예제를 첨부하겠습니다. 먼저 Java 코드를 작성해야 합니다.

Java를 사용하여 MD5 해시 알고리즘을 구현하는 방법 Java를 사용하여 MD5 해시 알고리즘을 구현하는 방법 Sep 21, 2023 am 08:31 AM

Java를 사용하여 MD5 해시 알고리즘을 구현하는 방법 MD5(MessageDigestAlgorithm5)는 데이터를 암호화하고 확인하는 데 일반적으로 사용되는 해시 알고리즘입니다. Java에서는 MessageDigest 클래스를 사용하여 MD5 해시 알고리즘을 구현할 수 있습니다. 다음은 Java를 사용하여 MD5 알고리즘을 구현하는 방법을 보여주는 간단한 샘플 코드입니다. importjava.security.MessageDigest;

See all articles