PHP文字列ハッシュ関数アルゴリズムの実装コード-PHPチュートリアル-php.cn

PHP文字列ハッシュ関数アルゴリズムの実装コード

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

リリース： 2016-07-25 08:54:30

オリジナル

1462 人が閲覧しました

function DJBHash($str) // 0.22
{
$hash = 0;
$n = strlen($str);
for ($i = 0; $i {
$hash += ($hash }
return $hash % 701819;
}
function ELFHash($str) // 0.35
{
$hash = $x = 0;
$n = strlen($str);
for ($i = 0; $i {
$hash = ($hash $hash &= ~$x;
}
}
return $hash % 701819;
}
function JSHash($str) // 0.23
{
$hash = 0;
$n = strlen($str);
for ($i = 0; $i {
$hash ^= (($hash > ; 2));
}
return $hash % 701819;
}
function SDBMHash($str) // 0.23
{
$hash = 0 ;
$n = strlen($str);
for ($ i = 0; $i {
$hash = ord($str[$i]) + ($hash }
return $hash % 701819;
}
function APHash($str) // 0.30
{
$hash = 0 ;
$n = strlen($str);
for ($i = 0; $i {
if (($i & 1 ) == 0 )
{
$hash ^= (($hash }
else
{
$hash ^= ( ~ (($hash <<11 ) ^ ord($str[$i]) ^ ($hash>> 5)));
}
}
return $hash % 701819;
}
function DEKHash($str) // 0.23
{
$n = strlen($str);
$hash = $n;
for ($i = 0 ; $i {
$hash = (($hash > 27)) ^ ord($str[$i]);
}
return $hash % 701819;
}
function FNVHash($str) // 0.31
{
$hash = 0;
$n = strlen($str);
for ($i = 0; $i < ;$n; $i++)
{
$hash *= 0x811C9DC5;
$hash ^= ord($str[$i]);
}
return $hash % 701819;
}
関数 PJWHash($str ) // 0.33
{
$hash = $test = 0;
$n = strlen($str);
for ($i = 0; $i {
$hash = ($hash <<4) + ord($str[$i]);
if(($test = $hash & -268435456) != 0)
{
$hash = (( $hash ^ ( $test>> 24)) & (~-268435456));
}
}
return $hash % 701819;
}
function PHPHash($str) // 0.34
{
$hash = 0;
$n = strlen($str);
for ($i = 0; $i <$n; $i++)
{
$hash = ($hash <<4) + ord($str[$ i]);
if (($g = ($hash & 0xF0000000)))
{
$hash = $hash ^ ($g>> 24);
$hash = $hash ^ $g;
}
}
return $hash % 701819;
}
function OpenSSLHash($str) // 0.22
{
$hash = 0;
$n = strlen($str);
for ($i = 0; $i {
$hash ^= (ord($str[$i]) <<($i & 0x0f));
}
return $hash % 701819;
}
function MD5Hash($str ) // 0.050
{
$hash = md5($str);
$hash = $hash[0] | ($hash[1] return $hash % 701819;
}

复制代码

アルゴリズムの説明: 関数の後ろのコメントは、私のローカルテストでの実行速度 (単位: s) が 1000 倍であることがわかります。MD5Hash が最も速く、他の関数よりもはるかに高速であることがわかります。この関数のアルゴリズムでは、md5 以降の文字列の最初の 7 文字のみに依存します。つまり、最初の 7 文字が同じであれば、取得されるハッシュ値はまったく同じになります。あまり信頼できません....32文字に基づいて計算すると、速度は他のアルゴリズムよりもはるかに遅くなります...

MD5Hash を除いて、他のアルゴリズムは文字列の長さの影響を受けます。テストでは英語で 10 文字を使用しました。各関数の最終的な戻り値 $hash % 701819; 701819 はハッシュの最大容量を表しており、これらのハッシュ関数によって得られる最終的な数値範囲は 0 ～ 701819 を使用することが一般的であると考えられます。素数の結果の分布は比較的均一になります。701819 に近い値としては、175447、350899、1403641、2807303、5614657 があります。

これは何に使えるの...

なぜこれらのハッシュアルゴリズムを整理してテストする必要があるのでしょうか? 私はマルチユーザーブログを書いています。前回のブログでも述べましたが、これは一般にユーザーを使用する機能です。ブログアドレスとして英語と数字を組み合わせた名前 (第 2 レベルのドメイン名またはディレクトリ)。次に、ユーザー名に基づいてユーザーの ID を取得する方法について質問があります。もう 1 つのクエリはありますか?ハッシュ関数を使えば、ユーザー名を加工して数値を取得し、その数値に対して何らかの処理をする必要がありません（2桁を基準に階層ディレクトリに分けています。目的はそれを防ぐためです）。 1 つのディレクトリに多数のファイルを格納すると (ディスクの取得速度に影響します)、パスが形成され、対応する ID がこのパスの下のファイルに保存されます (個人的にはファイル名としてユーザー名を推奨します)。ユーザーの ID はユーザー名に基づいて直接取得でき、クエリは必要ありません。ユーザー名はファイル名として使用されるため、最終結果が同じであっても、それらは異なるファイルに存在するため、必要はありません。衝突を心配するため。

もちろん...あなたのシステムが完全にユーザー名に基づいて動作する場合、私はこれを前に言いませんでした = =b、私は静かに SELECT を批判します。なぜなら数値は文字列よりも速いからです。

私は DJB アルゴリズムを選択しました。オンライン化後に MD5 配布テストが許容される場合は、それに切り替えることを検討します。

ここから、ハッシュが実際に分散に非常に役立つこともわかります。笑、分散ストレージを必要とするキャッシュ、静的、その他の用途に使用できます。