では、ピンインを使用して中国語の文字を検索するとどうなるでしょうか?
txt の中国語テキストを呼び出して、コンテンツの各行をピンインに変換すると、
これはシンプルで非常に効率的です。 次に、ピンインを使用して中国語の文字を検索すると、突然、効率が驚くほど低いことに気づきます。
頭が痛くなりました。 ! ! ! ! !
define( "DIR", dirname( __FILE__ ) );
$TC=count($Titleline);
の($i = 1; $i $x=strcmp ($yuming,py($Titleline[$i]));
if($x == 0):
$ Title1=$Titleline[$i];
Break;
endif;
}
コードは上記の通りです
py は中国語の文字をピンインに変換する関数です
hanzi.txt のサイズが 1-3M を超えると問題が発生します。 、、速度 非常に遅くなります、、、
この問題の対処方法、、、
複数のハッシュ テーブルを使用してデータを整理すると、効率的にクエリを実行できます
まず、同音異義語が存在するため説明させていただきます (異なる意味を持つ同音異義語が多数あります)
複数のハッシュ テーブルを使用してデータを整理すると、効率的なクエリが可能になります。この例を挙げていただけますか?
まず説明しておきますが、同音異義語が存在するためです (意味の異なる同音異義語がたくさんあります)
したがって、ピンインから中国語の文字を見つけることは基本的に無意味です
トライアルゴリズムを使うだけです
「中国語ピンイン計画」によると、すべての漢字は頭音と語尾だけで構成されています 声調を追加できれば良いです
せいぜいトリプルハッシュテーブルです。完成です
トライアルゴリズムを使うだけです
「中国語ピンイン計画」によると、すべての漢字は頭音と語尾だけで構成されています 声調を追加できれば良いです
せいぜいトリプルハッシュテーブルです. モデレータは経験豊富で、初心者として、どう始めればよいかわかりません。 。 。 。 。