ホームページ > バックエンド開発 > PHPチュートリアル > PHP では中国語の文字をピンインに変換する方法がありますが、ピンインを使用して中国語の文字を検索するとどうなるでしょうか?

PHP では中国語の文字をピンインに変換する方法がありますが、ピンインを使用して中国語の文字を検索するとどうなるでしょうか?

WBOY
リリース: 2016-06-23 14:13:09
オリジナル
1220 人が閲覧しました

では、ピンインを使用して中国語の文字を検索するとどうなるでしょうか?

txt の中国語テキストを呼び出して、コンテンツの各行をピンインに変換すると、
これはシンプルで非常に効率的です。 次に、ピンインを使用して中国語の文字を検索すると、突然、効率が驚くほど低いことに気づきます。
頭が痛くなりました。 ! ! ! ! !

define( "DIR", dirname( __FILE__ ) );
$TC=count($Titleline);
の($i = 1; $i $x=strcmp ($yuming,py($Titleline[$i]));
if($x == 0):
$ Title1=$Titleline[$i];
Break;
endif;
}
コードは上記の通りです
py は中国語の文字をピンインに変換する関数です


hanzi.txt のサイズが 1-3M を超えると問題が発生します。 、、速度 非常に遅くなります、、、
この問題の対処方法、、、


ディスカッションへの返信(解決策)

まず説明させてください、同音異義語の存在により(同音異義語がたくさんあります)

そこで、中国語の文字を検索するのにピンインを使用します。これは基本的に無意味です


複数のハッシュ テーブルを使用してデータを整理すると、効率的にクエリを実行できます

まず、同音異義語が存在するため説明させていただきます (異なる意味を持つ同音異義語が多数あります)

したがって、ピンインから中国語の文字を見つけることは基本的には意味がありません


複数のハッシュ テーブルを使用してデータを整理すると、効率的なクエリが可能になります。この例を挙げていただけますか?

まず説明しておきますが、同音異義語が存在するためです (意味の異なる同音異義語がたくさんあります)
したがって、ピンインから中国語の文字を見つけることは基本的に無意味です

複数のハッシュ テーブルを使用してデータを整理すると、効率的にクエリを実行できます ちなみに、データベースが使用できません。 。操作できるのはtxtだけです


トライアルゴリズムを使うだけです
「中国語ピンイン計画」によると、すべての漢字は頭音と語尾だけで構成されています 声調を追加できれば良いです
せいぜいトリプルハッシュテーブルです。完成です


トライアルゴリズムを使うだけです
「中国語ピンイン計画」によると、すべての漢字は頭音と語尾だけで構成されています 声調を追加できれば良いです
せいぜいトリプルハッシュテーブルです. モデレータは経験豊富で、初心者として、どう始めればよいかわかりません。 。 。 。 。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート