たとえば、正規表現を使用して shá のピンインを照合します。 ps: 前に述べたことは明確ではないかもしれません。「たとえば」という単語を使用しました。これは、処理対象のテキストにピンインがあることを意味しますが、具体的なピンインが何であるかはわかりません。これらのピンインを調べると、処理されるテキストは中国語になります。、ピンイン、記号 (,.: など) であるため、re.search(u'sha', text) 単純な固定文字列ではなく、通常の文字列である必要があります。 。 。
re.search(u'sha', text)
ringa_lee
リーリー
一致する結果: ['ís', 'à', 'pìnyin', 'about', 'shá'] デフォルトのピンインは大文字を除いてすべて小文字であるため、最初の Thís は一致しません。
すべての合法的なピンインを照合しますか?
その場合は、辞書のピンイン索引を見つけて、すべてのピンイン |をまとめることができます。ピンインは通常の規則やその他の機械的な規則に従って定義されていないため、このようになるのは当然です。何も見逃しておらず、あまりにも多くない場合、これができるすべてです。
|
リーリー
一致する結果:
['ís', 'à', 'pìnyin', 'about', 'shá']
デフォルトのピンインは大文字を除いてすべて小文字であるため、最初の Thís は一致しません。
すべての合法的なピンインを照合しますか?
その場合は、辞書のピンイン索引を見つけて、すべてのピンイン
|
をまとめることができます。ピンインは通常の規則やその他の機械的な規則に従って定義されていないため、このようになるのは当然です。何も見逃しておらず、あまりにも多くない場合、これができるすべてです。リーリー