Regulärer Ausdruck – Wie kann man chinesisches Pinyin mit Python abgleichen?
ringa_lee
ringa_lee 2017-05-27 17:39:30
0
3
1757

Verwenden Sie beispielsweise reguläre Ausdrücke, um das Pinyin von shá abzugleichen.
ps: Was ich zuvor gesagt habe, ist möglicherweise nicht klar. Ich habe das Wort „zum Beispiel“ verwendet, was bedeutet, dass der zu verarbeitende Text Pinyin enthält, aber ich weiß nicht, was das spezifische Pinyin ist, das ich finden muss Geben Sie diese Pinyin-Zeichen aus. Der zu verarbeitende Text enthält chinesische und Pinyin-Symbole (,.: und dergleichen). Beantworten Sie daher bitte keine Fragen wie re.search(u'shá',text) Es muss regelmäßig sein, keine einfache feste Zeichenfolge. . .

ringa_lee
ringa_lee

ringa_lee

Antworte allen(3)
巴扎黑
import re
regex = re.compile(r'\b[a-z]*[āáǎàōóǒòêēéěèīíǐìūúǔùǖǘǚǜüńňǹɑɡ]+[a-z]*\b')
text = "Thǐs ís à pìnyin abóut shá"
m = regex.findall(text)
print(m)

匹配结果:
['ís', 'à', 'pìnyin', 'abóut', 'shá']
没有匹配第一个Thǐs,因为默认拼音都是小写,排除了大写。

PHPzhong

你是要匹配所有合法的拼音吗?

如果是,你去找个字典的拼音索引,把里边的所有拼音全部 | 到一起就可以了。也只能这样,因为拼音不是根据正则,或者其它某种机械的规则定义出来的。你想不漏又不多就只能这样了,反正也没多少个。

伊谢尔伦
>>> import re
>>> d='shá'
>>> data='This is a pinyin about shá'
>>> re.search(d,data)
<_sre.SRE_Match at 0x404e308>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage