文字列は上記の通り、型は'str'、漢字は規則性で取得する必要があります。以前 [u4e00-u9fa5] を使用したときは、依然として英語の記号と数字のリストが表示されました。正しい姿勢を教えてください。また、どこで間違えたのか教えてください...
これは私が書いたものです...しかし、返された結果には漢字は含まれておらず、漢字以外の他の文字が含まれています。
温故而知新,可以为师矣。 博客:www.ouyangke.com
ここでは、一致する必要があるテキストが s であると仮定します:
s
ここでの decode('utf8')是怕s的值为类似x66x77x88这样的Unicode散列。另外,需要注意compile()中ur修饰符,u は Unicode 修飾子です。
decode('utf8')
x66x77x88
compile()
ur
u
追記:私はこの記事にインスピレーションを受けました。
下の階で言われたことを読みました。確かに、Python 3 では出力は Unicode ハッシュです。以下はここからの抜粋です。
Unicode文字列 Python2 では、通常の文字列は 8 ビット ASCII コードとして保存されますが、Unicode 文字列は 16 ビット Unicode 文字列として保存され、より多くの文字セットを表現できます。使用される構文は、文字列の前に u を付けます。 Python3 では、すべての文字列は Unicode 文字列です。
Python2、uxxxx是unicode字符,匹配后得到的是字节文字列を使用しています。出力されるのは各バイト値です。
uxxxx
字节
Pythonに変更すると3、この問題は解消されます
3
ここでは、一致する必要があるテキストが
リーリーs
であると仮定します:ここでの
decode('utf8')
是怕s的值为类似x66x77x88
这样的Unicode散列。另外,需要注意compile()
中ur
修饰符,u
は Unicode 修飾子です。追記:私はこの記事にインスピレーションを受けました。
アップデート
下の階で言われたことを読みました。確かに、Python 3 では出力は Unicode ハッシュです。以下はここからの抜粋です。
Python2、
uxxxx
是unicode字符,匹配后得到的是字节
文字列を使用しています。出力されるのは各バイト値です。Pythonに変更すると
3
、この問題は解消されます