python - 我该怎么写正则?

Question

s = u'\ud83d\udc8b'co = re.compile( u'\ud83d\udc8b')co.sub(u'',s)print(u'ud83d') 输出如下UnicodeEncodeError: 'utf-8' codec无法在位置 0 中编码字符“ud83d”：不允许代理 s中大...

高洛峰 · Answer

首先，是2个问题
1.为什么显示不出来
2.想替换掉但是为什么匹配不到

回答
1.特殊编码在终端上是无法显示的，如果是在UI上显示，那么需要把UI的encoding设置好。
2.试试下面的代码

import re
s = u'hello \ud83d\udc8b world'
co = re.compile( u'\ud83d\udc8b')
ss = co.sub(u'',s)
print(ss)

运行结果：
hello world

黄舟 · Answer

我都是抄的