rt。在电影天堂的详情页面中,比如:http://www.dytt8.net/html/gndy/dyzz/20170411/53707.html。这个里面的『◎译 名』,『◎片 名』,『◎国 家』等,中间的空白字符不是空格、制表符、换行符、回车符、换页符、垂直制表符和换行符。反正用正则的s是匹配不出来,不知哪位大神知道这是什么字符?
http://www.dytt8.net/html/gndy/dyzz/20170411/53707.html
s
中文(全角)空格. u3000
u3000
请在浏览器地址栏输入:javascript:alert(" ".charCodeAt(0));回车到得12288html实体为 (12288).toString(16) 转16进制得 3000unicode字符为 "u3000"
用[sS]*?试试呢
[sS]*?
中文(全角)空格.
u3000
请在浏览器地址栏输入:
javascript:alert(" ".charCodeAt(0));
回车
到得12288
html实体为
(12288).toString(16) 转16进制得 3000
unicode字符为 "u3000"
用
[sS]*?
试试呢