rt。 Movie Paradise の詳細ページ、例: http://www.dytt8.net/html/gndy/dyzz/20170411/53707.html。この「◎翻訳タイトル」「◎映画タイトル」「◎国」など、真ん中の空白文字はスペース、タブ、改行、復帰、改ページ、垂直タブ、改行ではありません。とにかく、通常の \s とは一致しません。これが何の文字かわかる人はいますか?
http://www.dytt8.net/html/gndy/dyzz/20170411/53707.html
\s
中国語 (全角) スペース u3000
u3000
ブラウザのアドレスバーに次のように入力してください:javascript:alert(" ".charCodeAt(0));Enterを押して12288を取得しますhtmlエンティティは (12288).toString(16)に転送します16 取得した3000Unicode文字は「u3000」
使ってみる[sS]*?
[sS]*?
中国語 (全角) スペース
u3000
ブラウザのアドレスバーに次のように入力してください:
javascript:alert(" ".charCodeAt(0));
Enter
を押して12288を取得します
htmlエンティティは
(12288).toString(16)に転送します16 取得した3000
Unicode文字は「u3000」
使ってみる
[sS]*?