【PHP】用正则去获取html中的正文body内容，为什么取出来为空?【已解决】

Question

问题如题，先上html文件，需要取里面的body内容，直接上代码：你好你好 &l

三叔 · Answer

'.'在默认情况下匹配的是除了换行符的所有字符, 而不是"所有非空字符"

解决方案有两种, 第一个正是

([\s\S]*?)

第二种是给正则表达式添加模式修饰符 /s, 这样 . 就是匹配所有字符了

/<body>(.*)<\/body>/s

欧阳克 · Answer

把正则里面的

(.*)

改成

([\s\S]*?)

因为‘.’只能匹配所有非空字符，而换行符，缩进，空格等空字符是匹配不到的