目前用的是 simple_html_dom,它获取网页的方式直接file_get_contents获取网页,但是对于js生成的页面就无法获取了,用什么方法能够用php抓取js动态生成的页面?
目前用的是 simple_html_dom,它获取网页的方式直接file_get_contents获取网页,但是对于js生成的页面就无法获取了,用什么方法能够用php抓取js动态生成的页面?
这个并不好实现, 不然现在js的MVVM框架就不用想着服务端渲染来做SEO...
可以用V8JS
,phantomjs
若是ajax生成的获取对应的url返回值即可
还是分析请求,找接口简单点。
使用phantomjs+nodejs来处理这类问题相对来说更容易一些。
phantomjs是一个无界面的浏览器环境,可以载入url,然后渲染页面。做到模拟出用户浏览器里输入url打开页面之后渲染的效果。然后通过编程调用phantomjs提供的接口去获取渲染出来的内容。
http://phantomjs.org/
1、phantomjs
2、如果js是异步加载的数据,直接php读那个接口数据。