网页爬虫 - ubuntu 下 python 使用 selenium + PhantomJS 时出错
PHP中文网
PHP中文网 2017-04-17 14:33:09
0
4
886
PHP中文网
PHP中文网

认证0级讲师

全員に返信(4)
迷茫

私も最近これに遭遇しました。動的jsがまだ解析されていないため、Webページのコードを取得できません。例外は NoSuchElementException ですが、これは明らかです。

いいねを押す +0
洪涛

phantomjs はヘッドレスブラウザに属しており、ウィンドウがないため、すべての要素が描画されない可能性もあります。したがって、この時点で見つかった要素はすべて NoSuchElementException 例外になります。
次の手順を試すことができます:

リーリー

参考: https://github.com/ariya/phantomjs/issues/11637

いいねを押す +0
刘奇

自分で答えてください。
stackoverflow で解決策が見つかりました。
速度を向上させるために CSS、画像、JS をブロックします。
PhantomJS はまだ使用できませんが、確かに高速であり、目的は達成されています。

リーリー

http://stackoverflow.com/questions/20892768/how-to-speed-up-browsing-in-selenium-firefox
http://stackoverflow.com/questions/17462884/is-selenium-slow -または私のコードが間違っています

いいねを押す +0
阿神

この場合、js も解析できないのではないでしょうか? 他の高速ツールを使用してみてはいかがでしょうか?

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート