Selenium での Webdriver の部分的な HTML 抽出
Selenium の Webdriver が driver.page_source を使用しているとは言わないでください。スープを作成するたびに HTML ドキュメント全体を抽出する必要はありません。なぜなら、以下のような左右構造のフォーラムの場合、各コンテンツの変更は実際には HTML ページ全体のごく一部に過ぎないため、Web サイト全体の MOOC コースのコメントをすべてクロールダウンしたい場合、どれだけ役に立たないことになるからです。仕事しなきゃいけないの!
しかし、Baidu は中国語のコンテンツを検索しましたが、答えは見つかりませんでした。そこで Google に行ったところ、この質問に対する世界中の上級者からの回答がすでにあることがわかりました:
主なアイデアは、次のように get_attribute メソッドを使用して innerHTML を抽出することです:
検証後は、すべて OK です。 :
http://www.bkjia.com/PHPjc/1112548.htmlwww.bkjia.com本当http://www.bkjia.com/PHPjc/1112548.html技術記事 Selenium の Webdriver による部分的な HTML 抽出 Selenium の Webdriver が driver.page_source を使用しているとは言わないでください。スープのために毎回 HTML ドキュメント全体を抽出する必要はありません。だって、そうですよね...