リクエストと lxml を使用してクローラーを実装するチュートリアルの例

PHP中文网
リリース: 2017-06-20 14:46:43
オリジナル
2128 人が閲覧しました

# ページをリクエストするモジュールをリクエストします
# lxml モジュールの HTML ビルド セレクター セレクター (フォーマットされた応答レスポンス)
# from lxml import html
# import request

# response =requests.get (url) .content

# selector = html.formatstring(response)

# hrefs = selector.xpath('/html/body//div[@class='feed-item _j_feed_item']/a + これはページをクロールする前に、HTML 構造を注意深く分析する必要があります。このページは比較的単純で、JS 処理は含まれません。

以上がリクエストと lxml を使用してクローラーを実装するチュートリアルの例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート