网页爬虫 - python爬虫案例
ringa_lee
ringa_lee 2017-04-17 17:50:11
0
1
1183

请问大家能不能给我一点提点,我想要知道有没有 简单 一点的 爬虫 案例可以让我摸索学习


目前已知的爬虫工具有:

  1. Beautiful Soup

  2. Scrapy

  3. cola

  4. pyspider

  5. PyQuery

  6. grab

ringa_lee
ringa_lee

ringa_lee

全員に返信(1)
Ty80

本当にわからない場合は、ここに参考情報がいくつかありますが、重要な点は、読んでください...

まず、ウェブ クローラーとは何ですか:

  1. Wiki-Web クローラーを簡単に見てみることができます

  2. もう一度この Web サイトにアクセスしてください。University Mathematics School には簡単な教え (およびビデオ) があり、初心者には非常に適していると思います。Web クローラーとは何ですか

次に

導入チュートリアル:

  1. 実際、文書を読むための非常に簡単な方法があります。指示がない場合は、中国語ではなく、美しいスープ中国語の文書を読むことを選択できます。複雑すぎるので、すべて読むには時間がかかります。

  2. 現在、大学の数学スクールでは一連の入門教育と実践教育が行われています。入門コースの最初のいくつかの記事を以下に挙げます。

    1. Python を使用して Web クローラー (Crawler) を作成し始める

    2. Jupyter (Ipython Notebook) のインストール方法

    3. Jupyter 操作入門 (1)

    4. GET を使用して Web コンテンツをクロールするにはどうすればよいですか?

    5. POST を使用して Web コンテンツをクロールするにはどうすればよいですか?

    6. Python パッケージ: BeautifulSoup4 を使用して Web コンテンツを分析する方法は?

    7. Python リクエストと BeautifulSoup4 を使用して淘宝クローラーを完成させるにはどうすればよいですか?

次のステップは、

ツールクローラー フレームワーク を理解することです。

  1. この場所は非常に充実しています: Github コードのダウンロード リンクを含む Python クローラー ツール リスト

  2. このブログにもたくさんの教えがあります

クローラー ツールとフレームワークについての議論については、この記事を参照してください。 Zhihu: Python でクローラーを作成する場合、どの方法とフレームワークが優れていますか?


インターネット上にはたくさんのリソースがあると思います。すべて試してみることができます。最初はすべてが難しいので、さあ!

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート