网页爬虫 - python爬虫案例

Question

请问大家能不能给我一点提点，我想要知道有没有 简单 一点的 爬虫 案例可以让我摸索学习 目前已知的爬虫工具有: Beautiful Soup Scrapy cola pyspider PyQuery grab

PHP中文网 · Answer

本当にわからない場合は、ここに参考情報がいくつかありますが、重要な点は、読んでください...

まず、ウェブクローラーとは何ですか:

Wiki-Web クローラーを簡単に見てみることができます
もう一度この Web サイトにアクセスしてください。University Mathematics School には簡単な教え (およびビデオ) があり、初心者には非常に適していると思います。Web クローラーとは何ですか

次に

導入チュートリアル:

実際、文書を読むための非常に簡単な方法があります。指示がない場合は、中国語ではなく、美しいスープ中国語の文書を読むことを選択できます。複雑すぎるので、すべて読むには時間がかかります。
現在、大学の数学スクールでは一連の入門教育と実践教育が行われています。入門コースの最初のいくつかの記事を以下に挙げます。
1. Python を使用して Web クローラー (Crawler) を作成し始める
2. Jupyter (Ipython Notebook) のインストール方法
3. Jupyter 操作入門 (1)
4. GET を使用して Web コンテンツをクロールするにはどうすればよいですか?
5. POST を使用して Web コンテンツをクロールするにはどうすればよいですか?
6. Python パッケージ: BeautifulSoup4 を使用して Web コンテンツを分析する方法は?
7. Python リクエストと BeautifulSoup4 を使用して淘宝クローラーを完成させるにはどうすればよいですか?

次のステップは、

ツールとクローラーフレームワーク を理解することです。

クローラーツールとフレームワークについての議論については、この記事を参照してください。 Zhihu: Python でクローラーを作成する場合、どの方法とフレームワークが優れていますか?

インターネット上にはたくさんのリソースがあると思います。すべて試してみることができます。最初はすべてが難しいので、さあ!