コミュニティ

学ぶ

ツールライブラリ

AIツール

レジャー

日本語

ホームページ > バックエンド開発 > Python チュートリアル > Python クローラー: キーワードを通じて Baidu 画像をクロールします。

Python クローラー: キーワードを通じて Baidu 画像をクロールします。

高洛峰

リリース： 2017-02-20 10:06:37

オリジナル

2684 人が閲覧しました

使用したツール: Python2.7

卑劣なフレームワーク

sublime text3

1つ。 Python のビルド (Windows 版)

1. python2.7 をインストールします --- 次に、cmd に python と入力します。インターフェースが以下のようであれば、インストールは成功です

Python クローラー: キーワードを通じて Baidu 画像をクロールします。

2. Scrapy フレームワークを統合します ---- と入力しますコマンドライン: pip install Scrapy

Python クローラー: キーワードを通じて Baidu 画像をクロールします。

成功したインストールインターフェイスは次のとおりです:

Python クローラー: キーワードを通じて Baidu 画像をクロールします。

失敗する状況はたくさんありますが、ここに例があります:

Python クローラー: キーワードを通じて Baidu 画像をクロールします。

解決策:

他のエラーも検索できます百度で。

2つ。プログラミングを始めます。

Python コードは次のとおりです:

Python クローラー: キーワードを通じて Baidu 画像をクロールします。

コードのコメント: 2 つのモジュール urllib,re が導入されています。 2 つの関数を定義します。1 つ目は、対象の Web ページ内の対象画像を取得し、Web ページを横断し、取得した画像を 0 からソートすることです。

注: モジュールに関する知識ポイント:

Python クローラー: キーワードを通じて Baidu 画像をクロールします。

クロールされた画像レンダリング:

Python クローラー: キーワードを通じて Baidu 画像をクロールします。

デフォルトの画像保存パスは、作成された .py ファイルと同じディレクトリファイルにあります。

2. クローラー対策で Baidu 画像をクロールします。百度写真など。

たとえば、キーワード検索「絵文字パッケージ」 https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7%E9%B0% FC&fr= ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

写真はローリング方式でロードされ、優先度の最も高い 30 枚の写真は最初に這った。

コードは次のとおりです:

Python クローラー: キーワードを通じて Baidu 画像をクロールします。

コードのコメント: 4 つのモジュールをインポートし、os モジュールは保存パスの指定に使用されます。最初の 2 つの関数は上記と同じです。 3 番目の関数は、if ステートメントと tryException を使用します。

クロールのプロセスは次のとおりです:

Python クローラー: キーワードを通じて Baidu 画像をクロールします。

クロール結果:

Python クローラー: キーワードを通じて Baidu 画像をクロールします。

注: Python コードを記述するときは位置合わせに注意してください。エラーが発生しやすいため、タブとスペースを混在させることはできません。

その他の Python クローラー: キーワードによる Baidu 画像のクロールについては、PHP 中国語 Web サイトの関連記事に注目してください。

関連ラベル：

Python 爬虫

前の記事：Python の文字列フォーマット str.format の詳細な紹介次の記事：リスト内のシリアル番号と値をトラバースする Python メソッド (3 つのメソッド)

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

HTMLで太字、斜体、下線、取り消し線などのフォント効果を設定する例の紹介

1970-01-01 08:00:00
Java バージョンの Redis を実装する

1970-01-01 08:00:00
最も単純な WeChat アプレットのデモ

1970-01-01 08:00:00
Pythonでのpandas.DataFrameの簡単な操作方法（作成、インデックス、追加、削除）の紹介

1970-01-01 08:00:00
WeChat ミニプログラム: タブ効果の実装方法の例

1970-01-01 08:00:00
Python は辞書構造の出力を美しくするためのカスタムメソッドを構築します

1970-01-01 08:00:00
HTML5: Canvas を使用してビデオをリアルタイムで処理する

1970-01-01 08:00:00
Asp.net は SignalR を使用して画像を送信します

1970-01-01 08:00:00
WeChat ミニプログラム開発チュートリアル - App() および Page() 関数の概要

1970-01-01 08:00:00
Python Redisの使い方を詳しく解説

1970-01-01 08:00:00

最新の問題

人気のあるPythonライブラリとその用途は何ですか？

2025-03-21 18:46:29
Pythonの漬物と抑えるとは何ですか？

2025-03-21 18:45:34
学習と開発のためのあなたのお気に入りのPythonリソースは何ですか？

2025-03-21 13:19:29
Pythonの環境変数をどのように操作しますか？

2025-03-21 13:16:30
PythonのGCモジュールの目的は何ですか？

2025-03-21 13:13:27

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート