コミュニティ

学ぶ

ツールライブラリ

AIツール

レジャー

日本語

ホームページ > バックエンド開発 > Python チュートリアル > キーワードを使用して Web 画像をクロールする方法を教えます

キーワードを使用して Web 画像をクロールする方法を教えます

Y2J

リリース： 2017-05-09 14:21:01

オリジナル

5228 人が閲覧しました

この記事では主に Python クローラー、つまりキーワードを通じて Baidu 画像をクロールする方法を紹介します。非常に優れた参考値です。以下のエディターで見てみましょう

使用ツール: Python2.7、ダウンロードするにはここをクリックしてください

scrapyframework

sublime text3

One。 Python のビルド (Windows 版)

1. インストール python2.7 --- 次に、cmd に python と入力すると、インターフェイスは次のようになり、インストールは成功します

2. 統合Scrapy フレームワーク-- --コマンドラインを入力します: pip install Scrapy

成功したインストールインターフェイスは次のとおりです:

多くの失敗がありますが、ここに例があります:

ソリューション:

その他のエラーは、Baidu 検索で見つけることができます。

2つ。プログラミングを始めましょう。

1. クローラー対策なしで静的の Web サイトをクロールします。たとえば、Baidu Tieba や Douban Reading などです。

例 - 「デスクトップバー」の投稿tieba.baidu.com/p/2460150866?red_tag=3569129009

Pythonコードは次のとおりです:

コードコメント: 2つのモジュールurllib、re 。 2 つの関数を定義します。最初の関数は、ターゲット Web ページのデータ全体を取得することであり、2 番目の関数は、ターゲット Web ページ内のターゲット画像を取得し、Web ページを横断し、取得した画像を 0 からソートすることです。

注: モジュールに関する知識ポイント:

クロール画像レンダリング:

デフォルトの画像保存パスは、作成された .py ファイルと同じディレクトリファイル内にあります。

2. クローラー対策で Baidu 画像をクロールします。百度写真など。

たとえば、キーワード検索「顔文字パッケージ」 https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7%E9% B0% FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

写真はローリング方式でロードされ、優先度の高い 30 個が表示されます写真が最初にクロールされます。

コードは次のとおりです:

コードのコメント: 4つのモジュールをインポートします。osモジュールは保存パスの指定に使用されます。最初の 2 つの関数は上記と同じです。 3 番目の関数は、if ステートメントと tryException 例外を使用します。

クロールのプロセスは次のとおりです:

クロール結果:

注: Python コードを記述するときは位置合わせに注意してください。エラーが発生しやすいため、タブとスペースを混在させることはできません。

【関連おすすめ】

1. Python無料ビデオチュートリアル

3. Pythonオブジェクト指向ビデオチュートリアル

以上がキーワードを使用して Web 画像をクロールする方法を教えますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル：

python 爬虫類

前の記事：Python の日時および日付モジュール次の記事：Python は Socket に基づいた非同期ノンブロッキングを実装します

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

H5によるカメラ機能の実装例を詳しく解説

1970-01-01 08:00:00
pycharm を mysql に接続するためのグラフィカルなチュートリアル

1970-01-01 08:00:00
.NET Core はコンソールプログラムを作成します

1970-01-01 08:00:00
Python描画ライブラリの基本的な操作方法を紹介

1970-01-01 08:00:00
WeChatが開発したスキャンコードログイン処理の手順を詳しく解説

1970-01-01 08:00:00
WeChat H5 ページの作成プロセスの詳細な説明

1970-01-01 08:00:00
MyBatis のエンティティ Bean のデータベースフィールドと属性間の不一致に対処する方法

1970-01-01 08:00:00
WeChat が開発した onShareAppMessage 共有パラメータの使用法

1970-01-01 08:00:00
H5 と CSS3 を使用してフォトアルバムを作成するコード例

1970-01-01 08:00:00
TP フレームワークを使用して WeChat 決済を実装するコード例

1970-01-01 08:00:00

最新の問題

Python - Ubuntu16.04 lxml エラーレポート

から 1970-01-01 08:00:00

0

0

0

Python スクレイピークローラーエラー

から 1970-01-01 08:00:00

0

0

0

python - Python Web 開発に関する関連フォーラムや書籍はありますか?

から 1970-01-01 08:00:00

0

0

0

Python - flask+ajaxポスト400エラー

から 1970-01-01 08:00:00

0

0

0

PHP で Python を書く方法はありますか?

から 1970-01-01 08:00:00

0

0

0

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート