Python3 がリクエストパッケージを使用して Web ページのソースコードをキャプチャして保存する方法の概要-Python チュートリアル-php.cn

Python3 がリクエストパッケージを使用して Web ページのソースコードをキャプチャして保存する方法の概要

高洛峰

リリース： 2017-03-07 15:50:19

オリジナル

2496 人が閲覧しました

この記事の例では、Python3 が request パッケージを使用して Web ページのソースコードを取得して保存する方法を説明します。参考のために皆さんと共有してください。詳細は次のとおりです:

Python 3 のリクエストモジュールを使用して Web ページのソースコードを取得し、ファイルに保存します例:

import requests
html = requests.get("http://www.baidu.com")
with open(&#39;test.txt&#39;,&#39;w&#39;,encoding=&#39;utf-8&#39;) as f:
 f.write(html.text)

ログイン後にコピー

これは基本的なものですファイル保存操作ですが、注目すべき問題がいくつかあります:

1. コマンドラインに pip install リクエストを入力して、自動的にインストールします。多くの人はリクエストの使用を推奨しています。組み込みの urllib.request は Web ページのソースコードをキャプチャすることもできます

2。open メソッドのエンコーディングパラメータを utf-8 に設定すると、保存されたファイルが文字化けします。

3. キャプチャした内容を cmd で直接出力すると、さまざまなエンコードエラーが表示されるため、表示用にファイルに保存します。

4. with open メソッドは、操作の完了後にリソースを自動的に解放できる、より良い記述方法です。

別の例:

import requests
ff = open(&#39;testt.txt&#39;,&#39;w&#39;,encoding=&#39;utf-8&#39;)
with open(&#39;test.txt&#39;,encoding="utf-8") as f:
 for line in f:
 ff.write(line)
ff.close()

ログイン後にコピー

これは、txt ファイルを一度に 1 行ずつ読み取り、別の txt ファイルに保存する例です。

コマンドラインで1行ずつ読み取ったデータを印刷すると中国語のエンコードエラーが発生するので、1行ずつ読み込んで別ファイルに保存して正常に読み込めるかテストしてください。 (開くときにエンコード方法が指定されることに注意してください)

Python3 がリクエストパッケージを使用して Web ページのソースコードをキャプチャして保存する方法の詳細については、PHP 中国語 Web サイトの関連記事に注目してください。