Python - 2億++のURLを持つWebページのステータスコードを素早く確認するには?
世界只因有你
世界只因有你 2017-05-18 10:56:14
0
5
617

リクエストを使ってマルチスレッドを書いたのですが、少し遅い気がします。他に方法はありますか?

世界只因有你
世界只因有你

全員に返信(5)
PHPzhong

Tornado の CURL クライアント サポートを使用して、リクエスト ヘッダーを読み取った後に接続を閉じます。 (私はまだ試していません。提供する HTTP クライアントが接続の途中で閉じることをサポートしていない場合は、TCP を使用し、http-parser を使用して私がやったように解析できます。)

実際には、fetchtitle に拡張機能を追加するだけでステータス コードを取得できます... (pycurl をインストールすることを忘れないでください)

いいねを押す +0
巴扎黑

Python は本質的に遅いので、高速にしたい場合は、TCP リクエストを直接書いて、ステータスを読んだ後、ソケットを閉じてください。

いいねを押す +0
左手右手慢动作

grequests を使用すると、リクエストは同時にカプセル化されます

https://github.com/kennethrei...

いいねを押す +0
迷茫

この場合、gevent、tornado、scrapy-redis、asyncio の使用を検討できます。

いいねを押す +0
大家讲道理

Headを使用してリクエストすると早くなりますか?

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート