网页爬虫 - 求解: Python urlopen IOError: [Errno socket error] [Errno 10060]
大家讲道理
大家讲道理 2017-04-17 17:07:40
0
1
1614

用python写个小爬虫,只用了urllib2,urllib,re模块,各位大神,求解啊?

Traceback (most recent call last):
File "C:/Users/user/Desktop/python ����/mm/mm.py", line 62, in <module>

urllib.urlretrieve(mat[0], fname)

File "D:\Python27\lib\urllib.py", line 94, in urlretrieve

return _urlopener.retrieve(url, filename, reporthook, data)

File "D:\Python27\lib\urllib.py", line 240, in retrieve

fp = self.open(url, data)

File "D:\Python27\lib\urllib.py", line 208, in open

return getattr(self, name)(url)

File "D:\Python27\lib\urllib.py", line 345, in open_http

h.endheaders(data)

File "D:\Python27\lib\httplib.py", line 991, in endheaders

self._send_output(message_body)

File "D:\Python27\lib\httplib.py", line 844, in _send_output

self.send(msg)

File "D:\Python27\lib\httplib.py", line 806, in send

self.connect()

File "D:\Python27\lib\httplib.py", line 787, in connect

self.timeout, self.source_address)

File "D:\Python27\lib\socket.py", line 571, in create_connection

raise err

IOError: [Errno socket error] [Errno 10060]

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

全員に返信(1)
巴扎黑

この問題は正常です。Web サイトに頻繁にアクセスすると、DOS 攻撃と見なされます。通常、レート制限のある Web サイトは一定期間応答を停止します。この例外をキャッチして、一定期間スリープしてから再試行してください。または、再試行回数に基づいて指数バックアップをオフにすることもできます。

リーリー
いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート