1.urlopen() メソッド
urllib.urlopen(url[, data[, proxies]]): リモート URL を表すファイルのようなオブジェクトを作成し、これを次のように操作します。ローカル ファイル リモート データを取得するためのファイルのようなオブジェクト。
パラメータ url は、リモート データのパス (通常は URL) を表します。
パラメータ データは、post メソッドで URL に送信されるデータを表します (Web を使ったことがある人は、データを送信する 2 つの方法を知っているはずです)。 : post と get の場合。 分からない場合でも、このパラメータは通常の状況ではほとんど使用されません);
パラメータ proxies はプロキシを設定するために使用されます。
urlopen は、次のメソッドを提供するファイルのようなオブジェクトを返します:
read()、readline()、readlines()、fileno()、close(): これらのメソッドは file とまったく同じように使用できます。オブジェクト;
info(): リモート サーバーから返されたヘッダー情報を表す httplib.HTTPMessage オブジェクトを返します。
getcode(): Http ステータス コードを返します。 http リクエストの場合、200 はリクエストが正常に完了したことを意味し、404 は URL が見つからなかったことを意味します。
コード例:
#urlopen()
sock = urllib.urlopen(url)
htmlCode = sock.read()
sock.close
fp = open("e:/1.html", "wb")
fp.write(htmlCode)
fp.close
urllib.urlretrieve(url, 'e:/2.html')
2.urlretrieve メソッド
リモート データをローカルに直接ダウンロードします。
local = 'd:\sina.html'
urllib.urlretrieve(url, local, callbackfunc)