Cookie,指某些網站為了辨別使用者身分、進行session追蹤而儲存在使用者本地端上的資料(通常經過加密)。比如說有些網站需要登入後才能存取某個頁面,在登入之前,你想抓取某個頁面內容,登陸前與登陸後是不同的,或者不允許的。
在python中它為我們提供了cookiejar模組,它位於http套件中,用於對Cookie的支援。透過它我們能捕獲cookie並在後續連接請求時重新發送,例如可以實現模擬登入功能。此模組主要的物件有CookieJar、FileCookieJar、MozillaCookieJar、LWPCookieJar。
cookie的取得方法
## cookie的获取 # -*- coding: UTF-8 -*- from urllib import request from http import cookiejar if __name__ == '__main__': #声明一个CookieJar对象实例来保存cookie cookie = cookiejar.CookieJar() #利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器,也就CookieHandler handler=request.HTTPCookieProcessor(cookie) #通过CookieHandler创建opener opener = request.build_opener(handler) #此处的open方法打开网页 response = opener.open('http://www.baidu.com') #打印cookie信息 for item in cookie: print('Name = %s' % item.name) print('Value = %s' % item.value)
更多Python相關技術文章,請造訪Python教學欄位學習!
以上是python爬蟲怎麼取得cookie的詳細內容。更多資訊請關注PHP中文網其他相關文章!