Cookie は、ユーザーの身元を特定し、セッション追跡を実行するために、一部の Web サイトによってユーザーのローカル端末に保存されるデータ (通常は暗号化された) を指します。たとえば、Web サイトによっては、特定のページにアクセスする前にログインが必要な場合があります。ログインする前に、特定のページのコンテンツをキャプチャしたい場合があります。ログイン前とログイン後のコンテンツが異なっていたり、許可されていない場合があります。 。
Python では、cookiejar モジュールが提供されます。これは http パッケージにあり、Cookie をサポートするために使用されます。これにより、Cookie をキャプチャし、後続の接続リクエストで再送信できます。たとえば、シミュレートされたログイン機能を実装できます。このモジュールの主なオブジェクトは、CookieJar、FileCookieJar、MozillaCookieJar、および LWPCookieJar です。
Cookie の取得方法
## cookie的获取 # -*- coding: UTF-8 -*- from urllib import request from http import cookiejar if __name__ == '__main__': #声明一个CookieJar对象实例来保存cookie cookie = cookiejar.CookieJar() #利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器,也就CookieHandler handler=request.HTTPCookieProcessor(cookie) #通过CookieHandler创建opener opener = request.build_opener(handler) #此处的open方法打开网页 response = opener.open('http://www.baidu.com') #打印cookie信息 for item in cookie: print('Name = %s' % item.name) print('Value = %s' % item.value)
Python 関連の技術記事をさらに詳しく知りたい場合は、Python チュートリアル 列にアクセスして学習してください。
以上がPython クローラーはどのようにして Cookie を取得するのでしょうかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。