以下は、Python クローラーを使用して実際のブラウザーを使用して Web ページを開く 2 つの方法をまとめたものであり、非常に参考になるものです。一緒に見てみましょう
1. システム独自のライブラリosを使用します
この方法の利点は、どのブラウザでも使用できることですが、欠点は、Webページを次々に自由に開くことができないことです。
import os os.system('"C:/Program Files/Internet Explorer/iexplore.exe" http://www.baidu.com')
2. Python 統合ライブラリ webbrowser を使用します
Python の webbrowser モジュールは、主に 3 つの方法があります:
import webbrowser webbrowser.open(url, new=0, autoraise=True) webbrowser.open_new(url) webbrowser.open_new_tab(url)
3人だけど実際には、同じメソッドですが、渡されるパラメータが異なります
webbrowser.open(url, new=0, autoraise=True) new=0 の場合、システムのデフォルトのブラウザで URL アドレスにアクセスします。 、URL は同じになりますブラウザ ウィンドウで開く; new=1 の場合、新しいブラウザ ウィンドウが開きます; new=2 の場合、新しいブラウザ タブが開きます
他の 2 つの関数 webbrowser.open_new( url)、webbrowser.open_new_tab (url) は実際には webbrowser.open() メソッドを返します
が、他の 2 つのパラメーターはありません。
他のブラウザを呼び出す場合は、事前に登録する必要があります。登録しないと、デフォルトのブラウザでページが開きます
import webbrowser chromePath = r'你的浏览器目录' # 例如我的:D:\Google\Chrome\Application\chrome.exe webbrowser.register('chrome', None, webbrowser.BackgroundBrowser(chromePath)) #这里的'chrome'可以用其它任意名字,如chrome111,这里将想打开的浏览器保存到'chrome' webbrowser.get('chrome').open('www.baidu.com',new=1,autoraise=True)
webbrowser このライブラリロックでサポートされているブラウザの種類は次のとおりです:
これらの内容はソース ファイルで確認できます。パスは次のとおりです: python2.7/libs/webbroser.py 関連する推奨事項: Python クローラーを使用して貴重なブログ投稿を取得する方法 単純な Python Crawler インスタンスを記録します 以上がPython クローラーを使用して実際のブラウザーで Web ページを開く 2 つの方法のまとめの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。
Type Name Class Name Notes
'mozilla' Mozilla('mozilla')
'firefox' Mozilla('mozilla')
'netscape' Mozilla('netscape')
'galeon' Galeon('galeon')
'epiphany' Galeon('epiphany')
'skipstone' BackgroundBrowser('skipstone')
'kfmclient' Konqueror() (1)
'konqueror' Konqueror() (1)
'kfm' Konqueror() (1)
'mosaic' BackgroundBrowser('mosaic')
'opera' Opera()
'grail' Grail()
'links' GenericBrowser('links')
'elinks' Elinks('elinks')
'lynx' GenericBrowser('lynx')
'w3m' GenericBrowser('w3m')
'windows-default' WindowsDefault (2)
'macosx' MacOSX('default') (3)
'safari' MacOSX('safari') (3)
'google-chrome' Chrome('google-chrome')
'chrome' Chrome('chrome')
'chromium' Chromium('chromium')
'chromium-browser' Chromium('chromium-browser')