python - 如何爬取跳轉網站的數據

Question

目前在學習一些爬蟲的知識，對於一些複雜的網站使用selenium進行爬取。碰到一個問題，我需要爬取的工單網站（不知道密碼）需要先透過登入一個鑑權系統，然後鑑權系統頁面點擊其中的工單系統連接，就會自動免登入...

漂亮男人 · Answer

用firefox的擴充selenium ide錄製一遍操作。
然後匯出為python檔案。
改改運作就可以了。

建議你去讀讀蟲師寫的書。

曾经蜡笔没有小新 · Answer

例如使用requests函式庫作為爬蟲的話，先建立session()，A登錄，B是跳轉的頁面即可。

T=requests.session()
A=T.post(url=url,data=data)
B=T.get(url=url)

創建的T就代表儲存的cookie，會一直保留