爬蟲技術可以爬https麼-Python教學-PHP中文網

首頁

後端開發

Python教學

爬蟲技術可以爬https麼

silencement

May 29, 2019 pm 01:55 PM

https

爬蟲技術可以爬https麼

爬蟲技術可以爬https麼?

#首先我們先來理解什麼是https

https是HTTP SSL的簡稱，是在HTTP傳輸方式的基礎上將之前的明文進行了加密傳輸，在傳輸之前就會確定資訊加密方式和秘鑰，在傳輸中即使被捕獲或偽造，那麼也能保證資訊不會被洩露。

而爬蟲本質是偽裝成一個瀏覽器，發送請求給伺服器，參與了整個過程，所以即使https連結也能抓取，但前提是偽造的這個客戶端有正確的SSL憑證。

尋找錯誤根源

爬蟲運行中提示SSL error錯誤的情況，一般是本地證書或相關SSL庫沒有正確安裝、伺服器使用自己製作的CA證書，沒有有權威機構認證

解決證書異常問題

對於ＣＡ證書問題我們可以參考下面集中方案：

１.不驗證ＣＡ證書，但要忽略安全警告

coding=utf-8import requests# 不验证CA证书则需要忽略安全警告方式一：import urllib3urllib3.disable_warnings()方式二：from requests.packages.urllib3.exceptions import InsecureRequestWarningrequests.packages.urllib3.disable_warnings(InsecureRequestWarning)r=requests.get(url=“https://www.baidu.com/”,verify=False)print r.elapsed.total_seconds()

登入後複製

２.指定憑證位置或含憑證的資料夾（此資料夾是由ＯｐｅｎＳＳＬ工具製作的）

coding=utf-8import requestsr=requests.get(url=“https://www.baidu.com/”,verify=&#39;/path/to/certfile&#39;)

登入後複製

以上是爬蟲技術可以爬https麼的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1669

CakePHP 教程

1428

Laravel 教程

1329

PHP教程

1273

C# 教程

1256

Related knowledge

如何使用Nginx Proxy Manager實現HTTPS協定下的反向代理 Sep 26, 2023 am 08:40 AM

如何使用NginxProxyManager實現HTTPS協定下的反向代理近年來，隨著網際網路的普及和應用場景的多樣化，網站和應用程式的存取方式變得越來越複雜。為了提高網站的存取效率和安全性，許多網站開始採用反向代理來處理使用者的請求。而針對HTTPS協定的反向代理，在保護使用者隱私和確保通訊安全性方面扮演著重要的角色。本文將介紹如何使用NginxProxy

如何使用Nginx Proxy Manager實現HTTP到HTTPS的自動跳轉 Sep 26, 2023 am 11:19 AM

如何使用NginxProxyManager實現HTTP到HTTPS的自動跳轉隨著互聯網的發展，越來越多的網站開始採用HTTPS協議來加密傳輸數據，以提高數據的安全性和用戶的隱私保護。由於HTTPS協定需要SSL憑證的支持，因此在部署HTTPS協定時需要有一定的技術支援。 Nginx是一款強大且常用的HTTP伺服器和反向代理伺服器，而NginxProxy

Nginx與SSL：設定HTTPS保護Web伺服器 Jun 09, 2023 pm 09:24 PM

Nginx是一個高效能的Web伺服器軟體，同時也是一款強大的反向代理伺服器和負載平衡器。隨著互聯網的迅速發展，越來越多的網站開始採用SSL協議保護敏感用戶數據，而Nginx也提供了強大的SSL支持，使得Web伺服器的安全性能更進一步。本文將介紹如何設定Nginx以支援SSL協議，並保護Web伺服器的安全效能。什麼是SSL協定？ SSL（SecureSocke

tomcat如何配置https Jan 05, 2024 pm 05:15 PM

設定步驟：1、取得SSL憑證；2、設定SSL憑證；3、編輯Tomcat設定檔；4、重啟Tomcat。詳細介紹：1、需要取得SSL證書，可以自簽名證書，也可以從認證機構（如Let's Encrypt）取得有效的SSL證書；2、將取得的SSL證書和私鑰檔案放置在伺服器上，確保這些文件位於安全的位置，只有具有足夠權限的使用者可以存取；3、編輯Tomcat設定檔等等。

解決方案：urllib3 ProxySchemeUnknown(proxy.scheme) Feb 29, 2024 pm 07:01 PM

報錯的原因urllib3的ProxySchemeUnknown(proxy.scheme)錯誤通常是因為使用了不支援的代理協定所導致的。在這種情況下，urllib3無法辨識代理伺服器的協定類型，因此無法使用代理進行網路連線。要解決這個問題，您需要確保使用支援的代理協議，例如Http或https.如何解決要解決這個問題，您需要確保使用支援的代理協議，例如HTTP或HTTPS。您可以透過設定urllib3的代理參數來解決這個問題。如果是使用http代理，程式碼範例如下：importurllib3http

如何設定PHP表單的HTTPS安全連線？ Aug 17, 2023 pm 03:25 PM

如何設定PHP表單的HTTPS安全連線？隨著網路的發展，安全性在網頁開發中變得越來越重要。加密傳輸協定HTTPS在保護資料傳輸過程中扮演關鍵的角色。在使用PHP表單進行資料傳輸時，我們可以採取一些措施來確保連線的安全性。本文將指導您如何設定PHP表單的HTTPS安全連接，並附帶一些程式碼範例。購買SSL憑證首先，您需要購買一個SSL憑證。 SSL憑證是保證網站

https工作流程是什麼樣的 Apr 07, 2024 am 09:27 AM

https工作流程包括客戶端發起請求、伺服器回應、SSL/TLS握手、資料傳輸和客戶端渲染等步驟，透過這些步驟可以確保資料在傳輸過程中的安全性和完整性。

Java API 開發中使用 Https 進行資料傳輸 Jun 18, 2023 pm 10:43 PM

隨著科技的發展，網路通訊成為了現代社會資訊傳輸的重要工具之一。但同時，網路上的資訊傳輸面臨被惡意攻擊和竊取的風險，因此安全性顯得尤為重要。基於此，HTTPS協議就應運而生。它是一種在HTTP協定上加入SSL/TLS加密的方式來確保網路傳輸安全性的協定。 Java作為一門廣泛應用於網頁開發的語言，自然也提供了豐富的API來支援HTTPS協定。本文將

See all articles

爬蟲技術可以爬https麼

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題