PHP採集類別 Snoopy.class.php
Snoopy是一個php採集類,用來模擬瀏覽器取得網頁內容和發送表單。 以下是一些Snoopy特性: 容易抓取網頁內容 容易抓取頁面文字(去除html標籤) 容易抓取網頁內連結 支援代理抓取 支援基本的使用者名稱、密碼認證 支援設定user-agent,referer,cookies和header內容 支援瀏覽器轉向,與控制轉向深度 能把頁面中的連結轉換成高品質的連結 容易提交資料和取得回饋值 能追蹤HTML框架 支援重定向的時候傳遞Cookies Snoopy類,方法: fetch($URI) 抓取網頁的內容而使用的方法。 $URI參數是被抓取網頁的URL位址。抓取的結果儲存在 $this->results 中。如果你正在抓取的是一個框架,Snoopy會將每個框架追蹤後存入數組中,然後存入 $this->results。 fetchtext($URI) 本方法類似fetch(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只回傳網頁中的文字內容。 fetchform($URI) 本方法類似fetch(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只回傳網頁中表單內容(form)。 fetchlinks($URI) 本方法類似fetch(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只返回網頁中連結(link)。預設情況下,相對連結將自動補全,轉換成完整的URL。 submit($URI,$formvars) 本方法向$URL指定的連結位址發送確認表單。 $formvars是一個儲存表單參數的陣列。 submittext($URI,$formvars) 本方法類似submit(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只傳回登陸後網頁中的文字內容。 submitlinks($URI) 本方法類似submit(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只回傳網頁中連結(link)。預設情況下,相對連結將自動補全,轉換成完整的URL。 類別屬性: (缺省值在括號裡) $host 連線的主機 $port 連接的連接埠 $proxy_host 使用的代理主機,如果有的話 $proxy_port 使用的代理主機端口,如果有的話 $agent 使用者代理偽裝 (Snoopy v0.1) $referer 來路訊息,如果有的話 $cookies,如果有的話 $rawheaders 其他的頭資訊, 如果有的話 $maxredirs 最大重定向次數,0=不允許 (5) $offsiteok whether or not to allow redirects off-site. (true) $expandlinks 是否將連結都補全為完整位址 (true) $user 認證使用者名稱, 如果有的話 $pass 認證使用者名稱, 如果有的話 $accept http 接受型別 (image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, */*) $error 哪裡報錯, 如果有的話 $response_code 從伺服器回傳的回應代碼 $headers 從伺服器傳回的頭資訊 $maxlength 最長回傳資料長度 $read_timeout 讀取操作逾時 (requires PHP 4 Beta 4+) 設定為0為沒有逾時 $timed_out 如果一次讀取操作逾時了,本屬性回傳 true (requires PHP 4 Beta 4+) $maxframes 允許追蹤的框架最大數量 $status 抓取的http的狀態 $temp_dir 網頁伺服器能夠寫入的暫存檔案目錄 (/tmp) $curl_path cURL binary 的目錄, 如果沒有cURL binary就設定為 false Snoopy官方網址:http://sourceforge.net/projects/snoopy/ 希望這篇文章對廣大php開發者有幫助,感謝閱讀這篇文章。更多php技術問題歡迎加群探討:256271784,驗證碼:cxy,不寫驗證不予通過喲~ |

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

JWT是一種基於JSON的開放標準,用於在各方之間安全地傳輸信息,主要用於身份驗證和信息交換。 1.JWT由Header、Payload和Signature三部分組成。 2.JWT的工作原理包括生成JWT、驗證JWT和解析Payload三個步驟。 3.在PHP中使用JWT進行身份驗證時,可以生成和驗證JWT,並在高級用法中包含用戶角色和權限信息。 4.常見錯誤包括簽名驗證失敗、令牌過期和Payload過大,調試技巧包括使用調試工具和日誌記錄。 5.性能優化和最佳實踐包括使用合適的簽名算法、合理設置有效期、

會話劫持可以通過以下步驟實現:1.獲取會話ID,2.使用會話ID,3.保持會話活躍。在PHP中防範會話劫持的方法包括:1.使用session_regenerate_id()函數重新生成會話ID,2.通過數據庫存儲會話數據,3.確保所有會話數據通過HTTPS傳輸。

SOLID原則在PHP開發中的應用包括:1.單一職責原則(SRP):每個類只負責一個功能。 2.開閉原則(OCP):通過擴展而非修改實現變化。 3.里氏替換原則(LSP):子類可替換基類而不影響程序正確性。 4.接口隔離原則(ISP):使用細粒度接口避免依賴不使用的方法。 5.依賴倒置原則(DIP):高低層次模塊都依賴於抽象,通過依賴注入實現。

在PHPStorm中如何進行CLI模式的調試?在使用PHPStorm進行開發時,有時我們需要在命令行界面(CLI)模式下調試PHP�...

如何在系統重啟後自動設置unixsocket的權限每次系統重啟後,我們都需要執行以下命令來修改unixsocket的權限:sudo...

靜態綁定(static::)在PHP中實現晚期靜態綁定(LSB),允許在靜態上下文中引用調用類而非定義類。 1)解析過程在運行時進行,2)在繼承關係中向上查找調用類,3)可能帶來性能開銷。

使用PHP的cURL庫發送JSON數據在PHP開發中,經常需要與外部API進行交互,其中一種常見的方式是使用cURL庫發送POST�...
