首頁 > 後端開發 > C++ > 如何在 C# 中使用 POST 和 GET 請求驗證 Web 抓取?

如何在 C# 中使用 POST 和 GET 請求驗證 Web 抓取?

Susan Sarandon
發布: 2025-01-18 09:26:08
原創
579 人瀏覽過

How to Authenticate Web Scraping in C# Using POST and GET Requests?

C# 網頁抓取驗證:POST 和 GET 請求實用指南

網頁抓取受保護的網站需要使用者驗證。本指南詳細介紹如何使用 C# 登入網站,繞過進階庫的典型限制。 我們將專注於使用 WebRequestWebResponse 來精確控制 HTTP 請求。

先決條件:

  • 需要登入才能存取內容的網站。
  • 熟悉 C# 程式設計和網頁抓取基礎。

實作步驟:

身份驗證涉及兩個關鍵步驟:

  1. 發佈登入憑證:

    • 建立登入 URL 並正確編碼表單參數(使用者名稱、密碼)。
    • 使用 POST 方法、內容類型(「application/x-www-form-urlencoded」)和資料長度配置 WebRequest
    • 發送包含編碼表單資料的 POST 請求。
    • 從回應的「Set-Cookie」標頭中提取身份驗證 cookie。這個cookie對於後續請求至關重要。
  2. 取得受保護的內容:

    • 為受保護頁面建立WebRequest
    • 將步驟1中獲得的身份驗證cookie加入到請求標頭中。
    • 伺服器驗證 cookie,授予對受保護資源的存取權。
    • 使用StreamReader檢索並處理頁面的HTML原始碼。

程式碼範例:

此範例示範登入與擷取受保護的頁面:

<code class="language-csharp">string loginUrl = "http://www.mmoinn.com/index.do?PageModule=UsersAction&Action=UsersLogin";
string loginParams = string.Format("email_address={0}&password={1}", "your email", "your password");
string cookieHeader;

WebRequest loginRequest = WebRequest.Create(loginUrl);
loginRequest.ContentType = "application/x-www-form-urlencoded";
loginRequest.Method = "POST";
byte[] data = Encoding.ASCII.GetBytes(loginParams);
loginRequest.ContentLength = data.Length;

using (Stream requestStream = loginRequest.GetRequestStream())
{
    requestStream.Write(data, 0, data.Length);
}

WebResponse loginResponse = loginRequest.GetResponse();
cookieHeader = loginResponse.Headers["Set-cookie"];

string protectedPageUrl = "http://www.mmoinn.com/protected_page.html";
WebRequest protectedRequest = WebRequest.Create(protectedPageUrl);
protectedRequest.Headers.Add("Cookie", cookieHeader);

WebResponse protectedResponse = protectedRequest.GetResponse();
using (StreamReader reader = new StreamReader(protectedResponse.GetResponseStream()))
{
    string pageSource = reader.ReadToEnd();
    // Process the protected page's HTML
}</code>
登入後複製

此程式碼說明了完整的身份驗證流程:發送 POST 請求、檢索 cookie,並使用該 cookie 透過 GET 請求存取受保護的內容。 請記得將 "your email""your password" 替換為實際憑證。 應該為健壯的應用程式添加錯誤處理(例如,無效憑證)。

以上是如何在 C# 中使用 POST 和 GET 請求驗證 Web 抓取?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板