c#中過濾html的正規表示式-C#.Net教程-PHP中文網

首頁

後端開發

C#.Net教程

c#中過濾html的正規表示式

高洛峰

Jan 13, 2017 pm 05:23 PM

本文實例講述了C#實作下載網頁HTML原始碼的方法。分享給大家參考之用。具體方法如下：

public static class DownLoad_HTML
{
private static int FailCount = 0; //记录下载失败的次数
 
public static string GetHtml(string url) //传入要下载的网址
{
string str = string.Empty;
try
{
System.Net.WebRequest request = System.Net.WebRequest.Create(url);
request.Timeout = 10000; //下载超时时间
request.Headers.Set("Pragma", "no-cache");
System.Net.WebResponse response = request.GetResponse();
System.IO.Stream streamReceive = response.GetResponseStream();
Encoding encoding = Encoding.GetEncoding("gb2312");//utf-8 网页文字编码
System.IO.StreamReader streamReader = new System.IO.StreamReader(streamReceive, encoding);
str = streamReader.ReadToEnd();
streamReader.Close();
}
catch (Exception ex)
{
FailCount++;
 
if (FailCount > 5)
{
var result = System.Windows.Forms.MessageBox.Show("已下载失败" + FailCount + "次，是否要继续尝试？" + Environment.NewLine + ex.ToString(), "数据下载异常", System.Windows.Forms.MessageBoxButtons.YesNo, System.Windows.Forms.MessageBoxIcon.Error);
if (result == System.Windows.Forms.DialogResult.Yes)
{
str = GetHtml(url);
}
else
{
System.Windows.Forms.MessageBox.Show("下载HTML失败" + Environment.NewLine + ex.ToString(), "下载HTML失败", System.Windows.Forms.MessageBoxButtons.OK, System.Windows.Forms.MessageBoxIcon.Error);
throw ex;
}
}
else
{
str = GetHtml(url);
}
}
 
FailCount = 0; //如果能执行到这一步就表示下载终于成功了
return str;
}

登入後複製

希望本文所述對大家的C#程式設計有所幫助

更多c#中過濾html的正規表示式相關文章請關注PHP中文網！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7559

CakePHP 教程

1384

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

char在C語言中如何處理特殊字符 Apr 03, 2025 pm 03:18 PM

C語言中通過轉義序列處理特殊字符，如：\n表示換行符。 \t表示製表符。使用轉義序列或字符常量表示特殊字符，如char c = '\n'。注意，反斜杠需要轉義兩次。不同平台和編譯器可能有不同的轉義序列，請查閱文檔。

char在C語言字符串中的作用是什麼 Apr 03, 2025 pm 03:15 PM

在 C 語言中，char 類型在字符串中用於：1. 存儲單個字符；2. 使用數組表示字符串並以 null 終止符結束；3. 通過字符串操作函數進行操作；4. 從鍵盤讀取或輸出字符串。

char與wchar_t在C語言中的區別 Apr 03, 2025 pm 03:09 PM

在 C 語言中，char 和 wchar_t 的主要區別在於字符編碼：char 使用 ASCII 或擴展 ASCII，wchar_t 使用 Unicode；char 佔用 1-2 個字節，wchar_t 佔用 2-4 個字節；char 適用於英語文本，wchar_t 適用於多語言文本；char 廣泛支持，wchar_t 依賴於編譯器和操作系統是否支持 Unicode；char 的字符範圍受限，wchar_t 的字符範圍更大，並使用專門的函數進行算術運算。

C語言各種符號的使用方法 Apr 03, 2025 pm 04:48 PM

C 語言中符號的使用方法涵蓋算術、賦值、條件、邏輯、位運算符等。算術運算符用於基本數學運算，賦值運算符用於賦值和加減乘除賦值，條件運算符用於根據條件執行不同操作，邏輯運算符用於邏輯操作，位運算符用於位級操作，特殊常量用於表示空指針、文件結束標記和非數字值。

c#多線程和異步的區別 Apr 03, 2025 pm 02:57 PM

多線程和異步的區別在於，多線程同時執行多個線程，而異步在不阻塞當前線程的情況下執行操作。多線程用於計算密集型任務，而異步用於用戶交互操作。多線程的優勢是提高計算性能，異步的優勢是不阻塞 UI 線程。選擇多線程還是異步取決於任務性質：計算密集型任務使用多線程，與外部資源交互且需要保持 UI 響應的任務使用異步。