問題:
如何輕鬆地從字符串中刪除所有HTML 標籤,無論具體標籤如何涉及?
範例:
考慮以下富含 HTML的字串:
string title = "<b>Hulk Hogan's Celebrity Championship Wrestling <font color=\"#228b22\">[Proj # 206010]</font></b> (Reality Series,)
理想情況下,我們希望輸出為是:
"Hulk Hogan's Celebrity Championship Wrestling [Proj # 206010] (Reality Series)"
解:
正規表示式方法:
一個有效的解法是用正規表示式:
public static string StripHTML(string input) { return Regex.Replace(input, "<.*?>", String.Empty); }
此正規表示式符合尖括號中包含的任何字串 () 並將其替換為空字串。
HTML Agility Pack:
或者,您可以利用 HTML Agility Pack 函式庫:
HTMLDocument doc = new HTMLDocument(); doc.LoadHtml(input); string stripped = doc.DocumentNode.InnerText;
此方法解析HTML字串,只回傳文字內容,不包括所有標籤和
注意事項:
雖然這些方法可以有效地刪除HTML標籤,但它們也有限制:
根據您的特定要求和權衡選擇合適的解決方案非常重要。
以上是如何有效率地刪除字串中的所有 HTML 標籤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!