如何改進正規表示式以完全刪除 HTML 標籤？-C++-PHP中文網

如何改進正規表示式以完全刪除 HTML 標籤？

Barbara Streisand

發布： 2025-01-05 21:11:42

原創

763 人瀏覽過

How Can I Improve My Regular Expression to Completely Remove HTML Tags?

用於全面HTML 標記刪除的正規表示式增強

您的現有程式碼成功刪除了HTML 標記，但保留了結束標記，從而留下了不必要的結果。為了解決這個問題，我們將探索一種修改後的正規表示式，它可以有效地針對開始和結束標籤。

改進的正則表達式模式

改進的正則表達式模式是：

"</?([a-z]+)[^>]*>"

登入後複製

細分模式：

程式碼實作

在您的程式碼中，應更新以下行：

string sPattern = @"</?([a-z]+)[^>]*>";

登入後複製

解釋

此修改後的模式與後面的左尖括號或右尖括號相匹配通過標籤名稱（例如“a”或“img”）以及標籤內的任何屬性或內容。它有效地刪除指定元素的開始和結束標籤。

其他注意事項

如果在輸出中遇到任何剩餘標籤，您可以考慮使用更通用的標籤來匹配所有HTML 標籤的模式：

"<.*?>"

登入後複製

請記住，使用正規表示式時，熟悉其語法至關重要並考慮您的用例的特定要求，以確保結果準確且有效率。

以上是如何改進正規表示式以完全刪除 HTML 標籤？的詳細內容。更多資訊請關注PHP中文網其他相關文章！