高效率刪除 C# 字串中的非 ASCII 字元
資料清理通常需要從字串中刪除非 ASCII 字元。 C# 的 Regex.Replace
方法為此常見任務提供了簡潔的解決方案。
範例:
<code class="language-csharp">string inputString = "søme string with non-ASCII characters."; string outputString = Regex.Replace(inputString, @"[^\u0000-\u007F]+", "");</code>
正規表示式細分:
正規表示式 [^u0000-u007F]
定位並刪除 ASCII 範圍以外的所有字元。讓我們來分解一下:
[^...]
:這是一個否定的字元類別。 它符合指定集合中 以外的任何字元 。 u0000-u007F
:定義 ASCII 字元的範圍(Unicode 代碼點 0 到 127)。
:此量詞確保符合並取代一個或多個連續的非 ASCII 字元。 用空字串 (""
) 取代匹配的字元可以有效地將它們從原始字串中刪除。 這種方法提供了一種乾淨有效的方法來處理 C# 中的非 ASCII 字元刪除。
以上是如何從 C# 字串中刪除非 ASCII 字元?的詳細內容。更多資訊請關注PHP中文網其他相關文章!