高效删除 C# 字符串中的非 ASCII 字符
数据清理通常需要从字符串中删除非 ASCII 字符。 C# 的 Regex.Replace
方法为这一常见任务提供了简洁的解决方案。
示例:
<code class="language-csharp">string inputString = "søme string with non-ASCII characters."; string outputString = Regex.Replace(inputString, @"[^\u0000-\u007F]+", "");</code>
正则表达式细分:
正则表达式 [^u0000-u007F]
定位并删除 ASCII 范围之外的所有字符。让我们来分解一下:
[^...]
:这是一个否定的字符类。 它匹配指定集合中 以外的任何字符 。u0000-u007F
:定义 ASCII 字符的范围(Unicode 代码点 0 到 127)。
:此量词确保匹配和替换一个或多个连续的非 ASCII 字符。用空字符串 (""
) 替换匹配的字符可以有效地将它们从原始字符串中删除。 这种方法提供了一种干净有效的方法来处理 C# 中的非 ASCII 字符删除。
以上是如何从 C# 字符串中删除非 ASCII 字符?的详细内容。更多信息请关注PHP中文网其他相关文章!