首页 > 后端开发 > C++ > 如何从 C# 字符串中删除非 ASCII 字符?

如何从 C# 字符串中删除非 ASCII 字符?

Mary-Kate Olsen
发布: 2025-01-19 13:16:09
原创
419 人浏览过

How to Remove Non-ASCII Characters from Strings in C#?

高效删除 C# 字符串中的非 ASCII 字符

数据清理通常需要从字符串中删除非 ASCII 字符。 C# 的 Regex.Replace 方法为这一常见任务提供了简洁的解决方案。

示例:

<code class="language-csharp">string inputString = "søme string with non-ASCII characters.";
string outputString = Regex.Replace(inputString, @"[^\u0000-\u007F]+", "");</code>
登录后复制

正则表达式细分:

正则表达式 [^u0000-u007F] 定位并删除 ASCII 范围之外的所有字符。让我们来分解一下:

  • [^...]:这是一个否定的字符类。 它匹配指定集合中 以外的任何字符
  • u0000-u007F:定义 ASCII 字符的范围(Unicode 代码点 0 到 127)。
  • :此量词确保匹配和替换一个或多个连续的非 ASCII 字符。

用空字符串 ("") 替换匹配的字符可以有效地将它们从原始字符串中删除。 这种方法提供了一种干净有效的方法来处理 C# 中的非 ASCII 字符删除。

以上是如何从 C# 字符串中删除非 ASCII 字符?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板