在某些情况下,您可能需要从字符串中删除不可打印的字符字符串,例如字符串操作或数据期间 0-31 和 127 范围内的字符串
要删除 7 位 ASCII 范围(0-31、127-255)中的不可打印字符,请使用使用 preg_replace 的以下正则表达式:
$string = preg_replace('/[x00-x1Fx7F-xFF]/', '', $string);
这将有效删除指定范围内的所有字符。
处理 8 位扩展ASCII,仅删除0-31和127范围内的字符,使用调整后的正则表达式:
$string = preg_replace('/[x00-x1Fx7F]/', '', $string);
对于 UTF-8 编码的字符串,建议在正则表达式中包含 /u 修饰符:
$string = preg_replace('/[x00-x1Fx7F]/u', '', $string);
通过将 xA0 添加到字符类,可以确保准确删除特定控制字符,例如 NO-BREAK SPACE (U 00A0)。
虽然 preg_replace 很有效,但请考虑str_replace 作为替代方案,特别是对于重复操作。
// 创建不可打印字符数组
$badchars = array(
chr(0), chr(1), chr(2), ..., chr(31), chr(127)
);
// 使用 str_replace
$str2 = str_replace($badchars, '', $str);
使用您自己的数据对两种方法的性能进行基准测试以确定适合您的特定情况的最佳解决方案非常重要。
以上是如何从 PHP 字符串中删除不可打印的字符?的详细内容。更多信息请关注PHP中文网其他相关文章!