正则过滤字符串,该如何解决-php教程-PHP中文網

正则过滤字符串

<br /><?php<br />//中文编码包含UTF-8,GBK<br />$str = "新_建&文\件,夹 abd";<br />//获取结果<br />$res = "新建文件夹abd";<br />//包含非法字符：<br />$out[0] = "_";<br />$out[1] = "&";<br />$out[2] = "\";<br />$out[3] = " ";<br />$out[4] = ",";<br />?><br />

登入後複製

正则 PHP

分享到：

------解决方案--------------------

$str = "新_建&文\件,夹 abd";<br />echo preg_replace('/[_&\\\,\s]+/u','',$str);

登入後複製

------解决方案--------------------

//中文编码包含UTF-8,GBK<br />$str = "新_建&文\件,夹 abd";<br />//获取结果<br />$res = "新建文件夹abd";<br />//包含非法字符：<br />$out[0] = "_";<br />$out[1] = "&";<br />$out[2] = "\\";<br />$out[3] = " ";<br />$out[4] = ",";<br /><br />$pattern = join('<br><font color='#FF8000'>------解决方案--------------------</font><br>', array_map('preg_quote', $out));<br />echo preg_replace("/$pattern/", '', $str);

登入後複製

新建文件夹abd

------解决方案--------------------
如果单纯的英文字母还好确定范围，符合要求的有[A-Za-z0-9]，也就是之外的全部为非法字符。
但是如果加上中英文混排，除非你确定出所有的汉字范围，否则没有好的方法扣除掉，例如GBK通常可以用[\x80-\xff][\x40-\xfe]来表示汉字的范围，注意这仅仅是大概范围，如果是utf8的话，则是\u4e00-\u9fa5，这里面如果有一些你认为是非法字符的话，是没有办法干掉的。

粗略的说，gbk非中文和英文字母以外的所有非法字符的范围应该是[^A-Za-z0-9\x80-\xff\x40-\xfe]
而utf8的则是[^A-Za-z0-9\x{4e00}-\x{9fff}]
------解决方案--------------------

echo preg_replace('/[^A-Za-z\p{Han}]+/u', '', "新_建&文\件,夹 abd");

登入後複製

------解决方案--------------------
上边的gbk的正则写错了，看例子就额可以知道

<?php //源文件文件gbk编码<br />$test = '新_建&文\件,夹a啊[圼[ abd';<br /><br />$matches = array();<br /><br />$reg = "/[^a-zA-Z0-9\x80-\xff]/";<br /><br />preg_match_all($reg, $test, $matches);<br /><br />var_dump($matches);<br /><br />$str = '圼';<br /><br />var_dump(ord($str[0]));<br />var_dump(ord($str[1]));<br /><br />var_dump(ord('['));

登入後複製

如果是gbk的话，可以用下面的方式

$test = '新_建&文\件,夹a啊[圼[ abd';<br /><br /><br />$out = preg_split('/([a-zA-Z0-9]<br><font color='#FF8000'>------解决方案--------------------</font><br>[\x80-\xff].)+/', $test);<br /><br />$matches = array(); <br /><br />preg_match_all('/([a-zA-Z0-9]<br><font color='#FF8000'>------解决方案--------------------</font><br>[\x80-\xff].)/', $test, $matches);<br /><br />$res = implode($matches[1]);<br /><br /><br />var_dump($res);<br /><br />$out = str_split(str_replace($matches[1], '', $test));<br /><br />var_dump($out);

登入後複製

相關標籤：

nbsp out str

上一篇：php xml 正则表达式数组的使用下一篇：怎么采用新窗口打开

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章