strtr函数字符替换出现乱码

WBOY
发布: 2016-06-23 14:18:42
原创
1568 人浏览过

我的替换词库来源于一个文本文件。文本文件无论改成gbk还是utf-8格式都出现乱码。
如果把替换词库自己定义如下:
$words = array('发文说'=>'DDDDDDDDDDDDDDDDDDDd');
替换就不会出现乱码
$data['content'] = strtr($data['content'], $words);

我把words变量打印出来,里面的词组都没有乱码,用函数检测,也不是utf-8格式。所以可以确认,内容和替换词组都是gbk格式的字符串。
请问如何解决这个问题?谢谢


回复讨论(解决方案)

你词库的格式?你如何读词库的?

你词库的格式?你如何读词库的?

$data_file = PICK_DATA.'/word.txt';$handle = fopen($data_file, "r");$data = fread($handle, filesize($data_file));
登录后复制

你词库的格式?你如何读词库的?

我在网上搜索,得到答案说: 因为strtr在字符串替换的时候是以单个字节对应进行替换的,所以对于非单字节编码的数据(如中文utf-8)就可以会出现乱码。
但是我的字符串都是gbk呀。而且我以前也用这个函数,没出现乱码。到这里就出现乱码了,不知道为何。

你没有说你的词库是如何组织的

不多只要你的原词有单个汉字的话,乱码的概率一般不会低于50%

你没有说你的词库是如何组织的

不多只要你的原词有单个汉字的话,乱码的概率一般不会低于50%

问题找到了。我切割字符的时候用的是\n,而不是\r\n。这就是造成乱码的原因。感谢回答。

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板