PHP中截取中文乱码解决办法
如果ASCii码大于0xa0就是半个汉字;了解substr()、mb_substr()、ord()。 现在常用的编码格式是UTF8,GBK,GBK2312,BIG5。GBK是GBK2312的升级。现在我开发中遇到的基本都是UTF8,GBK常用在论坛BBS上。今天自己写了下UTF8的,测试下还说的过去,毕竟从网上拷下来的是可以用,但是如果有时间最好还是自己写一下,这样只有到自己手里的才是自己的。
最简的就是利用:例一
<?php echo substr("Hello world!", 6); //输出:world! ?>
例二:
<?php echo substr("Hello world!", 6, 5); ?>
英文的话没有问题,但是中文就出问题了,下面我们使用mb_substr函数处理。
<?php /** *—————————————————————————————————————————————————————————————————————————— *PHP有一个mbstring扩展库可以用(有朋友面试PHP的时候还被问到过这个问题哦),但是 * 一般的服务器都没打开php_mbstring.dll,需要在 *php.ini里把php_mbstring.dll打开,如果没有权限的话就只有联系你的ISP了。 *因为mb_string的效率高一些,所以我们先检查一下mb_string是否可以用: *—————————————————————————————————————————————————————————————————————————— */ ?> <?php if (function_exists('mb_string')) { mb_substr($string, $start, $length, $encoding); //other codes here } else mysubstr($string, $start, $length); // 调用自己的函数 ?>
首先定义自己的函数:
<?php /** *——————————————————————- *首先定义自己的函数: *——————————————————————- */ function mysubstr($string, $start, $length) { if (strlen($string) > $length) { $str = ""; $len = $start + $length; for ($i = $start; $i < $len; $i++) { if (ord(substr($string, $i, 1)) > 0xa0) { $str.= substr($string, $i, 2); $i++; } else { $str.= substr($string, $i, 1); } } return $str . '…'; } else { return $string; } } ?>
还有一个问题要注意,使用这种方法的时候,你的标签对里的charset只有设成中文的编码才可以,如GBK,GB2312。
下面自己常用的一个中英文字符截取函数,自定义截取中文字符串函数,基本上就是仿照mb_substr写个函数,直接调用罢了,以下为我找到的代码,其实很简单:
<?php function substr_cn($string_input, $start, $length) { /* 功能: * 此算法用于截取中文字符串 * 函数以单个完整字符为单位进行截取,即一个英文字符和一个中文字符均表示一个单位长度 * 参数: * 参数$string为要截取的字符串, * 参数$start为欲截取的起始位置, * 参数$length为要截取的字符个数(一个汉字或英文字符都算一个) * 返回值: * 返回截取结果字符串 * */ $str_input = $string_input; $len = $length; $return_str = ""; //定义空字符串 for ($i = 0; $i < 2 * $len + 2; $i++) $return_str = $return_str . " "; $start_index = 0; //计算起始字节偏移量 for ($i = 0; $i < $start; $i++) { if (ord($str_input{$start_index} >= 161)) //是汉语 { $start_index+= 2; } else //是英文 { $start_index+= 1; } } $chr_index = $start_index; //截取 for ($i = 0; $i < $len; $i++) { $asc = ord($str_input{$chr_index}); if ($asc >= 161) { $return_str{$i} = chr($asc); $return_str{$i + 1} = chr(ord($str_input{$chr_index + 1})); $len+= 1; //结束条件加1 $i++; //位置偏移量加1 $chr_index+= 2; continue; } else { $return_str{$i} = chr($asc); $chr_index+= 1; } } return trim($return_str); } //end of substr_cn ?>
本文地址:
转载随意,但请附上文章地址:-)

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

使命召唤战区作为全新上线的一款手游,有很多的玩家都非常的好奇要怎么样才能够将这款游戏的语言设置为中文,其实非常的简单,玩家只需要下载中文的语言包,随后进行使用就可以进行修改了,详细的内容可以在这篇中文设置方法介绍之中进行了解,让我们一起来看看吧。使命召唤战区手游怎么设置中文1、首先进入游戏,点击界面右上角的设置图标。2、在出现的菜单栏中,找到【Download】这个选项并且点击。3、在这个页面中选择【SIMPLIFIEDCHINESE】(简体中文),就可以对简体中文的安装包进行下载了。4、回到设

Excel表格是现在很多人都在使用的办公软件之一,有些用户因为电脑是win11系统,因此显示的是英文界面,想要切换成中文界面,但是不知道应该怎么操作,针对这个问题,本期小编就来为广大用户们进行解答,一起来看看今日软件教程所分享的内容吧。 Excel切换中文操作教程: 1、进入软件,点击页面上方工具栏左侧的“File”选项。 2、在下方给出的选项中选择“options”。 3、进入新界面后,点击左侧的“language”选项

如何在PHPDompdf中正确显示中文字符在使用PHPDompdf生成PDF文件时,遇到中文字符显示乱码的问题是一个常见的挑战。这是因为Dompdf默认使用的字体库中不包含中文字符集。为了正确显示中文字符,我们需要手动设置Dompdf的字体,并确保选择支持中文字符的字体。以下是一些具体的步骤和代码示例来解决这个问题:第一步:下载中文字体文件首先,我们需要

VSCode设置中文:完全指南在软件开发中,VisualStudioCode(简称VSCode)是一个常用的集成开发环境。对于使用中文的开发者来说,将VSCode设置为中文界面可以提升工作效率。本文将为大家提供一个完整的指南,详细介绍如何将VSCode设置为中文界面,并提供具体的代码示例。第一步:下载安装语言包在打开VSCode后,点击左

标题:修复PHPDompdf中文乱码的有效途径在使用PHPDompdf生成PDF文档时,中文字符出现乱码是一个常见的问题。这一问题通常源于Dompdf默认不支持中文字符集,导致中文内容无法正确显示。为了解决这一问题,我们需要采取一些有效的途径来修复PHPDompdf中文乱码的问题。1.使用自定义字体文件一个解决Dompdf中文乱码问题的有效途径是使用

《WWE2K24》乃由VisualConcepts倾力打造的竞速体育游,已于2024年3月9日正式问世。此款游戏倍受赞誉,众多玩家热切关注其是否设有中文版。遗憾的是,迄今为止,《WWE2K24》尚未推出中文语言版本。wwe2k24会有中文吗答:目前不支持中文。WWE2K24在Steam国区的标准版售价为199元,豪华版为329元,纪念版为395元。该游戏的配置要求较高,无论处理器、显卡或运行内存等方面,均有一定标准。官方推荐配置以及最低配置介绍:

解决PHP写入txt文件中文乱码的技巧随着互联网的迅猛发展,PHP作为一种广泛应用的编程语言,被越来越多的开发者所使用。在PHP开发中,经常需要对文本文件进行读写操作,其中包括写入中文内容的txt文件。然而,由于编码格式的问题,有时候会导致写入的中文出现乱码。本文将介绍一些解决PHP写入txt文件中文乱码的技巧,并提供具体的代码示例。问题分析在PHP中,文本

标题:解决Oracle导入中文数据乱码问题的方法及代码示例在Oracle数据库中导入中文数据时,经常会出现乱码的情况,这可能是由于数据库字符集设置不正确或者导入过程中出现编码转换问题所致。为了解决这个问题,我们可以采取一些方法来保证导入的中文数据能够正确显示。下面是一些解决方案及具体的代码示例:一、检查数据库字符集设置在Oracle数据库中,字符集的设置对于
