ヒント記事: UTF8 での中国語 PHP プログラミング-php手册-php.cn

ホームページ

php教程

php手册

ヒント記事: UTF8 での中国語 PHP プログラミング

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 21, 2016 am 09:00 AM

mysql str substr utf8

前言：

说实话，
凉鞋也觉得 UTF8 是好东西……
毕竟同屏显示中日韩对东亚人的吸引力是不小的……
（当然好处不仅是这点啦……）
不仅是网页程式……
很多应用程式的内核都开始使用 Unicode 编码……
目的是显而易见的：支援多语言显示……
微软的所有软体都是 Unicode 内核……
所以日文软体拿到你的中文 XP 上是可以正常显示的……
而中文 98 就会因为 GB 内核安装其他语言软体时造成乱码……

至于 UTF8 ，
可以说是 Unicode 的一个分支，
它用三个字节保存一个汉字……
（Unicode 用四个字节）
应用软体都集体投奔 Unicode 了……
就不允许我们搞网页程式的用 UTF8？

本文中凉鞋就尽量多方位介绍一下 UTF8 编码下的 PHP 编程……
至于为什么单独介绍“中文”……
一来是因为英文这玩意实在不需要考虑 UTF8 ……
除非你准备做多语言系统……
（我要发些牢骚：现在的老外写程式时根本不重视这个问题……）
二来是中日韩等多字节语系在 UTF8 编码下的处理方式其实大同小异……
依葫芦画瓢即可……
好……先从数据库处理部分开始吧……

==========================================
连接数据库

很多人刚升级到 Mysql 4.1 时会发现数据乱掉了……
其实是因为 Mysql 从 4.1 开始支援字符集了……
而且默认字符集正是 UTF8 ……
（充分证明与国际接轨的重要性…… 嘿嘿……）
而以前我们大多使用 utf8 或是 GBK 编码……
这样以来输出的数据当然是乱码……
要解决乱码……
就得让程序知道该获取什么编码的数据……

我们假设你以前的数据库是 utf8 编码的……
那么你可以在查询前添加一句

mysql_query('SET CHARACTER SET utf8') or die("Query failed : " . mysql_error());
当然，由于 4.1 以上才需要这样处理，
因此我们可以加上判断：

$mysqlversion = $db->query_first("SELECT VERSION() AS version");
if ($mysqlversion['version'] >= '4.1')
{
mysql_query('SET CHARACTER SET utf8') or die("Query failed : " . mysql_error());
}
这样以来不管 Mysql 默认编码是什么都可以正常存取了……
（不论您是存活期，还是存定期，甚至是零存整取都没有问题鸟……）

但是，人家都国际化鸟……
您还在用 utf8 行么？
如何转码呢？
还有……
数据升级时出现乱码怎么办？
凉拌！
且听下回分解……

============================================
数据升级至 4.1

要升级……
就得先导出……
要说老外还真不负责……
以前的导出方式总是弄丢一些中文字符……
比如把“我爱你娘”弄成“我爱你”啦……
（通常是丢失一段数据最末尾的字）
整个儿差了一辈儿……
（用石榴姐的话说就是“这么大逆不道的事实在是太刺激了”……）
为了保护您脆弱的心脏……
也为了维护中国传统伦理道义……
您可以把数据包含中文字符的字段改为二进制(Binary)编码……
具体方法嘛……
可以运行这个语句：

ALTER TABLE `表名` CONVERT TO CHARACTER SET binary;
这样，那些字符类型字段，如：
CHAR、VARCHAR 和 TEXT
将转换为
BINARY、VARBINARY 和 BLOB
然后再导出并导入到 4.1 环境中……
当然，最后一项繁琐的工作是：
你需要把它们的类型再改回来……

有往 4.1 升级的……
当然也有往下降级的……
怎么降级？？？
凉鞋去上个厕所……
而您请翻下页……

=============================================
数据从 4.1 降级

有人发现从4.1导出的 SQL 文件无法导入低版本程序……
问题其实很简单……
而且 Mysql 已经为我们想好了一切……
导出时请添加 –compatible 参数……
我们假设您的数据库是 utf8 编码的……
而且目标数据库版本为 4.0 ……
那么命令行下这么写：

shell>mysqldump --user=username --password=password --compatible=mysql40 --default-character-set=utf8 database > db.sql
这样导出的 SQL 文件就能够顺利导入低版本数据库了……

数据库部分算是搞定了……
但 PHP 编程方面要如何注意呢？
还得劳您翻下页……
http://www.knowsky.com
=============================================
PHP 文件编码

是否所有 PHP 文件都必须转成 UTF8 编码呢？
凉鞋告诉您是 NO ……

次のようにしましょう...
ファイルに表示する必要のある中国語の文字が含まれている場合...
UTF8 エンコーディングに変換する必要があります...
例:

// 私はサンダルです
echo time();
上記コードにはコードがありますが...
でもコメント内に存在するため...
は出力されません.. .
したがって、このページは UTF8 形式に変換する必要はありません...

別の例:

echo "I am Sandal";
これには明らかに中国語の文字が出力されています...
UTF8 に変換する必要があります... ...

もちろん、現在、多くのプログラムはテンプレート (言語パック) テクノロジを使用しています...
プログラム (言語パック以外のファイル)...
このようにして、言語パックファイルを UTF8 エンコーディングに変換するだけで済みます...
(これは言語パックの利点です...ああハハハハハ...)
'http://www.knowsky.com
============================= ===================== =

UTF8 中国語インターセプト

UTF8 は 3 バイトを使用するため...
従来の substr 関数は役に立ちません...
多くの専門家が UTF8 漢字インターセプト関数を作成しています...
ここにいくつかあります:

1. 最初に計算してから、

を取得します。 /**
* 著者 : ダミー |ザンディ
* 電子メール : lianxiwoo@gmail.com | hotmail.com
* 作成: 200512
* 使用法: echo join('', String::subString_UTF8('汉字', 0, 1));
*/
ini_set('display_errors', 1);
error_reporting(E_ALL ^ E_NOTICE);
class String {
function subString_UTF8($str, $start, $lenth)
{
$len = strlen($str);
$r = array();
$n = 0;
$m = 0;
for( $i = 0; $i $x = substr($str, $i, 1);
$a = Base_convert(ord($x), 2 );
$a = substr('00000000'.$a, -8);
if ($n < $start){
if (substr($a, 0, 1) == 0) {
}elseif (substr($a, 0, 3) == 110) {
$i += 1;
}elseif (substr($a, 0, 4) == 1110 ) {
$i += 2;
}
$n++;
}else{
if (substr($a, 0, 1) == 0) {
$ r[] = substr($str, $i, 1);
}elseif (substr ($a, 0, 3) == 110) {
$r[] = substr($str, $i , 2);
$i += 1;
}elseif (substr($ a, 0, 4) == 1110) {
$r[] = substr($str, $i, 3 );
$i += 2;
}else{
$r [] = '';
}
if (++$m >= $lenth){
break;
}
}
}
return $r;
} // End subString_UTF8
}// End String
echo join('', String:: subString_UTF8('中国語', 0, 1));
2. 最初にインターセプトしてから取得します
この方法は非常に賢いと思います...
最初に切り詰めるために従来のインターセプト関数を使用します...
次に、単一の漢字が分割されているかどうかを判断します...
分割されている場合は...処理します...
substr 関数の 3 番目のパラメーターが大きくなければならないという事実に特別な注意を払う必要があります3よりも...
なぜサンダルを使って説明しないのですか？

// http://en.wikipedia.org/wiki/UTF-8
/ の手順に従って、utf-8 文字列の最後の文字を削除するトリム関数
// / dotann
// 使用法: $str = utf8_trim(substr($str,0,50));
function utf8_trim($str) {
$len = strlen($str);
for ($i=strlen($str)-1; $i>=0; $i-=1){
$hex .= ' '.ord($str[$i]);
$ ch = ord($str[$i]);
if (($ch & 128)==0) return(substr($str,0,$i));
if (($ch & 192)==192) return(substr($str,0,$i));
}
return($str.$hex);
}
$str = '漢字' ;
echo utf8_trim(substr($str,0,3));
3. 他のメソッドもあります。
たとえば、007pig は vBulletin 中国語版で記述された関数です...
短く簡潔に...
ソースコードを公開するのは不便です...
ごめんなさい...

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Java チュートリアル

1663

CakePHP チュートリアル

1419

Laravel チュートリアル

1313

PHP チュートリアル

1263

C# チュートリアル

1237

Related knowledge

MySQLの役割：Webアプリケーションのデータベース Apr 17, 2025 am 12:23 AM

WebアプリケーションにおけるMySQLの主な役割は、データを保存および管理することです。 1.MYSQLは、ユーザー情報、製品カタログ、トランザクションレコード、その他のデータを効率的に処理します。 2。SQLクエリを介して、開発者はデータベースから情報を抽出して動的なコンテンツを生成できます。 3.MYSQLは、クライアントサーバーモデルに基づいて機能し、許容可能なクエリ速度を確保します。

Laravelは紹介例 Apr 18, 2025 pm 12:45 PM

Laravelは、Webアプリケーションを簡単に構築するためのPHPフレームワークです。次のような強力な機能を提供します。インストール：Laravel CLIを作曲家にグローバルにインストールし、プロジェクトディレクトリにアプリケーションを作成します。ルーティング：ルート/web.phpのURLとハンドラーの関係を定義します。ビュー：リソース/ビューでビューを作成して、アプリケーションのインターフェイスをレンダリングします。データベース統合：MySQLなどのデータベースとのすぐ外側の統合を提供し、移行を使用してテーブルを作成および変更します。モデルとコントローラー：モデルはデータベースエンティティを表し、コントローラーはHTTP要求を処理します。

MySQLおよびPHPMYADMIN：コア機能と関数 Apr 22, 2025 am 12:12 AM

MySQLとPHPMyAdminは、強力なデータベース管理ツールです。 1）MySQLは、データベースとテーブルを作成し、DMLおよびSQLクエリを実行するために使用されます。 2）PHPMyAdminは、データベース管理、テーブル構造管理、データ操作、ユーザー許可管理のための直感的なインターフェイスを提供します。

データベース接続の解決問題：Minii/DBライブラリを使用する実用的なケース Apr 18, 2025 am 07:09 AM

小さなアプリケーションを開発する際には、軽量データベース操作ライブラリをすばやく統合する必要性という厄介な問題に遭遇しました。複数のライブラリを試した後、私はそれらがあまりにも多くの機能を持っているか、あまり互換性がないかのどちらかであることがわかりました。最終的に、私は問題を完全に解決したYii2に基づいた単純化されたバージョンであるMinii/DBを見つけました。

MySQL対その他のプログラミング言語：比較 Apr 19, 2025 am 12:22 AM

他のプログラミング言語と比較して、MySQLは主にデータの保存と管理に使用されますが、Python、Java、Cなどの他の言語は論理処理とアプリケーション開発に使用されます。 MySQLは、データ管理のニーズに適した高性能、スケーラビリティ、およびクロスプラットフォームサポートで知られていますが、他の言語は、データ分析、エンタープライズアプリケーション、システムプログラミングなどのそれぞれの分野で利点があります。

Laravel Frameworkインストール方法 Apr 18, 2025 pm 12:54 PM

記事の概要：この記事では、Laravelフレームワークを簡単にインストールする方法について読者をガイドするための詳細なステップバイステップの指示を提供します。 Laravelは、Webアプリケーションの開発プロセスを高速化する強力なPHPフレームワークです。このチュートリアルは、システム要件からデータベースの構成とルーティングの設定までのインストールプロセスをカバーしています。これらの手順に従うことにより、読者はLaravelプロジェクトのための強固な基盤を迅速かつ効率的に築くことができます。

初心者向けのMySQL：データベース管理を開始します Apr 18, 2025 am 12:10 AM

MySQLの基本操作には、データベース、テーブルの作成、およびSQLを使用してデータのCRUD操作を実行することが含まれます。 1.データベースの作成：createdatabasemy_first_db; 2。テーブルの作成：createTableBooks（idintauto_incrementprimarykey、titlevarchary（100）notnull、authorvarchar（100）notnull、published_yearint）; 3.データの挿入：InsertIntoBooks（タイトル、著者、公開_year）VA

MySQLモードの問題を解決する問題：TheliamySQLModescheckerモジュールの使用経験 Apr 18, 2025 am 08:42 AM

Theliaを使用してeコマースWebサイトを開発するとき、私はトリッキーな問題に遭遇しました：MySQLモードが適切に設定されていないため、いくつかの機能が適切に機能しません。いくつかの調査の後、TheliamysQlModescheckerというモジュールを見つけました。これは、Theliaが必要とするMySQLパターンを自動的に修正できるため、問題を完全に解決できます。

See all articles