Maison > développement back-end > Problème PHP > Comment résoudre les caractères tronqués chinois php

Comment résoudre les caractères tronqués chinois php

爱喝马黛茶的安东尼
Libérer: 2023-02-23 13:36:01
original
25369 Les gens l'ont consulté

Comment résoudre les caractères tronqués chinois php

Manuel recommandé  : manuel d'auto-apprentissage complet en php

1. Vérifiez le problème de conversion de la page HTML en encodage UTF-8

1 Ajoutez une ligne après l'en-tête et avant le titre :

<meta http-equiv=&#39;Content-Type&#39; content=&#39;text/html; charset=utf-8&#39; />
Copier après la connexion

La commande. on ne peut pas se tromper, ça doit être après la tête, avant le titre.

Problème d'encodage du fichier 2.html :

Cliquez sur le menu de l'éditeur : "Fichier" -> "Enregistrer sous", vous pouvez voir l'encodage du fichier actuel, assurez-vous que l'encodage du fichier est : UTF -8,

Si c'est ANSI, vous devez changer l'encodage en : UTF-8.

3. Problème de nomenclature d'en-tête de fichier HTML :

Lors de la conversion de fichiers d'autres encodages en encodage UTF-8, une balise BOM est parfois ajoutée au début du fichier,

Une balise BOM peut amener le navigateur à afficher des caractères tronqués lors de l'affichage de caractères chinois.

Comment supprimer cette balise BOM :

(1) Vous pouvez ouvrir le fichier avec Dreamweaver et le réenregistrer pour supprimer la balise BOM !

(2) Vous pouvez ouvrir le fichier avec EditPlus, et dans le menu "Préférences"->"Fichier"->"Signature UTF-8", le régler sur : "Toujours supprimer la signature",

Ensuite, enregistrez le fichier et vous pourrez supprimer la balise BOM !

4. Problème d'encodage UTF-8 du serveur WEB :

Si vous suivez les étapes répertoriées ci-dessus et que vous rencontrez toujours des problèmes de chinois tronqué, veuillez vérifier l'encodage du serveur WEB que vous utilisez.

Si vous utilisez Apache, veuillez définir le jeu de caractères dans le fichier de configuration sur : utf-8 (seules les méthodes sont répertoriées ici, veuillez vous référer au fichier de configuration Apache pour le format spécifique)

Si vous utilisez Nginx, veuillez définir charset dans nginx.conf sur utf-8. Plus précisément, recherchez "charset gb2312;" ou une instruction similaire et remplacez-la par : "charset utf-8;".

Recommandations associées : "Tutoriel PHP"

2. Problème de conversion de page PHP en UTF-8

1. Dans Ajouter une ligne au début du code :

header("Content-Type: text/html;charset=utf-8");
Copier après la connexion

2. Problème d'encodage du fichier PHP :

Cliquez sur le menu de l'éditeur : "Fichier" -> "Enregistrer sous" pour voir l'encodage. du fichier actuel, assurez-vous que l'encodage du fichier est : UTF-8. S'il est ANSI, vous devez modifier l'encodage en : UTF-8.

3. Problème de nomenclature d'en-tête de fichier PHP :

Les fichiers PHP ne doivent pas avoir de balises BOM.

Sinon, il y aura une situation dans laquelle la session ne pourra pas être utilisée, et il y aura une invite similaire :

Warning: session_start() [function.session-start]: Cannot send session cache limiter - headers already sent
Copier après la connexion

En effet, lors de l'exécution de session_start(), la page entière ne peut pas avoir de sortie , mais lorsqu'il y a une balise BOM dans la page PHP précédente

PHP traite cette balise BOM comme une sortie, donc une erreur se produit !

La page PHP doit donc supprimer la balise BOM

Comment supprimer cette balise BOM :

(1) Vous pouvez ouvrir le fichier avec Dreamweaver et le réenregistrer pour supprimer le Étiquette de nomenclature !

(2) Vous pouvez ouvrir le fichier avec EditPlus, et dans le menu "Préférences"->"Fichier"->"Signature UTF-8", le régler sur : "Toujours supprimer la signature",

Ensuite, enregistrez le fichier et vous pourrez supprimer la balise BOM !

4. Lorsque PHP enregistre des fichiers sous forme de pièces jointes, problèmes d'encodage UTF-8 :

Lorsque PHP enregistre des fichiers sous forme de pièces jointes, le nom du fichier doit être encodé en GB2312, sinon, s'il y a du chinois, des caractères tronqués seront affichés.

Si votre PHP lui-même est un fichier au format d'encodage UTF-8, vous devez convertir la variable de nom de fichier de UTF-8 en GB2312 :

iconv("UTF-8", "GB2312", "$filename");
Copier après la connexion

5 Lorsque le titre de l'article est tronqué. et affichés, des caractères tronqués apparaissent. Ou la question du point d'interrogation "?" :

Généralement, lorsque le titre de l'article est très long, une partie du titre sera affichée et le titre de l'article sera tronqué, car un Le caractère chinois au format d'encodage UTF-8 occupera 3 caractères de largeur,

Lors de l'interception du titre, parfois seulement 1 caractère ou 2 caractères de largeur d'un caractère chinois seront interceptés. , des caractères tronqués ou des points d'interrogation "?"

Utilisez la fonction suivante pour intercepter le titre, et il n'y aura aucun problème :

function get_brief_str($str, $max_length) 
{ 
echo strlen($str) ."<br>"; 
if(strlen($str) > $max_length) 
{ 
$check_num = 0; 
for($i=0; $i < $max_length; $i++) 
{ 
if (ord($str[$i]) > 128) 
$check_num++; 
} 
if($check_num % 3 == 0) 
$str = substr($str, 0, $max_length)."..."; 
else if($check_num % 3 == 1) 
$str = substr($str, 0, $max_length + 2)."..."; 
else if($check_num % 3 == 2) 
$str = substr($str, 0, $max_length + 1)."..."; 
} 
return $str; 
}
Copier après la connexion

3 Le problème de l'utilisation de l'encodage UTF-8 dans la base de données MYSQL

1 .Créez une base de données et une table de données avec phpmyadmin

Lors de la création de la base de données, veuillez définir "Organisation" sur : "utf8_general_ci"

ou exécutez l'instruction :

CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
Copier après la connexion

Créer une table de données Quand : Si le champ stocke le chinois, vous devez définir "Organisation" sur : "utf8_general_ci",

Si le champ stocke l'anglais ou des chiffres, la valeur par défaut est correcte.

L'instruction SQL correspondante, par exemple :

CREATE TABLE `test` ( 
`id` INT NOT NULL , 
`name` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , 
PRIMARY KEY ( `id` ) 
) ENGINE = MYISAM ;
Copier après la connexion

2 Utilisez PHP pour lire et écrire la base de données

Après vous être connecté à la base de données :

[hide]$connection = mysql_connect($host_name, $host_user, $host_pass);
Copier après la connexion

. Ajoutez deux lignes :

mysql_query("set character set &#39;utf8&#39;");//读库
mysql_query("set names &#39;utf8&#39;");//写库
Copier après la connexion

peut lire et écrire normalement la base de données MYSQL.

相关文章推荐:
1.php页面中文乱码
相关视频推荐:
1.独孤九贱(4)_PHP视频教程

四、JS相关的UTF-8编码问题

1.JS读Cookie的中文乱码问题

PHP写cookie的时候需要将中文字符进行escape编码, 否则JS读到cookie中的中文字符将是乱码。

但php本身没有escape函数,我们新写一个escape函数:

function escape($str) 
{ 
preg_match_all("/[\x80-\xff].|[\x01-\x7f]+/",$str,$r); 
$ar = $r[0]; 
foreach($ar as $k=>$v) 
{ 
if(ord($v[0]) < 128) 
$ar[$k] = rawurlencode($v); 
else 
$ar[$k] = "%u".bin2hex(iconv("UTF-8","UCS-2",$v)); 
} 
return join("",$ar); 
}
Copier après la connexion

JS读cookie的时候,用unescape解码,然后就解决cookie中有中文乱码的问题了。

2.外部JS文件UTF-8编码问题

当一个HTML页面或则PHP页面包含一个外部的JS文件时,如果HTML页面或则PHP页面是UTF-8编码格式的文件,外部的JS文件同样要转成UTF-8的文件,否则将出现,没有包含不成功,调用函数时没有反应的情况。

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,如果是ANSI,需要将编码改成:UTF-8。

五、FLASH相关的UTF-8编码问题

FLASH内部对所有字符串,默认都是以UTF-8处理

1.FLASH读文普通本文件(txt,html)

要将文本文件的编码存为UTF-8

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8, 如果是ANSI,需要将编码改成:UTF-8。

2.FLASH读XML文件

要将XML文件的编码存为UTF-8

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8, 如果是ANSI,需要将编码改成:UTF-8。

3.FLASH读PHP返回数据

如果PHP编码本身是UTF-8的,直接echo就可以了。

如果PHP编码本身是GB2312的,可以将PHP转存成UTF-8编码格式的文件,直接echo就可以了。

如果PHP编码本身是GB2312的,而且不允许改文件的编码格式。

用下面的语句将字符串转换成UTF-8的编码格式

$new_str = iconv("GB2312", "UTF-8", "$str");
Copier après la connexion
Copier après la connexion

再echo就可以了。

4.FLASH读数据库(MYSQL)的数据

FLASH要通过PHP读取数据库中的数据

PHP本身的编码不重要,关键是如果数据库的编码是GB2312的话, 需要用下面的语句将字符串转换成UTF-8的编码格式:

$new_str = iconv("GB2312", "UTF-8", "$str");
Copier après la connexion
Copier après la connexion

5.FLASH通过PHP写数据

一句话,FLASH传过来的字符串是UTF-8格式的,要转换成相应的编码格式,再操作(写文件、写数据库、直接显示等等)

还是用iconv函数转换

6.FLASH使用本地编码(理论上不推荐使用)

如果想让FLASH不使用UTF-8编码,而是使用本地编码,对于中国大陆地区而言,本地编码是GB2312或GBK。

在程序内,可以添加以下代码:

System.useCodepage = true;
Copier après la connexion

那么FLASH内所有字符都是使用GB2312的编码了,所有导入到FLASH或者从FLASH导出的数据,都应该做相应的编码转换。

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal