Table des matières
string iconv ( string in_charset, string out_charset, string str ) 
Maison développement back-end tutoriel php php字符串编码转换 iconv与mb_convert_encoding的区别

php字符串编码转换 iconv与mb_convert_encoding的区别

Jun 20, 2016 pm 01:02 PM
php字符串

​PHP判断字符串编码函数mb_detect_encoding总结

iconv — Convert string to requested character encoding(PHP 4 >= 4.0.5, PHP 5)

mb_convert_encoding — Convert character encoding(PHP 4 >= 4.0.6, PHP 5)
 

iconv — 字符串按要求的字符编码来转换
mb_convert_encoding — 转换字符的编码

这两个函数功能类似都是用来转换字符串编码的;

用法:

string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] ) 


注:需要先启用 mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉

 

参数:str——要编码的str、to_encoding——str要转换成编码类型、from_encoding——在转换前通过字符代码名称来指定。 它可以是一个 array 也可以是逗号分隔的枚举列表。 如果没有提供 from_encoding,则会使用内部(internal)编码。 参见支持的编码。

 

支持的字符编码

当前 mbstring 模块支持以下的字符编码。这些字符编码中的任意一个都能指定到 mbstring 函数中的 encoding 参数。

该 PHP 扩展支持的字符编码有以下几种:

    UCS-4*
    UCS-4BE
    UCS-4LE*
    UCS-2
    UCS-2BE
    UCS-2LE
    UTF-32*
    UTF-32BE*
    UTF-32LE*
    UTF-16*
    UTF-16BE*
    UTF-16LE*
    UTF-7
    UTF7-IMAP
    UTF-8*
    ASCII*
    EUC-JP*
    SJIS*
    eucJP-win*
    SJIS-win*
    ISO-2022-JP
    ISO-2022-JP-MS
    CP932
    CP51932
    SJIS-mac** (别名: MacJapanese)
    SJIS-Mobile#DOCOMO** (别名: SJIS-DOCOMO)
    SJIS-Mobile#KDDI** (别名: SJIS-KDDI)
    SJIS-Mobile#SOFTBANK** (别名: SJIS-SOFTBANK)
    UTF-8-Mobile#DOCOMO** (别名: UTF-8-DOCOMO)
    UTF-8-Mobile#KDDI-A**
    UTF-8-Mobile#KDDI-B** (别名: UTF-8-KDDI)
    UTF-8-Mobile#SOFTBANK** (别名: UTF-8-SOFTBANK)
    ISO-2022-JP-MOBILE#KDDI** (别名: ISO-2022-JP-KDDI)
    JIS
    JIS-ms
    CP50220
    CP50220raw
    CP50221
    CP50222
    ISO-8859-1*
    ISO-8859-2*
    ISO-8859-3*
    ISO-8859-4*
    ISO-8859-5*
    ISO-8859-6*
    ISO-8859-7*
    ISO-8859-8*
    ISO-8859-9*
    ISO-8859-10*
    ISO-8859-13*
    ISO-8859-14*
    ISO-8859-15*
    byte2be
    byte2le
    byte4be
    byte4le
    BASE64
    HTML-ENTITIES
    7bit
    8bit
    EUC-CN*
    CP936
    GB18030**
    HZ
    EUC-TW*
    CP950
    BIG-5*
    EUC-KR*
    UHC (CP949)
    ISO-2022-KR
    Windows-1251 (CP1251)
    Windows-1252 (CP1252)
    CP866 (IBM866)
    KOI8-R*

* 表示该编码也可以在正则表达式中使用。

** 表示该编码自 PHP 5.4.0 始可用。

任何接受编码名称的 php.ini 条目同样也可以使用 "auto" 和 "pass" 的值。 接受编码名的 mbstring 函数同样也可以使用值 "auto"。

如果设置了 "pass",将不会对字符的编码进行转化。

如果设置了 "auto",它将扩展成 NLS 中定义的每个字符编码列表。 比如,假设 NLS 设置为 Japanese,值将会认为是 "ASCII,JIS,UTF-8,EUC-JP,SJIS"。

NLS:国家语言支持(National Language Support)

string iconv ( string in_charset, string out_charset, string str ) 

注意:
第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,
其中:
//TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,
//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure. (返回转换后的字符串;如果执行失败将返回FALSE。)

使用:

1. 发现iconv在转换字符 "-" 到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个 "-" 都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug。

2. mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别, 但是执行效率比iconv差太多;如:
$str = mb_convert_encoding($str,"euc-jp","ASCII,JIS,EUC-JP,SJIS,UTF-8");“ASCII,JIS,EUC-JP,SJIS,UTF-8”的顺序不同效果也有差异 。

3. 一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数 。

from_encoding is specified by character code name before conversion. it can be array or string - comma separated
enumerated list. If it is not specified, the internal encoding will be used.

$str = mb_convert_encoding($str, "UCS-2LE", "JIS, eucjp-win, sjis-win");
$str = mb_convert_encoding($str, "EUC-JP', " auto");

例子:

$content = iconv("GBK", "UTF-8", $content);
$content = mb_convert_encoding($content, "UTF-8", "GBK");

 

 

/* 转换内部编码为 SJIS */
$str = mb_convert_encoding($str, "SJIS");

/* 将 EUC-JP 转换成 UTF-7 */
$str = mb_convert_encoding($str, "UTF-7", "EUC-JP");

/* 从 JIS, eucjp-win, sjis-win 中自动检测编码,并转换 str 到 UCS-2LE */
$str = mb_convert_encoding($str, "UCS-2LE", "JIS, eucjp-win, sjis-win");

/* "auto" 扩展成 "ASCII,JIS,UTF-8,EUC-JP,SJIS" */
$str = mb_convert_encoding($str, "EUC-JP", "auto");

Copier après la connexion

$text = "This is the Euro symbol '€'.";

echo 'Original : ', $text, PHP_EOL;
echo 'TRANSLIT : ', iconv("UTF-8", "ISO-8859-1//TRANSLIT", $text), PHP_EOL;
echo 'IGNORE   : ', iconv("UTF-8", "ISO-8859-1//IGNORE", $text), PHP_EOL;
echo 'Plain    : ', iconv("UTF-8", "ISO-8859-1", $text), PHP_EOL;



输出结果: 
Original : This is the Euro symbol '€'.
TRANSLIT : This is the Euro symbol 'EUR'.
IGNORE   : This is the Euro symbol ''.
Plain    :
Notice: iconv(): Detected an illegal character in input string in .\iconv-example.php on line 7
This is the Euro symbol '    
 
Copier après la connexion


Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Comment convertir des caractères en code ascii en php Comment convertir des caractères en code ascii en php Mar 03, 2023 pm 06:55 PM

En PHP, vous pouvez utiliser la fonction ord() pour convertir des caractères en code ascii. Cette fonction peut renvoyer la valeur ASCII d'un seul caractère ou le premier caractère d'une chaîne. La valeur ASCII renvoyée sera affichée sous forme entière lors de la conversion. syntaxe "ord (string)", le paramètre "string" ne peut être omis, c'est la chaîne (ou le caractère unique) à partir de laquelle la valeur ASCII doit être obtenue.

Comment remplacer un certain caractère pour qu'il soit vide dans une chaîne php Comment remplacer un certain caractère pour qu'il soit vide dans une chaîne php Mar 06, 2023 pm 06:39 PM

Il existe deux manières de remplacer un certain caractère par un caractère nul dans une chaîne PHP : 1. Utilisez la fonction str_replace() pour remplacer le caractère spécifié par un caractère nul. Il vous suffit de définir le premier paramètre sur le caractère spécifié et le. deuxième paramètre à un caractère nul. Syntaxe "str_replace("caractère spécifié","", $str)"; 2. Utilisez la fonction preg_replace() avec des expressions régulières pour faire correspondre le caractère spécifié et remplacez-le par le caractère nul, syntaxe " preg_replace('/caractère spécifié/', "",$str)".

Comment supprimer toutes les lettres majuscules d'une chaîne en php Comment supprimer toutes les lettres majuscules d'une chaîne en php Sep 26, 2022 pm 07:59 PM

Deux méthodes de suppression : 1. Utilisez preg_replace() pour exécuter une expression régulière pour rechercher toutes les lettres majuscules et les remplacer par des caractères nuls. La syntaxe est "preg_replace('/[A-Z]/','',$str)". 2. Utilisez preg_filter() pour exécuter une expression régulière pour rechercher toutes les lettres majuscules et les remplacer par des caractères vides. La syntaxe est "preg_filter('/[A-Z]/','',$str)".

Comment supprimer les caractères gauche et droit d'une chaîne en php Comment supprimer les caractères gauche et droit d'une chaîne en php Mar 27, 2023 pm 03:29 PM

PHP est un langage de programmation typé souvent utilisé pour développer des applications Web. Lors du développement Web, vous devrez peut-être effectuer diverses opérations sur les chaînes, telles que supprimer des caractères spécifiques d'une chaîne, conserver des chiffres ou des lettres dans une chaîne, etc. Dans cet article, nous nous concentrerons sur la façon de supprimer des caractères spécifiques sur le côté gauche ou droit d'une chaîne en PHP.

Comment extraire uniquement les caractères chinois d'une chaîne php Comment extraire uniquement les caractères chinois d'une chaîne php Sep 22, 2022 pm 07:44 PM

Deux méthodes : 1. Utilisez preg_match_all() avec des règles régulières pour filtrer les chaînes, la syntaxe est "preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr) ;" ;2. Utilisez preg_replace() avec une recherche régulière de lettres non chinoises dans la chaîne et remplacez-les par des caractères vides. La syntaxe est "preg_replace("/[^\x{4E00}-\x{9FFF}]+ /u" ,'',$str)".

Est-il possible d'ajouter des caractères à une chaîne en php ? Est-il possible d'ajouter des caractères à une chaîne en php ? Aug 19, 2022 pm 07:51 PM

PHP peut ajouter des caractères aux chaînes. Deux méthodes d'implémentation : 1. Utilisez le connecteur de chaîne "." pour relier le caractère spécifié au début ou à la fin de la chaîne. La syntaxe est "caractère spécifié. chaîne" ou "chaîne. caractère spécifié" ; ) insère le caractère spécifié à la position spécifiée dans la chaîne. La syntaxe est "substr_replace(string, selected caractère, position spécifiée, 0)".

Comment supprimer les guillemets doubles d'une chaîne en php Comment supprimer les guillemets doubles d'une chaîne en php Mar 28, 2023 pm 04:54 PM

PHP est un langage de programmation très populaire et l’un des outils privilégiés pour créer des sites Web dynamiques. Dans le développement PHP, nous devons souvent utiliser des chaînes, et une exigence courante est de supprimer les guillemets doubles des chaînes. Dans cet article, nous présenterons quelques méthodes pour supprimer les guillemets doubles des chaînes PHP.

Comment trier les chaînes en php Comment trier les chaînes en php Sep 08, 2022 pm 08:02 PM

Étapes d'implémentation : 1. Utilisez la fonction str_split() pour convertir la chaîne en un tableau de caractères, la syntaxe est "str_split(string)" 2. Utilisez la fonction asort() ou arsort() pour trier le tableau de caractères par ordre croissant ou croissant ; par ordre décroissant, la syntaxe « asort (tableau de caractères) » ou « arsort (tableau de caractères) » ; 3. Utilisez la fonction implode() pour reconvertir le tableau de caractères trié en chaîne, la syntaxe est « implode (tableau de caractères triés) » ; ".

See all articles