目錄
string iconv ( string in_charset, string out_charset, string str ) 
首頁 後端開發 php教程 php字符串编码转换 iconv与mb_convert_encoding的区别

php字符串编码转换 iconv与mb_convert_encoding的区别

Jun 20, 2016 pm 01:02 PM
php字串

​PHP判断字符串编码函数mb_detect_encoding总结

iconv — Convert string to requested character encoding(PHP 4 >= 4.0.5, PHP 5)

mb_convert_encoding — Convert character encoding(PHP 4 >= 4.0.6, PHP 5)
 

iconv — 字符串按要求的字符编码来转换
mb_convert_encoding — 转换字符的编码

这两个函数功能类似都是用来转换字符串编码的;

用法:

string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] ) 


注:需要先启用 mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉

 

参数:str——要编码的str、to_encoding——str要转换成编码类型、from_encoding——在转换前通过字符代码名称来指定。 它可以是一个 array 也可以是逗号分隔的枚举列表。 如果没有提供 from_encoding,则会使用内部(internal)编码。 参见支持的编码。

 

支持的字符编码

当前 mbstring 模块支持以下的字符编码。这些字符编码中的任意一个都能指定到 mbstring 函数中的 encoding 参数。

该 PHP 扩展支持的字符编码有以下几种:

    UCS-4*
    UCS-4BE
    UCS-4LE*
    UCS-2
    UCS-2BE
    UCS-2LE
    UTF-32*
    UTF-32BE*
    UTF-32LE*
    UTF-16*
    UTF-16BE*
    UTF-16LE*
    UTF-7
    UTF7-IMAP
    UTF-8*
    ASCII*
    EUC-JP*
    SJIS*
    eucJP-win*
    SJIS-win*
    ISO-2022-JP
    ISO-2022-JP-MS
    CP932
    CP51932
    SJIS-mac** (别名: MacJapanese)
    SJIS-Mobile#DOCOMO** (别名: SJIS-DOCOMO)
    SJIS-Mobile#KDDI** (别名: SJIS-KDDI)
    SJIS-Mobile#SOFTBANK** (别名: SJIS-SOFTBANK)
    UTF-8-Mobile#DOCOMO** (别名: UTF-8-DOCOMO)
    UTF-8-Mobile#KDDI-A**
    UTF-8-Mobile#KDDI-B** (别名: UTF-8-KDDI)
    UTF-8-Mobile#SOFTBANK** (别名: UTF-8-SOFTBANK)
    ISO-2022-JP-MOBILE#KDDI** (别名: ISO-2022-JP-KDDI)
    JIS
    JIS-ms
    CP50220
    CP50220raw
    CP50221
    CP50222
    ISO-8859-1*
    ISO-8859-2*
    ISO-8859-3*
    ISO-8859-4*
    ISO-8859-5*
    ISO-8859-6*
    ISO-8859-7*
    ISO-8859-8*
    ISO-8859-9*
    ISO-8859-10*
    ISO-8859-13*
    ISO-8859-14*
    ISO-8859-15*
    byte2be
    byte2le
    byte4be
    byte4le
    BASE64
    HTML-ENTITIES
    7bit
    8bit
    EUC-CN*
    CP936
    GB18030**
    HZ
    EUC-TW*
    CP950
    BIG-5*
    EUC-KR*
    UHC (CP949)
    ISO-2022-KR
    Windows-1251 (CP1251)
    Windows-1252 (CP1252)
    CP866 (IBM866)
    KOI8-R*

* 表示该编码也可以在正则表达式中使用。

** 表示该编码自 PHP 5.4.0 始可用。

任何接受编码名称的 php.ini 条目同样也可以使用 "auto" 和 "pass" 的值。 接受编码名的 mbstring 函数同样也可以使用值 "auto"。

如果设置了 "pass",将不会对字符的编码进行转化。

如果设置了 "auto",它将扩展成 NLS 中定义的每个字符编码列表。 比如,假设 NLS 设置为 Japanese,值将会认为是 "ASCII,JIS,UTF-8,EUC-JP,SJIS"。

NLS:国家语言支持(National Language Support)

string iconv ( string in_charset, string out_charset, string str ) 

注意:
第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,
其中:
//TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,
//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure. (返回转换后的字符串;如果执行失败将返回FALSE。)

使用:

1. 发现iconv在转换字符 "-" 到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个 "-" 都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug。

2. mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别, 但是执行效率比iconv差太多;如:
$str = mb_convert_encoding($str,"euc-jp","ASCII,JIS,EUC-JP,SJIS,UTF-8");“ASCII,JIS,EUC-JP,SJIS,UTF-8”的顺序不同效果也有差异 。

3. 一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数 。

from_encoding is specified by character code name before conversion. it can be array or string - comma separated
enumerated list. If it is not specified, the internal encoding will be used.

$str = mb_convert_encoding($str, "UCS-2LE", "JIS, eucjp-win, sjis-win");
$str = mb_convert_encoding($str, "EUC-JP', " auto");

例子:

$content = iconv("GBK", "UTF-8", $content);
$content = mb_convert_encoding($content, "UTF-8", "GBK");

 

 

/* 转换内部编码为 SJIS */
$str = mb_convert_encoding($str, "SJIS");

/* 将 EUC-JP 转换成 UTF-7 */
$str = mb_convert_encoding($str, "UTF-7", "EUC-JP");

/* 从 JIS, eucjp-win, sjis-win 中自动检测编码,并转换 str 到 UCS-2LE */
$str = mb_convert_encoding($str, "UCS-2LE", "JIS, eucjp-win, sjis-win");

/* "auto" 扩展成 "ASCII,JIS,UTF-8,EUC-JP,SJIS" */
$str = mb_convert_encoding($str, "EUC-JP", "auto");

登入後複製

$text = "This is the Euro symbol '€'.";

echo 'Original : ', $text, PHP_EOL;
echo 'TRANSLIT : ', iconv("UTF-8", "ISO-8859-1//TRANSLIT", $text), PHP_EOL;
echo 'IGNORE   : ', iconv("UTF-8", "ISO-8859-1//IGNORE", $text), PHP_EOL;
echo 'Plain    : ', iconv("UTF-8", "ISO-8859-1", $text), PHP_EOL;



输出结果: 
Original : This is the Euro symbol '€'.
TRANSLIT : This is the Euro symbol 'EUR'.
IGNORE   : This is the Euro symbol ''.
Plain    :
Notice: iconv(): Detected an illegal character in input string in .\iconv-example.php on line 7
This is the Euro symbol '    
 
登入後複製


本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

php怎麼將字元轉ascii碼 php怎麼將字元轉ascii碼 Mar 03, 2023 pm 06:55 PM

在php中,可以使用ord()函數將字元轉成ascii碼,該函數可以傳回單一字元或字串中第一個字元的ASCII值,傳回的ASCII值會以整數形式顯示;轉換語法「ord (string)”,參數“string”不可省略,是要從中獲得ASCII值的字串(或單一字元)。

php字串怎麼替換某個字元為空 php字串怎麼替換某個字元為空 Mar 06, 2023 pm 06:39 PM

php字串取代某個字元為空的兩種方法:1、使用str_replace()函數將指定字元替換為空字符,只需要將第一個參數設定為指定字符,第二個參數設定為空字符,語法「str_replace("指定字元","", $str)」;2、用preg_replace()函數配合正規表示式來匹配指定字元並將其替換空字符,語法「preg_replace('/指定字元/', "",$str)」。

php怎麼去除字串中的所有大寫字母 php怎麼去除字串中的所有大寫字母 Sep 26, 2022 pm 07:59 PM

兩種去除方法:1、利用preg_replace()執行正規表示式搜尋所有大寫字母並將其替換為空字元即可,語法「preg_replace('/[A-Z]/','',$str)」。 2.利用preg_filter()執行正規表示式搜尋所有大寫字母並將其替換為空字元即可,語法「preg_filter('/[A-Z]/','',$str)」。

php怎麼去除字串中左右字符 php怎麼去除字串中左右字符 Mar 27, 2023 pm 03:29 PM

PHP是一種強制型別類型程式語言,常被用來開發Web應用程式。在網路開發過程中,您可能需要對字串執行各種操作,例如從字串中刪除特定字符,保留字串中的數字或字母等。在本文中,我們將重點放在PHP中如何刪除字串左側或右側的特定字元。

php字串怎麼只提取中文字符 php字串怎麼只提取中文字符 Sep 22, 2022 pm 07:44 PM

兩種方法:1、用preg_match_all()配合正規過濾字串,語法“preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr);” ;2、用preg_replace()配合正規搜尋字串中的非中文字母,並將其替換成空字符,語法「preg_replace("/[^\x{4E00}-\x{9FFF}]+/u" ,'',$str)」。

php給字串添加字元可以嗎 php給字串添加字元可以嗎 Aug 19, 2022 pm 07:51 PM

php可以為字串添加字元。兩種實作方法:1、使用字串連接符號「.」將指定字元拼接到字串的開頭或結尾即可,語法「指定字元. 字串」或「字串. 指定字元」;2、使用substr_replace ()函數在字串的指定位置插入指定字元即可,語法“substr_replace(字串,指定字元,指定位置,0)”,指定位置的值可以是0、負值和正值。

php怎麼去除字串中的雙引號 php怎麼去除字串中的雙引號 Mar 28, 2023 pm 04:54 PM

PHP是一種非常受歡迎的程式語言,也是建立動態網站的首選工具之一。在PHP開發中,我們經常需要操作字串,其中一個常見的需求是去除字串中的雙引號。在這篇文章中,我們將介紹一些方法來移除PHP字串中的雙引號。

php怎麼實現對字串的排序 php怎麼實現對字串的排序 Sep 08, 2022 pm 08:02 PM

實作步驟:1、利用str_split()函數將字串轉為字元數組,語法「str_split(字串)」;2、使用asort()或arsort()函數來對字元數組進行升序排序或降序排序,語法「asort(字元陣列)」或「arsort(字元陣列)」;3、使用implode()函數將排序後的字元陣列轉回字串,語法「implode(排序後字元陣列)」。

See all articles