목차
string iconv ( string in_charset, string out_charset, string str ) 
백엔드 개발 PHP 튜토리얼 php字符串编码转换 iconv与mb_convert_encoding的区别

php字符串编码转换 iconv与mb_convert_encoding的区别

Jun 20, 2016 pm 01:02 PM
PHP 문자열

​PHP判断字符串编码函数mb_detect_encoding总结

iconv — Convert string to requested character encoding(PHP 4 >= 4.0.5, PHP 5)

mb_convert_encoding — Convert character encoding(PHP 4 >= 4.0.6, PHP 5)
 

iconv — 字符串按要求的字符编码来转换
mb_convert_encoding — 转换字符的编码

这两个函数功能类似都是用来转换字符串编码的;

用法:

string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] ) 


注:需要先启用 mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉

 

参数:str——要编码的str、to_encoding——str要转换成编码类型、from_encoding——在转换前通过字符代码名称来指定。 它可以是一个 array 也可以是逗号分隔的枚举列表。 如果没有提供 from_encoding,则会使用内部(internal)编码。 参见支持的编码。

 

支持的字符编码

当前 mbstring 模块支持以下的字符编码。这些字符编码中的任意一个都能指定到 mbstring 函数中的 encoding 参数。

该 PHP 扩展支持的字符编码有以下几种:

    UCS-4*
    UCS-4BE
    UCS-4LE*
    UCS-2
    UCS-2BE
    UCS-2LE
    UTF-32*
    UTF-32BE*
    UTF-32LE*
    UTF-16*
    UTF-16BE*
    UTF-16LE*
    UTF-7
    UTF7-IMAP
    UTF-8*
    ASCII*
    EUC-JP*
    SJIS*
    eucJP-win*
    SJIS-win*
    ISO-2022-JP
    ISO-2022-JP-MS
    CP932
    CP51932
    SJIS-mac** (别名: MacJapanese)
    SJIS-Mobile#DOCOMO** (别名: SJIS-DOCOMO)
    SJIS-Mobile#KDDI** (别名: SJIS-KDDI)
    SJIS-Mobile#SOFTBANK** (别名: SJIS-SOFTBANK)
    UTF-8-Mobile#DOCOMO** (别名: UTF-8-DOCOMO)
    UTF-8-Mobile#KDDI-A**
    UTF-8-Mobile#KDDI-B** (别名: UTF-8-KDDI)
    UTF-8-Mobile#SOFTBANK** (别名: UTF-8-SOFTBANK)
    ISO-2022-JP-MOBILE#KDDI** (别名: ISO-2022-JP-KDDI)
    JIS
    JIS-ms
    CP50220
    CP50220raw
    CP50221
    CP50222
    ISO-8859-1*
    ISO-8859-2*
    ISO-8859-3*
    ISO-8859-4*
    ISO-8859-5*
    ISO-8859-6*
    ISO-8859-7*
    ISO-8859-8*
    ISO-8859-9*
    ISO-8859-10*
    ISO-8859-13*
    ISO-8859-14*
    ISO-8859-15*
    byte2be
    byte2le
    byte4be
    byte4le
    BASE64
    HTML-ENTITIES
    7bit
    8bit
    EUC-CN*
    CP936
    GB18030**
    HZ
    EUC-TW*
    CP950
    BIG-5*
    EUC-KR*
    UHC (CP949)
    ISO-2022-KR
    Windows-1251 (CP1251)
    Windows-1252 (CP1252)
    CP866 (IBM866)
    KOI8-R*

* 表示该编码也可以在正则表达式中使用。

** 表示该编码自 PHP 5.4.0 始可用。

任何接受编码名称的 php.ini 条目同样也可以使用 "auto" 和 "pass" 的值。 接受编码名的 mbstring 函数同样也可以使用值 "auto"。

如果设置了 "pass",将不会对字符的编码进行转化。

如果设置了 "auto",它将扩展成 NLS 中定义的每个字符编码列表。 比如,假设 NLS 设置为 Japanese,值将会认为是 "ASCII,JIS,UTF-8,EUC-JP,SJIS"。

NLS:国家语言支持(National Language Support)

string iconv ( string in_charset, string out_charset, string str ) 

注意:
第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,
其中:
//TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,
//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure. (返回转换后的字符串;如果执行失败将返回FALSE。)

使用:

1. 发现iconv在转换字符 "-" 到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个 "-" 都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug。

2. mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别, 但是执行效率比iconv差太多;如:
$str = mb_convert_encoding($str,"euc-jp","ASCII,JIS,EUC-JP,SJIS,UTF-8");“ASCII,JIS,EUC-JP,SJIS,UTF-8”的顺序不同效果也有差异 。

3. 一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数 。

from_encoding is specified by character code name before conversion. it can be array or string - comma separated
enumerated list. If it is not specified, the internal encoding will be used.

$str = mb_convert_encoding($str, "UCS-2LE", "JIS, eucjp-win, sjis-win");
$str = mb_convert_encoding($str, "EUC-JP', " auto");

例子:

$content = iconv("GBK", "UTF-8", $content);
$content = mb_convert_encoding($content, "UTF-8", "GBK");

 

 

/* 转换内部编码为 SJIS */
$str = mb_convert_encoding($str, "SJIS");

/* 将 EUC-JP 转换成 UTF-7 */
$str = mb_convert_encoding($str, "UTF-7", "EUC-JP");

/* 从 JIS, eucjp-win, sjis-win 中自动检测编码,并转换 str 到 UCS-2LE */
$str = mb_convert_encoding($str, "UCS-2LE", "JIS, eucjp-win, sjis-win");

/* "auto" 扩展成 "ASCII,JIS,UTF-8,EUC-JP,SJIS" */
$str = mb_convert_encoding($str, "EUC-JP", "auto");

로그인 후 복사

$text = "This is the Euro symbol '€'.";

echo 'Original : ', $text, PHP_EOL;
echo 'TRANSLIT : ', iconv("UTF-8", "ISO-8859-1//TRANSLIT", $text), PHP_EOL;
echo 'IGNORE   : ', iconv("UTF-8", "ISO-8859-1//IGNORE", $text), PHP_EOL;
echo 'Plain    : ', iconv("UTF-8", "ISO-8859-1", $text), PHP_EOL;



输出结果: 
Original : This is the Euro symbol '€'.
TRANSLIT : This is the Euro symbol 'EUR'.
IGNORE   : This is the Euro symbol ''.
Plain    :
Notice: iconv(): Detected an illegal character in input string in .\iconv-example.php on line 7
This is the Euro symbol '    
 
로그인 후 복사


본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

PHP에서 문자를 ASCII 코드로 변환하는 방법 PHP에서 문자를 ASCII 코드로 변환하는 방법 Mar 03, 2023 pm 06:55 PM

PHP에서는 ord() 함수를 사용하여 문자를 ASCII 코드로 변환할 수 있습니다. 이 함수는 단일 문자 또는 문자열의 첫 번째 문자의 ASCII 값을 반환할 수 있으며 변환 결과는 정수 형식으로 표시됩니다. 구문 "ord(문자열)", 매개변수 "string"은 생략할 수 없으며 ASCII 값을 가져올 문자열(또는 단일 문자)입니다.

PHP 문자열에서 특정 문자를 공백으로 바꾸는 방법 PHP 문자열에서 특정 문자를 공백으로 바꾸는 방법 Mar 06, 2023 pm 06:39 PM

PHP 문자열에서 특정 문자를 널 문자로 바꾸는 방법에는 두 가지가 있습니다. 1. str_replace() 함수를 사용하여 지정된 문자를 널 문자로 바꾸려면 첫 번째 매개변수만 지정된 문자로 설정하면 됩니다. 두 번째 매개변수를 null 문자로 설정합니다. 구문 "str_replace("specified Character","", $str)" 2. 정규식과 함께 preg_replace() 함수를 사용하여 지정된 문자를 일치시키고 이를 null 문자로 바꿉니다. 구문 " preg_replace('/지정된 문자/', "",$str)".

PHP에서 문자열의 모든 대문자를 제거하는 방법 PHP에서 문자열의 모든 대문자를 제거하는 방법 Sep 26, 2022 pm 07:59 PM

두 가지 제거 방법: 1. preg_replace()를 사용하여 정규식을 실행하여 모든 대문자를 검색하고 이를 null 문자로 바꿉니다. 구문은 "preg_replace('/[A-Z]/','',$str)"입니다. 2. preg_filter()를 사용하여 정규식을 실행하여 모든 대문자를 검색하고 이를 빈 문자로 바꿉니다. 구문은 "preg_filter('/[A-Z]/','',$str)"입니다.

PHP 문자열에서 왼쪽 및 오른쪽 문자를 제거하는 방법 PHP 문자열에서 왼쪽 및 오른쪽 문자를 제거하는 방법 Mar 27, 2023 pm 03:29 PM

PHP는 웹 애플리케이션을 개발하는 데 자주 사용되는 형식화된 프로그래밍 언어입니다. 웹 개발 중에 문자열에서 특정 문자를 제거하거나 문자열에 숫자나 문자를 유지하는 등 문자열에 대한 다양한 작업을 수행해야 할 수 있습니다. 이 기사에서는 PHP에서 문자열의 왼쪽이나 오른쪽에 있는 특정 문자를 제거하는 방법에 중점을 둘 것입니다.

PHP 문자열에서 한자만 추출하는 방법 PHP 문자열에서 한자만 추출하는 방법 Sep 22, 2022 pm 07:44 PM

두 가지 방법: 1. 일반 필터 문자열과 함께 preg_match_all()을 사용합니다. 구문은 "preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr);"입니다. ;2. 문자열에서 중국어가 아닌 문자를 정기적으로 검색하여 preg_replace()를 사용하고 이를 빈 문자로 바꿉니다. 구문은 "preg_replace("/[^\x{4E00}-\x{9FFF}]+/u입니다. ",'',$str)".

PHP에서 문자열에 문자를 추가하는 것이 가능합니까? PHP에서 문자열에 문자를 추가하는 것이 가능합니까? Aug 19, 2022 pm 07:51 PM

PHP는 문자열에 문자를 추가할 수 있습니다. 두 가지 구현 방법: 1. 문자열 커넥터 "."를 사용하여 지정된 문자를 문자열의 시작 또는 끝에 연결합니다. 구문은 "지정된 문자. 문자열" 또는 "문자열. 지정된 문자"입니다. ) 함수는 문자열의 지정된 위치에 지정된 문자를 삽입합니다. 구문은 "substr_replace(string, 지정된 문자, 지정된 위치, 0)"입니다. 지정된 위치의 값은 0, 음수 또는 양수일 수 있습니다.

PHP에서 문자열에서 큰따옴표를 제거하는 방법 PHP에서 문자열에서 큰따옴표를 제거하는 방법 Mar 28, 2023 pm 04:54 PM

PHP는 매우 인기 있는 프로그래밍 언어이며 동적 웹 사이트를 구축하는 데 선호되는 도구 중 하나입니다. PHP 개발에서는 종종 문자열을 조작해야 하는 경우가 있는데, 일반적인 요구 사항 중 하나는 문자열에서 큰따옴표를 제거하는 것입니다. 이 기사에서는 PHP 문자열에서 큰따옴표를 제거하는 몇 가지 방법을 소개합니다.

PHP에서 문자열을 정렬하는 방법 PHP에서 문자열을 정렬하는 방법 Sep 08, 2022 pm 08:02 PM

구현 단계: 1. str_split() 함수를 사용하여 문자열을 문자 배열로 변환합니다. 구문은 "str_split(string)"입니다. 2. asort() 또는 arsort() 함수를 사용하여 문자 배열을 오름차순 또는 오름차순으로 정렬합니다. 내림차순, 구문 "asort(문자 배열)" 또는 "arsort(문자 배열)" 3. implode() 함수를 사용하여 정렬된 문자 배열을 다시 문자열로 변환합니다. 구문은 "implode(정렬된 문자 배열)"입니다. ".

See all articles