php字符串编码转换 iconv与mb_convert_encoding的区别
PHP判断字符串编码函数mb_detect_encoding总结
iconv — Convert string to requested character encoding(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding(PHP 4 >= 4.0.6, PHP 5)
iconv — 字符串按要求的字符编码来转换
mb_convert_encoding — 转换字符的编码
这两个函数功能类似都是用来转换字符串编码的;
用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
注:需要先启用 mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
参数:str——要编码的str、to_encoding——str要转换成编码类型、from_encoding——在转换前通过字符代码名称来指定。 它可以是一个 array 也可以是逗号分隔的枚举列表。 如果没有提供 from_encoding,则会使用内部(internal)编码。 参见支持的编码。
支持的字符编码
当前 mbstring 模块支持以下的字符编码。这些字符编码中的任意一个都能指定到 mbstring 函数中的 encoding 参数。
该 PHP 扩展支持的字符编码有以下几种:
UCS-4*
UCS-4BE
UCS-4LE*
UCS-2
UCS-2BE
UCS-2LE
UTF-32*
UTF-32BE*
UTF-32LE*
UTF-16*
UTF-16BE*
UTF-16LE*
UTF-7
UTF7-IMAP
UTF-8*
ASCII*
EUC-JP*
SJIS*
eucJP-win*
SJIS-win*
ISO-2022-JP
ISO-2022-JP-MS
CP932
CP51932
SJIS-mac** (别名: MacJapanese)
SJIS-Mobile#DOCOMO** (别名: SJIS-DOCOMO)
SJIS-Mobile#KDDI** (别名: SJIS-KDDI)
SJIS-Mobile#SOFTBANK** (别名: SJIS-SOFTBANK)
UTF-8-Mobile#DOCOMO** (别名: UTF-8-DOCOMO)
UTF-8-Mobile#KDDI-A**
UTF-8-Mobile#KDDI-B** (别名: UTF-8-KDDI)
UTF-8-Mobile#SOFTBANK** (别名: UTF-8-SOFTBANK)
ISO-2022-JP-MOBILE#KDDI** (别名: ISO-2022-JP-KDDI)
JIS
JIS-ms
CP50220
CP50220raw
CP50221
CP50222
ISO-8859-1*
ISO-8859-2*
ISO-8859-3*
ISO-8859-4*
ISO-8859-5*
ISO-8859-6*
ISO-8859-7*
ISO-8859-8*
ISO-8859-9*
ISO-8859-10*
ISO-8859-13*
ISO-8859-14*
ISO-8859-15*
byte2be
byte2le
byte4be
byte4le
BASE64
HTML-ENTITIES
7bit
8bit
EUC-CN*
CP936
GB18030**
HZ
EUC-TW*
CP950
BIG-5*
EUC-KR*
UHC (CP949)
ISO-2022-KR
Windows-1251 (CP1251)
Windows-1252 (CP1252)
CP866 (IBM866)
KOI8-R*
* 表示该编码也可以在正则表达式中使用。
** 表示该编码自 PHP 5.4.0 始可用。
任何接受编码名称的 php.ini 条目同样也可以使用 "auto" 和 "pass" 的值。 接受编码名的 mbstring 函数同样也可以使用值 "auto"。
如果设置了 "pass",将不会对字符的编码进行转化。
如果设置了 "auto",它将扩展成 NLS 中定义的每个字符编码列表。 比如,假设 NLS 设置为 Japanese,值将会认为是 "ASCII,JIS,UTF-8,EUC-JP,SJIS"。
NLS:国家语言支持(National Language Support)
string iconv ( string in_charset, string out_charset, string str )
注意:
第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,
其中:
//TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,
//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure. (返回转换后的字符串;如果执行失败将返回FALSE。)
使用:
1. 发现iconv在转换字符 "-" 到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个 "-" 都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug。
2. mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别, 但是执行效率比iconv差太多;如:
$str = mb_convert_encoding($str,"euc-jp","ASCII,JIS,EUC-JP,SJIS,UTF-8");“ASCII,JIS,EUC-JP,SJIS,UTF-8”的顺序不同效果也有差异 。
3. 一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数 。
from_encoding is specified by character code name before conversion. it can be array or string - comma separated
enumerated list. If it is not specified, the internal encoding will be used.
$str = mb_convert_encoding($str, "UCS-2LE", "JIS, eucjp-win, sjis-win");
$str = mb_convert_encoding($str, "EUC-JP', " auto");
例子:
$content = iconv("GBK", "UTF-8", $content);
$content = mb_convert_encoding($content, "UTF-8", "GBK");
/* 转换内部编码为 SJIS */ $str = mb_convert_encoding($str, "SJIS"); /* 将 EUC-JP 转换成 UTF-7 */ $str = mb_convert_encoding($str, "UTF-7", "EUC-JP"); /* 从 JIS, eucjp-win, sjis-win 中自动检测编码,并转换 str 到 UCS-2LE */ $str = mb_convert_encoding($str, "UCS-2LE", "JIS, eucjp-win, sjis-win"); /* "auto" 扩展成 "ASCII,JIS,UTF-8,EUC-JP,SJIS" */ $str = mb_convert_encoding($str, "EUC-JP", "auto");
$text = "This is the Euro symbol '€'."; echo 'Original : ', $text, PHP_EOL; echo 'TRANSLIT : ', iconv("UTF-8", "ISO-8859-1//TRANSLIT", $text), PHP_EOL; echo 'IGNORE : ', iconv("UTF-8", "ISO-8859-1//IGNORE", $text), PHP_EOL; echo 'Plain : ', iconv("UTF-8", "ISO-8859-1", $text), PHP_EOL; 输出结果: Original : This is the Euro symbol '€'. TRANSLIT : This is the Euro symbol 'EUR'. IGNORE : This is the Euro symbol ''. Plain : Notice: iconv(): Detected an illegal character in input string in .\iconv-example.php on line 7 This is the Euro symbol '

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











PHP에서는 ord() 함수를 사용하여 문자를 ASCII 코드로 변환할 수 있습니다. 이 함수는 단일 문자 또는 문자열의 첫 번째 문자의 ASCII 값을 반환할 수 있으며 변환 결과는 정수 형식으로 표시됩니다. 구문 "ord(문자열)", 매개변수 "string"은 생략할 수 없으며 ASCII 값을 가져올 문자열(또는 단일 문자)입니다.

PHP 문자열에서 특정 문자를 널 문자로 바꾸는 방법에는 두 가지가 있습니다. 1. str_replace() 함수를 사용하여 지정된 문자를 널 문자로 바꾸려면 첫 번째 매개변수만 지정된 문자로 설정하면 됩니다. 두 번째 매개변수를 null 문자로 설정합니다. 구문 "str_replace("specified Character","", $str)" 2. 정규식과 함께 preg_replace() 함수를 사용하여 지정된 문자를 일치시키고 이를 null 문자로 바꿉니다. 구문 " preg_replace('/지정된 문자/', "",$str)".

두 가지 제거 방법: 1. preg_replace()를 사용하여 정규식을 실행하여 모든 대문자를 검색하고 이를 null 문자로 바꿉니다. 구문은 "preg_replace('/[A-Z]/','',$str)"입니다. 2. preg_filter()를 사용하여 정규식을 실행하여 모든 대문자를 검색하고 이를 빈 문자로 바꿉니다. 구문은 "preg_filter('/[A-Z]/','',$str)"입니다.

PHP는 웹 애플리케이션을 개발하는 데 자주 사용되는 형식화된 프로그래밍 언어입니다. 웹 개발 중에 문자열에서 특정 문자를 제거하거나 문자열에 숫자나 문자를 유지하는 등 문자열에 대한 다양한 작업을 수행해야 할 수 있습니다. 이 기사에서는 PHP에서 문자열의 왼쪽이나 오른쪽에 있는 특정 문자를 제거하는 방법에 중점을 둘 것입니다.

두 가지 방법: 1. 일반 필터 문자열과 함께 preg_match_all()을 사용합니다. 구문은 "preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr);"입니다. ;2. 문자열에서 중국어가 아닌 문자를 정기적으로 검색하여 preg_replace()를 사용하고 이를 빈 문자로 바꿉니다. 구문은 "preg_replace("/[^\x{4E00}-\x{9FFF}]+/u입니다. ",'',$str)".

PHP는 문자열에 문자를 추가할 수 있습니다. 두 가지 구현 방법: 1. 문자열 커넥터 "."를 사용하여 지정된 문자를 문자열의 시작 또는 끝에 연결합니다. 구문은 "지정된 문자. 문자열" 또는 "문자열. 지정된 문자"입니다. ) 함수는 문자열의 지정된 위치에 지정된 문자를 삽입합니다. 구문은 "substr_replace(string, 지정된 문자, 지정된 위치, 0)"입니다. 지정된 위치의 값은 0, 음수 또는 양수일 수 있습니다.

PHP는 매우 인기 있는 프로그래밍 언어이며 동적 웹 사이트를 구축하는 데 선호되는 도구 중 하나입니다. PHP 개발에서는 종종 문자열을 조작해야 하는 경우가 있는데, 일반적인 요구 사항 중 하나는 문자열에서 큰따옴표를 제거하는 것입니다. 이 기사에서는 PHP 문자열에서 큰따옴표를 제거하는 몇 가지 방법을 소개합니다.

구현 단계: 1. str_split() 함수를 사용하여 문자열을 문자 배열로 변환합니다. 구문은 "str_split(string)"입니다. 2. asort() 또는 arsort() 함수를 사용하여 문자 배열을 오름차순 또는 오름차순으로 정렬합니다. 내림차순, 구문 "asort(문자 배열)" 또는 "arsort(문자 배열)" 3. implode() 함수를 사용하여 정렬된 문자 배열을 다시 문자열로 변환합니다. 구문은 "implode(정렬된 문자 배열)"입니다. ".
