首页 php教程 PHP开发 php 编码转换-字符编码转换

php 编码转换-字符编码转换

Dec 15, 2016 am 11:16 AM

提供一款大这在与flash效果时一个问题编码问题哦,下面我们提供N种php 编码转换和字符编码转换功能哦,好了费话不说多了喜欢就看看吧。

面的两段VB代码分别针对UTF-8(UTF8ENCODEURI)和GB2312(GBKENCODEURI)进行了编码的转换。

    PRIVATE SUB COMMAND1_CLICK()
        DEBUG.PRINT (UTF8ENCODEURI("汉字"))
        DEBUG.PRINT (GBKENCODEURI("汉字"))
    END SUB


    FUNCTION UTF8ENCODEURI(SZINPUT)
        DIM WCH, UCH, SZRET
        DIM X
        DIM NASC, NASC2, NASC3

        IF SZINPUT = "" THEN
            UTF8ENCODEURI = SZINPUT
            EXIT FUNCTION
        END IF

        FOR X = 1 TO LEN(SZINPUT)
            WCH = MID(SZINPUT, X, 1)
            NASC = ASCW(WCH)

            IF NASC < 0 THEN NASC = NASC + 65536

IF (NASC AND &HFF80) = 0 THEN
SZRET = SZRET & WCH
ELSE
IF (NASC AND &HF000) = 0 THEN
UCH = "%" & HEX(((NASC 2 ^ 6)) OR &HC0) & HEX(NASC AND &H3F OR &H80)
SZRET = SZRET & UCH
ELSE
UCH = "%" & HEX((NASC 2 ^ 12) OR &HE0) & "%" & _
HEX((NASC 2 ^ 6) AND &H3F OR &H80) & "%" & _
HEX(NASC AND &H3F OR &H80)
SZRET = SZRET & UCH
END IF
END IF
NEXT


iconv() 函数
Definition and Usage
定义和用法
iconv()函数的作用是:转换字符串的编码。

Description
string iconv ( string in_charset, string out_charset, string str )

Tips and Notes
注意点
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。

mb_convert_encoding() 函数
Definition and Usage
定义和用法
mb_convert_encoding()函数的作用是:转换字符串的编码。

Description
string mb_convert_encoding ( string str, string to-encoding [, mixed from-encoding])

注意:但是需要先enable mbstring 扩展库。
两者区别:mb_convert_encoding 中根据内容自动识别编码;mb_convert_encoding功能强大,但是执行效率比iconv差太多;

总结:一般情况下用 iconv,只有当遇到无法确定原编码是何种编码时才用 mb_convert_encoding 函数.

1、把 GBK 编码字串转换成 UTF-8 编码字串 view plaincopy to clipboardprint?
header("content-Type: text/html; charset=Utf-8");
echo mb_convert_encoding("你是我的好朋友", "UTF-8", "GBK");
?> 


2、把 UTF-8 编码字串转换成 GB2312 编码字串 view plaincopy to clipboardprint?
// 注意将此文件存盘成   utf-8 编码格式文件再测试   
header("content-Type: text/html; charset=gb2312");
echo mb_convert_encoding("你是我的好朋友", "gb312", "utf-8");
?>  


信源:fleaphp.net
mb_convert_encoding 函数为php内部多字节字符串编码转换函数,可以在有需要的使用场合(如:解决在GB2312编码环境下使用Ajax产生的中文字乱码的问题)方便进行编码转换,以解决网页乱码的问题,使用非常方便,效率非常高,
几乎支持所有编码。PHP 4 >= 4.0.6、PHP 5 版本支持。

函数原型: 引用:
/**
* 多字节字符串编码转换函数
*
* @param string str 需要进行编码转换的字符串
* @param string to_encoding 指定转换为某种编码,如:gb2312、gbk、utf-8等
* @param mixed from_encoding 混合指定原来字串的编码,如:同时指定 JIS, eucjp-win, sjis-win 混合编码
* @return string
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )使用举例:

1、把 GBK 编码字串转换成 UTF-8 编码字串 view plaincopy to clipboardprint?
header("content-Type: text/html; charset=Utf-8");
echo mb_convert_encoding("你是我的好朋友", "UTF-8", "GBK");
?> 


2、把 UTF-8 编码字串转换成 GB2312 编码字串 view plaincopy to clipboardprint?
// 注意将此文件存盘成   utf-8 编码格式文件再测试   
header("content-Type: text/html; charset=gb2312");
echo mb_convert_encoding("你是我的好朋友", "gb312", "utf-8");
?>  

// 注意将此文件存盘成   utf-8 编码格式文件再测试
3、对整个页面进行转换
该方法适用所有编码环境。这样把前128个字符以外(显示字符)的字符集都用   NCR(Numeric character reference,如“汉字”将转换成“汉字”这种形式)来表示,这样的编码在任意编码环境下页面都能正 常显示。

在php文件的头部加上下面三行代码: view plaincopy to clipboardprint?
mb_internal_encoding("gb2312");  // 这里的gb2312是你网站原来的编码   
mb_http_output("HTML-ENTITIES");   
ob_start('mb_output_handler'); 

mb_internal_encoding("gb2312");   // 这里的gb2312是你网站原来的编码 mb_http_output("HTML-ENTITIES"); ob_start('mb_output_handler');
使用mb_convert_encoding 函数需启用PHP 的mbstring (multi-byte string)扩展。

查看php的信息页面,如果出现如下画面:
   2008-10-16_111050.png (137.62 KB)
2008-10-16 12:01

则说明已启用mbstring (multi-byte string)扩展支持。

如果没有出现上面的画面,则需要做如下设置,让php支持该扩展。

1、windows 服务器环境

编辑 php.ini 文件,将; extension=php_mbstring.dll 前面的 ; 去掉,重启网页服务器。

2、Linux服务器环境

在编译配置时加入 --enable-mbstring=cn 编译参数,再进行PHP的编译安装。

以上就是php 编码转换-字符编码转换的内容,更多相关文章请关注PHP中文网(www.php.cn)!


本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

如何在电脑上输入下划线 如何在电脑上输入下划线 Feb 19, 2024 pm 08:36 PM

电脑下划线怎么打在电脑输入文字时,我们经常需要使用下划线来突出某些内容或进行标记。然而,对于一些不太熟悉电脑输入法的人来说,打出下划线可能会有些困惑。本文就将向大家介绍如何在电脑上打出下划线。在不同的电脑操作系统和软件中,输入下划线的方式可能会稍有不同。下面将分别介绍Windows操作系统和Mac操作系统上的常用方法。首先,我们先来看一下在Windows操作

如何解决tomcat日志中的乱码问题? 如何解决tomcat日志中的乱码问题? Dec 28, 2023 pm 01:50 PM

解决tomcat日志乱码问题的方法有哪些?Tomcat是一个流行的开源JavaServlet容器,广泛用于支持JavaWeb应用程序的部署和运行。然而,有时候在使用Tomcat记录日志时会出现乱码问题,这给开发人员带来了不少困扰。本文将介绍几种解决Tomcat日志乱码问题的方法。调整Tomcat的字符编码设置Tomcat默认使用ISO-8859-1字符编

有效的解决eclipse编辑器中乱码问题的方法 有效的解决eclipse编辑器中乱码问题的方法 Jan 04, 2024 pm 06:56 PM

解决eclipse乱码问题的有效方法,需要具体代码示例近年来,随着软件开发的飞速发展,eclipse作为最受欢迎的集成开发环境之一,为众多开发者提供了便利和高效。然而,使用eclipse时可能会遇到乱码问题,这对于项目开发和代码阅读带来了困扰。本文将介绍一些解决eclipse乱码问题的有效方法,并提供具体代码示例。修改eclipse文件编码设置:在eclip

如何处理Java开发中的字符编码转换异常 如何处理Java开发中的字符编码转换异常 Jul 01, 2023 pm 05:10 PM

如何处理Java开发中的字符编码转换异常在Java开发中,字符编码转换是一个常见的问题。当我们在处理文件、网络传输、数据库等操作时,不同的系统或者平台可能会使用不同的字符编码方式,导致字符的解析和转换出现异常。本文将介绍一些常见的字符编码转换异常的原因和解决方案。一、字符编码的基本概念字符编码是用来将字符转换为二进制数据的规则和方法,常见的字符编码方式有AS

解决Go语言字符编码问题的方法 解决Go语言字符编码问题的方法 Jun 30, 2023 am 09:21 AM

解决Go语言开发中的字符编码问题的方法在Go语言开发过程中,经常会遇到字符编码的问题。特别是在处理数据输入、输出、存储和传输时,正确处理字符编码是非常重要的。本文将介绍一些解决Go语言开发中字符编码问题的方法。首先,在处理字符编码问题之前,我们需要了解Go语言的字符编码标准。Go语言使用的是Unicode字符编码标准,这是一种全球通用的字符编码标准,支持几乎

PHP中文字符编码处理技巧分享 PHP中文字符编码处理技巧分享 Mar 20, 2024 pm 05:12 PM

PHP中文字符编码处理技巧分享在Web开发中,特别是涉及到中文字符处理的时候,字符编码往往是一个常见的问题。正确处理中文字符编码可以避免出现乱码等问题,提高网站的用户体验。在PHP中,我们可以通过一些技巧来处理中文字符编码,下面将分享一些实用的处理方法和代码示例。1.设置PHP文件编码首先要确保PHP文件本身的编码是正确的,一般推荐使用UTF-8编码。在P

如何正确处理中文编码:Go语言实践指南 如何正确处理中文编码:Go语言实践指南 Mar 28, 2024 pm 12:48 PM

如何正确处理中文编码:Go语言实践指南随着互联网和计算机技术的飞速发展,中文编码也成为了不可忽视的问题。作为一种强大的编程语言,Go语言在处理中文编码方面具有一定的便利性和灵活性。正确处理中文编码对于开发者来说至关重要,今天我们就来探讨一下如何在Go语言中正确处理中文编码,同时给出一些具体的代码示例。使用UTF-8编码在处理中文编码时,Go语言推荐使用UTF

在计算机中应用最普遍的字符编码是什么 在计算机中应用最普遍的字符编码是什么 Apr 23, 2020 pm 04:52 PM

在计算机中应用最普遍的字符编码是ASCII码。ASCII是基于拉丁字母的一套电脑编码系统,是最通用的信息交换标准,并等同于国际标准ISO/IEC646。

See all articles