詳細介紹PHP 與 UTF-8的最佳實踐-php教程-PHP中文網

首頁

後端開發

php教程

詳細介紹PHP 與 UTF-8的最佳實踐

黄舟

Mar 06, 2017 am 09:52 AM

《PHP中的字串、編碼、UTF-8》一文中描述了一些列的基礎知識，比較枯燥，現在來說點有用的——PHP 字串處理的最佳實踐，本文是「PHP、字串、編碼、UTF-8」相關知識的第二部分。先說結論－在 PHP 中的各個面向使用 UTF-8編碼。

# 　　PHP 語言層面是不支援 Unicode字元集的，但可以透過 UTF-8 編碼能處理大部分問題。

　　最佳實踐就是明確知道輸入編碼（不知道就偵測），內部統一轉換為 UTF-8 編碼，輸出編碼也統一是 UTF-8編碼。

　　PHP 層面如何處理 UTF-8

# 　　當操作 Unicode 字元集的時候，請務必安裝 mbstring 擴展，並使用對應的函數來取代原生的字串函數。舉個例子，一個檔案編碼為 UTF-8 的 PHP 程式碼，假如使用 strlen() 函數是錯誤的，請使用 mb_strlen() 函數取代。

　　mbstring 擴充大部分的函數都需要基於一個編碼（內部編碼）來處理，請務必統一使用 UTF-8 編碼，這個大部分可以在 PHP.INI 中配置。

　　從 PHP 5.6 開始，default_charset 配置可以取代 mbstring.http_input，mbstring.http_output 。

　　另外一個重要的配置就是 mbstring.language，這個預設值是 Neutral（UTF-8）。

　　注意文件編碼和 mbstring 擴充的內部編碼不是同一個概念。

　　概括的說來：

# PHP.INI 中涉及到 mbstring 擴充的部分盡量使用 UTF-8。
# 請用 mbstring 擴充函數取代原生字串操作函數。
# 在使用相關函數的時候，請務必了解你操作的字元的編碼是什麼，在使用對應函數的時候，顯示的寫上UTF-8 編碼參數，例如htmlentities() 函數的第三個參數顯示寫上UTF -8。

　　檔案 IO 操作如何處理 UTF-8

# 　　這裡舉個例子，假如你要打開一個文件，但是不知道文件內容是什麼編碼的，那麼如何處理呢？

　　最佳實踐就是，在開啟的時候統一轉換成 UTF-8，修改內容後就再轉回原來的編碼並儲存到檔案。看程式碼把：

if ( mb_internal_encoding()!="UTF-8") {
        mb_internal_encoding("UTF-8");
}

$file = "file.txt"; //一个编码为gbk的中文文件
$str= file_get_contents($file);
//不管来源是什么编码，统一显示的时候转换为 UTF-8
 if (mb_check_encoding($str,"GBK")) 
    $str =  mb_convert_encoding($str,"UTF-8",“GBK”); 

$str ="修改内容";
$str =  mb_convert_encoding($str,$srcbm,"UTF-8"); //原样转回去
file_put_contents($file,$str);

登入後複製

　　Mysql 和 UTF-8 的最佳實踐

# 　　這個相對簡單，首先保證你的 Mysql 都是 UTF-8。然後 Mysql 用戶端連線的時候也保持 UTF-8，具體到 PHP 中，就是 imysql 或者 PDO 擴充連接 Mysql 的時候都設定 UTF-8 作為連線編碼，二邊保持一致，一般就不會遇到問題。

　　有興趣可以看看這篇文章

　　瀏覽器和 UTF-8 的最佳實踐

# 這個也比較簡單，就是你的輸出內容假如是網頁，那麼你的字串處理輸出最總請保持為UTF-8 ；同時PHP.INI 中也明確設定default_charset 為UTF-8；HTML 的Meta Tag 也明確標識為UTF-8。

現在萬事大吉了嗎，並沒有，雖然伺服器和瀏覽器讓用戶使用UTF-8 編碼，但是用戶的行為並沒有約束性，他可能輸入的是其他編碼的字符，或者上傳的文件名是其他編碼的字符，那怎麼辦呢？可以透過 mb_http_input() 和 mb_check_encoding() 函數來偵測使用者的編碼，然後內部轉換為 UTF-8。確保在任何一個層面，最終處理的是 UTF-8 編碼。換句話說，需要手段能夠知曉你的輸入是什麼編碼的，處理完成後控制輸出的編碼是 UTF-8。

　　不建議使用 mbstring.encoding_translation 指令和 mb_detect_encoding() 函式。折磨我半天。

　　作業系統和 UTF-8 的最佳實務

# 　　由於作業系統的原因，PHP 處理 Unicode 檔案名稱的時候會有不同的處理機制。

　　在 Linux 中，檔案名稱始終是 UTF-8 編碼的，而在中文 Windows 環境下，檔案名稱始終是 GBK 編碼的，記住這一點就可以了。

　　透過例子說明下:

//命令行程序函数，运行在中文版 Windows 10 操作系统 ，文件编码为 UTF-8

function filenameexample() {
    $filename = "测试.txt" ;
    $gbk_filename = iconv("UTF-8","GBK",$filename);
    file_put_contents($gbk_filename, "测试");
    echo file_get_contents($gbk_filename);
}

function scandirexample() {
    $arr = scandir("./tmp");
    foreach ($arr as $v) {
        if ($v == "." || $v =="..")
            continue ;
        $filename = iconv( "GBK","UTF-8",$v ) ;
        $content = file_get_contents("./tmp/" . $v );
    }
}

登入後複製

　　假如不想寫寫相容 Windows 和 linux 的程序，可以對檔案名稱進行 urlencode 編碼，例如：

 function urlencodeexample() {
    $filename = "测试2.txt" ;
    $urlencodefilename = urlencode($filename) ;
    file_put_contents($urlencodefilename, "测试");
    echo file_get_contents($urlencodefilename);
 }

登入後複製

在用PHP 透過header() 函數下載檔案的時候，也要考慮瀏覽器和作業系統（大部分人使用的是Windows），對於Chrome 來說，輸出的檔案名稱編碼可以是UTF-8，Chrome 會自動將檔案名稱轉換為GBK 編碼。

　　而對於低版本的 IE 來說，它繼承了作業系統的環境，所以下載檔名假如是中文必須轉碼為 UTF-8 編碼，否則下載的時候用戶看到的是亂碼檔名。透過程式碼來說明：

$agent=$_SERVER["HTTP_USER_AGENT"];
if(strpos($agent,&#39;MSIE&#39;)!==false  ｛
    $filename = iconv("UTF-8","GBK","附件.txt");
    header("Content-Disposition: attachment; filename=\"$filename\"");
｝

登入後複製

以上就是详细介绍PHP 与 UTF-8的最佳实践的内容，更多相关内容请关注PHP中文网（www.php.cn）！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7807

Java教學

1646

CakePHP 教程

1402

Laravel 教程

1300

PHP教程

1236

Related knowledge

適用於 Ubuntu 和 Debian 的 PHP 8.4 安裝和升級指南 Dec 24, 2024 pm 04:42 PM

PHP 8.4 帶來了多項新功能、安全性改進和效能改進，同時棄用和刪除了大量功能。本指南介紹如何在 Ubuntu、Debian 或其衍生版本上安裝 PHP 8.4 或升級到 PHP 8.4

我後悔之前不知道的 7 個 PHP 函數 Nov 13, 2024 am 09:42 AM

如果您是經驗豐富的PHP 開發人員，您可能會感覺您已經在那裡並且已經完成了。操作

如何設定 Visual Studio Code (VS Code) 進行 PHP 開發 Dec 20, 2024 am 11:31 AM

Visual Studio Code，也稱為 VS Code，是一個免費的原始碼編輯器 - 或整合開發環境 (IDE) - 可用於所有主要作業系統。 VS Code 擁有大量針對多種程式語言的擴展，可以輕鬆編寫

在PHP API中說明JSON Web令牌（JWT）及其用例。 Apr 05, 2025 am 12:04 AM

JWT是一種基於JSON的開放標準，用於在各方之間安全地傳輸信息，主要用於身份驗證和信息交換。 1.JWT由Header、Payload和Signature三部分組成。 2.JWT的工作原理包括生成JWT、驗證JWT和解析Payload三個步驟。 3.在PHP中使用JWT進行身份驗證時，可以生成和驗證JWT，並在高級用法中包含用戶角色和權限信息。 4.常見錯誤包括簽名驗證失敗、令牌過期和Payload過大，調試技巧包括使用調試工具和日誌記錄。 5.性能優化和最佳實踐包括使用合適的簽名算法、合理設置有效期、

php程序在字符串中計數元音 Feb 07, 2025 pm 12:12 PM

字符串是由字符組成的序列，包括字母、數字和符號。本教程將學習如何使用不同的方法在PHP中計算給定字符串中元音的數量。英語中的元音是a、e、i、o、u，它們可以是大寫或小寫。什麼是元音？元音是代表特定語音的字母字符。英語中共有五個元音，包括大寫和小寫： a, e, i, o, u 示例 1 輸入：字符串 = "Tutorialspoint" 輸出：6 解釋字符串 "Tutorialspoint" 中的元音是 u、o、i、a、o、i。總共有 6 個元

您如何在PHP中解析和處理HTML/XML？ Feb 07, 2025 am 11:57 AM

本教程演示瞭如何使用PHP有效地處理XML文檔。 XML（可擴展的標記語言）是一種用於人類可讀性和機器解析的多功能文本標記語言。它通常用於數據存儲

解釋PHP中的晚期靜態綁定（靜態：:)。 Apr 03, 2025 am 12:04 AM

靜態綁定（static::）在PHP中實現晚期靜態綁定（LSB），允許在靜態上下文中引用調用類而非定義類。 1）解析過程在運行時進行，2）在繼承關係中向上查找調用類，3）可能帶來性能開銷。

什麼是PHP魔術方法（__ -construct，__destruct，__call，__get，__ set等）並提供用例？ Apr 03, 2025 am 12:03 AM

PHP的魔法方法有哪些？ PHP的魔法方法包括：1.\_\_construct，用於初始化對象；2.\_\_destruct，用於清理資源；3.\_\_call，處理不存在的方法調用；4.\_\_get，實現動態屬性訪問；5.\_\_set，實現動態屬性設置。這些方法在特定情況下自動調用，提升代碼的靈活性和效率。

See all articles

詳細介紹PHP 與 UTF-8的最佳實踐

PHP 層面如何處理 UTF-8

檔案 IO 操作 如何處理 UTF-8

Mysql 和 UTF-8 的最佳實踐

瀏覽器和 UTF-8 的最佳實踐

作業系統和 UTF-8 的最佳實務

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題

　　PHP 層面如何處理 UTF-8

　　檔案 IO 操作如何處理 UTF-8

　　Mysql 和 UTF-8 的最佳實踐

　　瀏覽器和 UTF-8 的最佳實踐

　　作業系統和 UTF-8 的最佳實務