具體介紹GBK以及UTF-8編碼的正確使用-html教學-PHP中文網

首頁

web前端

html教學

具體介紹GBK以及UTF-8編碼的正確使用

黄舟

Jul 26, 2017 pm 01:28 PM

utf-8 編碼

網頁編碼英文譯為web page encoding，是在網頁中指定其特定的字元編碼格式的函式庫。

GBK是國家標準GB2312基礎上擴容後相容GB2312的標準。 GBK的文字編碼是用雙字節來表示的，即不論中、英文字符均使用雙字節來表示，為了區分中文，將其最高位都設定成1。 GBK包含全部中文字符，是國家編碼，通用性比UTF8差，不過UTF8佔用的資料庫比GBK大。

UTF-8：Unicode TransformationFormat-8bit，允許含BOM，但通常不含BOM。是用以解國際上字元的一種多位元組編碼，它對英文使用8位元（即一個位元組），中文使用24為（三個位元組）來編碼。 UTF-8包含全世界所有國家需要用到的字符，是國際編碼，通用性強。 UTF-8編碼的文字可以在各國支援UTF8字元集的瀏覽器上顯示。如果是UTF8編碼，則在外國人的英文IE上也能顯示中文，他們無需下載IE的中文語言支援包。

UTF-8版本雖然具有良好的國際相容性，但中文需要比GBK/BIG5版本多佔用50%的資料庫儲存空間，因此並非建議使用，僅供對國際相容性有特殊要求的用戶使用。簡單來說：對於中文較多的網站，適合用GBK編碼節省資料庫空間。對於英文較多的網站，適合用UTF-8節省資料庫空間。

GBK、GB2312等與UTF8如何轉換？ GBK、GB2312等與UTF8之間都必須透過Unicode編碼才能相互轉換：GBK、GB2312——Unicode——UTF8；UTF8——Unicode——GBK、GB2312。使用Windows記事本的“另存為”，可以在GBK、Unicode、Unicode big endian和UTF-8這幾種編碼方式間相互轉換。

如何讓瀏覽器正確辨識網頁編碼？一般在網頁中都要有以下一句話：，指示此網頁的字元集編碼是GB2312。（或UTF-8）

頁面有時候指定了編碼為什麼有時會出現亂碼？這可能是頁面申明編碼與文件本身編碼不一致，更多時候是以錯誤編碼打開頁面然後保存導致的，或者是用某些FTP軟體直接在線修改文件，比如CuteFTP，由於軟體編碼配置錯誤而導致轉換錯了編碼。這時候使用window的記事本打開，用「另存為」儲存為對應的編碼即可解決問題。

在windows作業系統上使用IE作為瀏覽器時，常常會發生這樣的問題：在瀏覽使用UTF-8編碼的網頁時，瀏覽器無法自動辨識該頁面所用的編碼，即使網頁已經聲明過編碼格式：，由此造成某些含有中文UTF-8編碼的頁面產生空白輸出。如果使用的是Firefox、Sarafi的瀏覽器這不會造成這個問題。這是由於IE解析網頁編碼時以HTML內的標籤優先，而後才是HTTP header內的訊息，而mozilla系列的瀏覽器則剛好相反。

由於UTF-8為3個位元組表示一個漢子，而普通的GB2312或BIG5是兩個。頁面輸出時，由於上述原因，使瀏覽器解析、輸出http://tbwsy.sinaapp.com/的內容時，如果在前有奇數個全角字符，IE把UTF-8當作兩個字節解析時出現半個漢字的情況，這時該半個漢字會和的<結合成一個亂碼字，導致IE無法讀完< title>部分，使整個頁面為空百輸出，而這個時候如果察看源文件的話，會發現實際上整個頁面全部已經輸出了，但瀏覽器不顯示內容。最簡單的解決方法就是把放在之前。

以上是具體介紹GBK以及UTF-8編碼的正確使用的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7725

Java教學

1643

CakePHP 教程

1397

Laravel 教程

1290

PHP教程

1233

Related knowledge

11個常見的分類特徵的編碼技術 Apr 12, 2023 pm 12:16 PM

機器學習演算法只接受數值輸入，所以如果我們遇到分類特徵的時候都會對分類特徵進行編碼，本文總結了常見的11個分類變數編碼方法。 1.ONE HOT ENCODING最受歡迎且常用的編碼方法是One Hot Enoding。一個具有n個觀測值和d個不同值的單一變量被轉換成具有n個觀測值的d個二元變量，每個二元變量使用一位（0，1）進行標識。例如：編碼後最簡單的實作是使用pandas的' get_dummiesnew_df=pd.get_dummies(columns=[‘Sex’], data=df)2、

utf8編碼漢字佔多少位元組 Feb 21, 2023 am 11:40 AM

utf8編碼漢字佔3個位元組。在UTF-8編碼中，一個中文等於三個位元組，一個中文標點佔三個位元組；而在Unicode編碼中，一個中文（含繁體）等於兩個位元組。 UTF-8使用1~4位元組為每個字元編碼，一個US-ASCIl字元只需1位元組編碼，帶有變音符號的拉丁文、希臘文、西里爾字母、亞美尼亞語、希伯來文、阿拉伯文、敘利亞文等字母則需要2位元組編碼。

知識圖譜：大模型的理想搭檔 Jan 29, 2024 am 09:21 AM

大型語言模式（LLM）具有產生流暢和連貫文字的能力，為人工智慧的對話、創意寫作等領域帶來了新的前景。然而，LLM也存在一些關鍵限制。首先，它們的知識僅限於從訓練資料中辨識出的模式，缺乏對世界的真正理解。其次，推理能力有限，不能進行邏輯推理或從多個資料來源融合事實。面對更複雜、更開放的問題時，LLM的回答可能變得荒謬或矛盾，被稱為「幻覺」。因此，儘管LLM在某些方面非常有用，但在處理複雜問題和真實世界情境時，仍存在一定的限制。為了彌補這些差距，近年來出現了檢索增強生成（RAG）系統，其核心思想是

常見的幾種編碼方式 Oct 24, 2023 am 10:09 AM

常見的編碼方式有ASCII編碼、Unicode編碼、UTF-8編碼、UTF-16編碼、GBK編碼等。詳細介紹：1、ASCII編碼是最早的字符編碼標準，使用7位二進制數表示128個字符，包括英文字母、數字、標點符號以及控製字符等；2、Unicode編碼是一種用於表示世界上所有字元的標準編碼方式，它為每個字元分配了一個唯一的數字碼點；3、UTF-8編碼等等。

PHP編碼小技巧：如何產生具有防偽驗證功能的二維碼？ Aug 17, 2023 pm 02:42 PM

PHP編碼小技巧：如何產生具有防偽驗證功能的二維碼？隨著電子商務和互聯網的發展，二維碼越來越被廣泛應用於各行各業。而在使用二維碼的過程中，為了確保產品的安全性和防止偽造，為二維碼添加防偽驗證功能是十分重要的一環。本文將介紹如何使用PHP產生具有防偽驗證功能的二維碼，並附上對應程式碼範例。在開始之前，我們需要準備以下幾個必要的工具和函式庫：PHPQRCode：PHP

hdb3編碼規則是啥 Aug 29, 2023 pm 01:38 PM

編碼規則是：1、如果前一個編碼是0，當前資料位元為0，則編碼為0；2、如果前一個編碼是0，當前資料位元為1，則編碼為雙極脈衝（+A或- A），並將計數器加1；3、如果前一個編碼是1，當前資料位元為1，則編碼為0，並將計數器加1；4、如果前一個編碼是1，目前資料位元為0，則根據計數器的奇偶性來決定編碼方式，如果是偶數，則編碼為（+B或-B），如果是奇數，則編碼為零電平，並將計數器清零等等。

一文搞懂如何基於 GenAI 提升編碼效能 Apr 01, 2024 pm 06:49 PM

Hellofolks，我是Luga，今天我們來聊聊人工智慧(AI)生態領域相關的技術-GenAI。面對日新月異的技術創新以及差異化的業務場景挑戰，傳統的編碼方式已經開始出現水土不服，難以完全應對日益增長的訴求。同時，新興的通用GenAI（人工智慧技術）具有極具潛力的能力來滿足這項需求。 GenAI作為人工智慧技術的代表，以其強大的潛力和能力已經開始在各行各業中廣泛應用。它可以自動學習和適應不同場景下的編碼需求，大大提高了編碼效率和品質。透過深度學習和模型優化，GenAI能夠準確地理解不同