Jadual Kandungan

Cara pengekodan aksara biasa berfungsi dalam komputer

Rumah

masalah biasa

Apakah perbezaan antara unicode dan ascii

青灯夜游

Oct 15, 2021 pm 01:50 PM

ascii unicode

Perbezaan: 1. Pengekodan ASCII ialah 1 bait, manakala pengekodan Unikod biasanya 2 bait. 2. ASCII ialah pengekodan bait tunggal dan tidak boleh digunakan untuk mewakili Bahasa Cina boleh mewakili semua bahasa. 3. Pengekodan Unikod memerlukan ruang storan dua kali lebih banyak daripada pengekodan ASCII.

Apakah perbezaan antara unicode dan ascii

Persekitaran pengendalian tutorial ini: sistem Windows 7, komputer Dell G3.

Pengekodan ASCII

Kod ASCII menggunakan kombinasi nombor binari 7-bit atau 8-bit yang ditentukan untuk mewakili 128 atau 256 aksara yang mungkin . Kod ASCII standard, juga dipanggil kod ASCII asas, menggunakan 7 digit perduaan (baki 1 digit perduaan ialah 0) untuk mewakili semua huruf besar dan huruf kecil, nombor 0 hingga 9, tanda baca dan kawalan khas yang digunakan dalam bahasa Inggeris Amerika. Bit terakhir digunakan untuk semakan pariti.
Masalah: ASCII ialah pengekodan bait tunggal dan tidak boleh digunakan untuk mewakili bahasa Cina (pengekodan Cina memerlukan sekurang-kurangnya 2 bait, oleh itu, China telah merumuskan pengekodan GB2312 untuk mengekod bahasa Cina). Tetapi terdapat banyak bahasa yang berbeza di dunia, jadi pengekodan bersatu diperlukan.

Unicode

Unicode menyatukan semua bahasa ke dalam satu set pengekodan, jadi tiada lagi kekacauan watak Masalah.
Unicode selalunya menggunakan dua bait untuk mewakili aksara (jika anda ingin menggunakan aksara yang sangat jarang berlaku, anda memerlukan 4 bait). Sistem pengendalian moden dan kebanyakan bahasa pengaturcaraan menyokong Unicode secara langsung.

Perbezaan antara Unicode dan ASCII

Pengekodan ASCII ialah 1 bait, manakala pengekodan Unicode biasanya 2 bait.
Huruf A yang dikodkan dalam ASCII ialah 65 dalam perpuluhan dan 01000001 dalam Unicode, anda hanya perlu menambah 0 di hadapan, iaitu: 00000000 01000001.
Masalah baharu: Jika disatukan ke dalam pengekodan Unikod, masalah aksara bercelaru akan hilang. Walau bagaimanapun, jika teks yang anda tulis pada asasnya semuanya dalam bahasa Inggeris, pengekodan Unicode memerlukan ruang storan dua kali lebih banyak daripada pengekodan ASCII, yang sangat tidak menjimatkan dari segi penyimpanan dan penghantaran.

UTF8

Jadi, atas semangat pemuliharaan, terdapat cara lain untuk menukar pengekodan Unikod kepada "pembolehubah "pengekodan panjang" pengekodan UTF-8.
Pengekodan UTF-8 mengekodkan aksara Unikod kepada 1-6 bait mengikut saiz nombor yang berbeza Huruf Inggeris yang biasa digunakan dikodkan kepada 1 bait, dan aksara Cina biasanya 3 bait, hanya beberapa aksara Tidak biasa akan menjadi. dikodkan kepada 4-6 bait. Jika teks yang anda ingin hantar mengandungi banyak aksara Inggeris, anda boleh menjimatkan ruang dengan mengekodkannya dalam UTF-8.

字符	ASCII	Unicode	UTF-8
A	01000001	00000000 01000001	01000001
中文	x	01001110 00101101	01001110 00101101

Anda juga boleh mendapati daripada jadual di atas bahawa pengekodan UTF-8 mempunyai faedah tambahan, iaitu pengekodan ASCII sebenarnya boleh dianggap sebagai sebahagian daripada pengekodan UTF-8. Oleh itu, sejumlah besar perisian warisan yang hanya menyokong pengekodan ASCII boleh terus berfungsi di bawah pengekodan UTF-8.

Cara pengekodan aksara biasa berfungsi dalam komputer

Pengekodan Unikod digunakan secara seragam dalam ingatan komputer, dan ditukar apabila ia perlu disimpan ke cakera keras atau dipindahkan. Dikodkan kepada UTF-8.
Apabila mengedit dengan Notepad, aksara UTF-8 yang dibaca daripada fail ditukar kepada aksara Unicode dan disimpan dalam memori Selepas pengeditan selesai, Unicode ditukar kepada UTF-8 apabila menyimpan. Ke fail:
Apabila menyemak imbas web, pelayan akan menukar kandungan Unicode yang dijana secara dinamik kepada UTF-8 dan kemudian menghantarnya ke penyemak imbas:

Untuk pengetahuan lanjut berkaitan, sila lawati ruangan Soalan Lazim!

Atas ialah kandungan terperinci Apakah perbezaan antara unicode dan ascii. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Arahan sembang dan cara menggunakannya

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7519

Tutorial CakePHP

1378

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Berapa banyak bait yang diduduki oleh satu aksara ascii? Mar 09, 2023 pm 03:49 PM

Satu aksara ascii menduduki 1 bait. Aksara kod ASCII diwakili oleh pengekodan binari 7-bit atau 8-bit dalam komputer dan disimpan dalam satu bait, iaitu, satu kod ASCII menduduki satu bait. Kod ASCII boleh dibahagikan kepada kod ASCII standard dan kod ASCII lanjutan juga dipanggil kod ASCII asas Ia menggunakan nombor perduaan 7-bit (baki 1 digit perduaan ialah 0) untuk mewakili semua huruf besar dan huruf kecil. nombor 0 hingga 9. Tanda baca, dan aksara kawalan khas yang digunakan dalam Bahasa Inggeris Amerika.

Ketahui dengan cepat tentang penukaran nilai ASCII dalam PHP Mar 28, 2024 pm 06:42 PM

Penukaran nilai ASCII dalam PHP adalah masalah yang sering dihadapi dalam pengaturcaraan. ASCII (American Standard Code for Information Interchange) ialah sistem pengekodan standard untuk menukar aksara kepada nombor. Dalam PHP, kita selalunya perlu menukar antara aksara dan nombor melalui kod ASCII. Artikel ini akan memperkenalkan cara menukar nilai ASCII dalam PHP dan memberikan contoh kod tertentu. 1. Tukar aksara

Pemahaman mendalam tentang PHP: Kaedah pelaksanaan menukar Unicode JSON kepada bahasa Cina Mar 05, 2024 pm 02:48 PM

Pemahaman mendalam tentang PHP: Kaedah pelaksanaan menukar JSONUnicode kepada Bahasa Cina Semasa pembangunan, kami sering menghadapi situasi di mana kami perlu memproses data JSON dan pengekodan Unicode dalam JSON akan menyebabkan kami beberapa masalah dalam beberapa senario, terutamanya apabila kami perlu menukar Unicode Apabila pengekodan ditukar kepada aksara Cina. Dalam PHP, terdapat beberapa kaedah yang boleh membantu kami mencapai proses penukaran ini Kaedah biasa akan diperkenalkan di bawah dan contoh kod khusus akan disediakan. Mula-mula, mari kita fahami dulu Un dalam JSON

Bagaimana untuk menukar unicode kepada bahasa Cina Dec 14, 2023 am 10:57 AM

Unicode ialah standard pengekodan aksara yang digunakan untuk mewakili pelbagai bahasa dan simbol. Untuk menukar pengekodan Unicode kepada aksara Cina, anda boleh menggunakan fungsi terbina dalam Python chr() dan ord().

Cuba kaedah untuk menyelesaikan masalah aksara Cina yang kacau dalam Eclipse Jan 03, 2024 pm 05:28 PM

Adakah anda terganggu dengan watak Cina yang kacau dalam Eclipse? Untuk mencuba penyelesaian ini, anda memerlukan contoh kod khusus 1. Pengenalan latar belakang Dengan perkembangan berterusan teknologi komputer, bahasa Cina memainkan peranan yang semakin penting dalam pembangunan perisian. Walau bagaimanapun, banyak pembangun menghadapi masalah kod bercelaru apabila menggunakan Eclipse untuk pembangunan bahasa Cina, yang menjejaskan kecekapan kerja. Kemudian, artikel ini akan memperkenalkan beberapa masalah kod bercelaru biasa dan memberikan penyelesaian serta contoh kod yang sepadan untuk membantu pembaca menyelesaikan masalah kod bercelaru bahasa Cina dalam Eclipse. 2. Masalah kod bercelaru biasa dan fail penyelesaian

Tutorial PHP: Cara Menukar Unikod JSON kepada Aksara Cina Mar 05, 2024 pm 06:36 PM

JSON (JavaScriptObjectNotation) ialah format pertukaran data ringan yang biasa digunakan untuk pertukaran data antara aplikasi web. Semasa memproses data JSON, kami sering menemui aksara Cina yang dikodkan Unikod (seperti "u4e2du6587") dan perlu menukarnya kepada aksara Cina yang boleh dibaca. Dalam PHP, kita boleh mencapai penukaran ini melalui beberapa kaedah mudah. Seterusnya, kami akan memperincikan cara menukar JSONUnico

PHP mengembalikan nilai ASCII bagi aksara pertama rentetan Mar 21, 2024 am 11:01 AM

Artikel ini akan menerangkan secara terperinci nilai ASCII bagi rentetan pertama yang dikembalikan oleh PHP Editor berpendapat ia sangat praktikal, jadi saya berkongsi dengan anda sebagai rujukan saya harap anda boleh memperoleh sesuatu selepas membaca artikel ini. PHP mengembalikan nilai ASCII bagi aksara pertama rentetan Pengenalan Dalam PHP, mendapatkan nilai ASCII bagi aksara pertama rentetan ialah operasi biasa yang melibatkan pengetahuan asas pemprosesan rentetan dan pengekodan aksara. Nilai ASCII digunakan untuk mewakili nilai angka aksara dalam sistem komputer dan penting untuk perbandingan aksara, penghantaran data dan penyimpanan. Proses mendapatkan nilai ASCII bagi aksara pertama rentetan melibatkan langkah berikut: Dapatkan Rentetan: Tentukan rentetan yang anda ingin dapatkan nilai ASCII. Ia boleh menjadi pembolehubah atau pemalar rentetan

Selesaikan masalah pengekodan set aksara Unicode yang tidak konsisten apabila Java menyambung ke pangkalan data MySQL Jun 10, 2023 am 11:39 AM

Dengan perkembangan teknologi seperti data besar dan pengkomputeran awan, pangkalan data telah menjadi salah satu asas penting dalam pemformatan perusahaan. Dalam aplikasi yang dibangunkan di Java, menyambung ke pangkalan data MySQL telah menjadi kebiasaan. Walau bagaimanapun, dalam proses ini, kita sering menghadapi masalah berduri - pengekodan set aksara unikod tidak konsisten. Ini bukan sahaja akan menjejaskan kecekapan pembangunan kami, tetapi juga menjejaskan prestasi dan kestabilan aplikasi. Artikel ini akan memperkenalkan cara menyelesaikan masalah ini dan menjadikan Java menyambung ke pangkalan data MySQL dengan lebih lancar. 1. Unicode