Menukar Antara Rentetan dan Tatasusunan UTF-8 Byte dalam Java
Dalam Java, operasi pengekodan dan penyahkodan antara rentetan dan tatasusunan bait boleh timbul dalam pelbagai senario. Artikel ini menyediakan panduan ringkas kepada penukaran ini, khususnya memfokuskan pada pengekodan UTF-8.
Mengekod Rentetan ke dalam Tatasusunan UTF-8 Byte
Untuk mengekod rentetan ke dalam tatasusunan bait UTF-8, gunakan kaedah getBytes bagi kelas String. Kaedah ini mengambil nama pengekodan sebagai hujahnya, seperti StandardCharsets.UTF_8.
String s = "some text here"; byte[] b = s.getBytes(StandardCharsets.UTF_8);
Menyahkod Tatasusunan UTF-8 Byte ke dalam Rentetan
Untuk menyahkod Tatasusunan bait UTF-8 ke dalam rentetan, gunakan pembina String baharu dan nyatakan pengekodan yang sesuai nama.
byte[] b = {(byte) 99, (byte) 97, (byte) 116}; String s = new String(b, StandardCharsets.US_ASCII);
Adalah penting untuk menggunakan nama pengekodan yang betul dalam kedua-dua kes untuk memastikan perwakilan aksara yang betul. Pilihan pengekodan biasa termasuk US-ASCII dan UTF-8, yang menyokong julat aksara yang lebih luas.
Perhatikan bahawa memilih pengekodan yang sesuai bergantung pada konteks dan sifat data yang sedang diproses.
Atas ialah kandungan terperinci Bagaimanakah Saya Menukar Antara Rentetan dan Tatasusunan UTF-8 Byte di Jawa?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!