Memelihara Pengekodan Semasa Memaip Output dalam Python
Apabila mengubah hala keluaran standard atur cara Python melalui paip, penterjemah mungkin salah menganggap pengekodan Tiada, membawa kepada ralat pengekodan Unicode. Untuk menyelesaikan isu ini, adalah penting untuk menentukan pengekodan secara eksplisit.
Tidak seperti pelaksanaan dalam skrip, yang Python melaraskan secara automatik kepada pengekodan terminal, paip memerlukan pengekodan manual. Amalan biasa ialah mengekod output menggunakan 'utf-8':
# -*- coding: utf-8 -*- print(u"åäö".encode('utf-8'))
Ini memastikan output yang disalurkan adalah konsisten dengan perwakilan Unicode, tanpa mengira pengekodan program sasaran.
Untuk senario kompleks yang melibatkan berbilang pengekodan, adalah disyorkan untuk mematuhi prinsip berikut:
Pendekatan ini membolehkan manipulasi data yang lancar dan mengelakkan berkaitan pengekodan ralat.
Pertimbangkan contoh program Python yang menukar antara ISO-8859-1 dan UTF-8, menggunakan penukaran huruf besar dalam proses:
import sys for line in sys.stdin: line = line.decode('iso8859-1') line = line.upper() line = line.encode('utf-8') sys.stdout.write(line)
Dalam kes ini, input dinyahkod daripada ISO-8859-1, diproses sebagai Unicode, dan kemudian dikodkan kepada UTF-8 sebelum output.
Menetapkan pengekodan lalai sistem secara global tidak digalakkan, kerana ia boleh mengganggu modul dan perpustakaan yang mungkin menganggap ASCII pengekodan.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengekalkan Pengekodan Apabila Output Paip dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!