python2.7 - python 中文写入文件后乱码

Question

一个很简单的小爬虫程序 {代码...} print 的结果是中文： &lt;domaininfo strDomain="XXX.com." strOwner="XXX" strDepartment="云平台部" strBusiness="[互联网业务系统 - XXX" strUser="XXX;&qu

PHP中文网 · Answer

你需要知道 kandungan 的编码方式，并考虑是否要转换
你需要用 utf-8 打开文件，然后写入

codecs.open(nama fail, mod[, pengekodan[, ralat[, penimbalan]]])

Buka fail yang dikodkan menggunakan mod yang diberikan dan kembalikan versi yang dibalut
menyediakan pengekodan/penyahkodan telus. Mod fail lalai ialah 'r'
bermaksud membuka fail dalam mod baca.

Nota Versi yang dibalut hanya akan menerima format objek yang ditakrifkan oleh
codec, iaitu objek Unicode untuk kebanyakan codec terbina dalam. Output
juga bergantung kepada codec dan biasanya akan menjadi Unicode juga. Nota Fail
sentiasa dibuka dalam mod binari, walaupun tiada mod binari dinyatakan. Ini dilakukan untuk mengelakkan kehilangan data akibat pengekodan menggunakan
nilai 8-bit. Ini bermakna tiada penukaran automatik 'n' dilakukan
pada membaca dan menulis. pengekodan menentukan pengekodan yang akan
digunakan untuk fail.
ralat mungkin diberikan untuk mentakrifkan pengendalian ralat. Ia lalai kepada
'strict' yang menyebabkan ValueError dinaikkan sekiranya berlaku ralat
pengekodan.
penimbalan mempunyai makna yang sama seperti fungsi open() terbina dalam. Ia
lalai kepada baris buffer.

import codecs
f = codecs.open("domain_test.xml", "w", "utf-8")

怪我咯 · Answer

Cuba tambah # -*- coding: utf-8 -*-

pada permulaan fail

大家讲道理 · Answer

Tambah #coding:utf-8 pada permulaan fail