python2.7 - python 中文写入文件后乱码

Question

一个很简单的小爬虫程序 {代码...} print 的结果是中文： &lt;domaininfo strDomain="XXX.com." strOwner="XXX" strDepartment="云平台部" strBusiness="[互联网业务系统 - XXX" strUser="XXX;&qu

PHP中文网 · Answer

你必要知道コンテンツのコード方式、并検討要转换
你必要用utf-8打开文件，その後写入

codecs.open(ファイル名, モード[, エンコード[, エラー[, バッファリング]]])

指定されたモードを使用してエンコードされたファイルを開き、ラップされたバージョンを返します
透過的なエンコード/デコードを提供します。デフォルトのファイルモードは「r」です
、ファイルを読み取りモードで開くことを意味します。

注: ラップされたバージョンは、コーデックによって定義されたオブジェクト形式 (つまり、ほとんどの組み込みコーデックの Unicode オブジェクト) のみを受け入れます。出力もコーデックに依存し、通常は Unicode になります。注: バイナリモードが指定されていない場合でも、ファイル
は常にバイナリモードで開かれます。これは、
8 ビット値を使用したエンコードによるデータ損失を避けるために行われます。これは、読み取りおよび書き込み時に「n」の自動変換が行われないことを意味します
。エンコーディングは、ファイルに使用されるエンコーディングを指定します。
エラー処理を定義するためにエラーを指定することもできます。デフォルトは
「strict」です。これにより、エンコードエラーが発生した場合に ValueError が発生します。
バッファリングは、組み込みの open() 関数と同じ意味を持ちます。
デフォルトでは行バッファリングされます。

リーリー

怪我咯 · Answer

ファイルの先頭に# -*- coding: utf-8 -*-

を追加してみてください

大家讲道理 · Answer

ファイルの先頭に #coding:utf-8 を追加します