python 的requests问题

Question

导入requests,提示报错 ''' UnicodeDecodeError: 'ascii' codec can't decode byte 0xc9 in position 1: ordinal not in range(128)'''
问题查了，一般是字符之间转换的。但是到了库这里，就不懂了什么原因。。。。
小生愚钝，请教各位老师，请指点一二，麻烦了。

PHP中文网 · Answer

ただ試してみたい場合は、Python3 を直接使用することを検討できます。Python2 と比較して、Python3 では文字エンコーディングの問題が大幅に少なくなります。

阿神 · Answer

エラーメッセージを見ると、lanxi.py のエンコード形式に問題があるはずです。まず cmd コンソールに移動して Python を実行し、その後インポートしてみてください。リクエストには問題がないはずです。

大家讲道理 · Answer

SSL暗号化機能パッケージのフォルダーパスに特殊文字が含まれています

py3,2に変更すると常にコーディング上の問題が発生します

高洛峰 · Answer

リーリー

このコード内の変数に漢字が含まれている場合は、印刷して確認したり、すべてを Unicode 形式で保存したりできます

リーリー

巴扎黑 · Answer

UnicodeDecodeError は、文字のデコードが失敗する理由です。これは、requests だけの問題でも、python だけの問題でもありません。この「問題」は、文字エンコーディングを理解する必要があるということです。特定の文字エンコーディングの情報を照会できます。以下の py2 の文字エンコーディングの問題。 UnicodeDecodeError是字符解码失败的原因，这不仅是requests的问题，也不仅是python的问题，所有编程语言都有这样的“问题”，也就是必须要了解字符编码。具体的字符编码可以查询资料。下面py2中的字符编码问题。

py2的用引号声明的字串类型都是str，字串前加一个u声明的才是unicode。网络IO，文件读写中传输的字符都是编码成bytes，即str类型。载入到计算机执行计算，一般都要解码成unicode。py2的str方法实际上是''.encode('ascii'), unicode方法是''.decode('ascii')

In [1]: s = u'你好'

In [2]: str(s)
---------------------------------------------------------------------------
UnicodeEncodeError                        Traceback (most recent call last)
 in ()
----> 1 str(s)

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

In [3]: s.decode('ascii')
---------------------------------------------------------------------------
UnicodeEncodeError                        Traceback (most recent call last)
 in ()
----> 1 s.decode('ascii')

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

In [4]: ss = '你好'

In [5]: unicode(ss)
---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
 in ()
----> 1 unicode(ss)

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128)

In [6]: ss.decode('ascii')
---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
 in ()
----> 1 ss.decode('ascii')

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128)

In [7]: ss.decode('utf-8')
Out[7]: u'\u4f60\u597d'

In [8]: ss.decode('gbk')
Out[8]: u'\u6d63\u72b2\u30bd'

因为ss = '你好'是非ascii字符，因此以ascii方式解码失败，当解码成utf-8和gbk就成功了。同理s=u'你好'也不能编码成ascii的方式。

你上面的问题，应该是非ascii字符，decode成ascii字符的时候抛错。result_path + p_path 即这两个变量中，有一个变量是包含非ascii字符的str类型：

In [1]: 'hello' + u'world'
Out[1]: u'helloworld'

In [2]: 'hello' + u'世界'
Out[2]: u'hello\u4e16\u754c'

In [3]: '你好' + u'世界'
---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
 in ()
----> 1 '你好' + u'世界'

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128)

In [4]: '你好' + '世界'
Out[4]: '\xe4\xbd\xa0\xe5\xa5\xbd\xe4\xb8\x96\xe7\x95\x8c'

In [5]: '你好' + '世界 world'
Out[5]: '\xe4\xbd\xa0\xe5\xa5\xbd\xe4\xb8\x96\xe7\x95\x8c world'

In [6]: '你好' + u'世界 world'
---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
 in ()
----> 1 '你好' + u'世界 world'

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128)

In [9]: '你好' + u'world'
---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
 in ()
----> 1 '你好' + u'world'

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128)

'你好'中的中文不是ascii字符，和unicode字符拼接的时候，会解码成unicode再拼接，对于最后的例子，'你好' + u'world'，其实执行的是 '你好'.decode('ascii') + u'world'，所以就报错。

校正的方式很简单，统一字符编码就好。linux的py默认编码是utf-8，win貌似是gbk。不管怎么样，总之都用utf-8吧。

In [10]: '你好'.decode('utf-8') + u'world'
Out[10]: u'\u4f60\u597dworld'

py3中，所有引号声明的字串都是unicode。也就不存在str和unicode这两种类型。其中str编码成bytes类型，bytes解码成字串类型。两种的相互转换的时候，还是会有 UnicodeDecodeError

py2 で引用符で囲まれて宣言された文字列型はすべて str であり、文字列の前に u を付けて宣言された文字列型は

unicode です。 。ネットワーク IO およびファイルの読み取りと書き込み中に送信される文字はすべてバイト、つまり str 型にエンコードされます。計算を実行するためにコンピュータにロードされると、通常は unicode にデコードされます。 py2 の str メソッドは実際には ''.encode('ascii') であり、unicode メソッドは ''.decode です。 ('ascii')🎜
リーリー
🎜 ss = 'Hello' は非 ascii 文字であるため、utf- にデコードすると ascii モードでのデコードは失敗します。 8 と gbk は成功します。同様に、s=u'Hello' を ascii にエンコードすることはできません。 🎜
🎜上記の問題は非 ascii 文字に関するものであるはずで、decode が ascii 文字になるとエラーが発生します。 result_path + p_path つまり、これら 2 つの変数の 1 つは、非 ascii 文字を含む str 型です。 🎜
リーリー
🎜 'Hello' の中国語は ascii 文字ではありません。Unicode 文字と結合すると、Unicode にデコードされてから結合されます。 'you OK' + u'world' ですが、実際の実行は 'Hello'.decode('ascii') + u'world' であるため、エラーが発生します。報告した。 🎜
🎜修正方法は非常に簡単で、統一された文字エンコーディングを使用するだけです。 Linux の py のデフォルトのエンコードは utf-8 ですが、win では gbk のようです。何があっても、utf-8 を使用してください。 🎜
リーリー
🎜 py3 では、引用符で囲まれて宣言されたすべての文字列は Unicode です。 str と unicode という 2 つのタイプはありません。このうち、str は bytes 型にエンコードされ、bytes は string 型にデコードされます。 2 つの間で変換する場合、依然として UnicodeDecodeError の問題が発生します。py3 ですべてがうまくいくとは考えないでください。問題を解決する鍵となるのは、エンコードとデコードの方法を知ることです。それを一度に解決してください。 🎜
リーリー