python3對文字和二進位資料做了區分。文字是Unicode編碼,str類型,用於顯示。二進位類型是bytes類型,用於儲存和傳輸。 bytes是byte的序列,而str是unicode的序列。本文主要介紹了python string類型 bytes類型 bytearray類型,需要的朋友可以參考下,希望能幫助到大家。
一、str型別:
>>> s = u'你好' >>> s '你好' >>> type(s) <class 'str'>
bytes型別:
##
>>> b = b'abc' >>> b b'abc' >>> type(b) <class 'bytes'>
##二、str與bytes之間的轉換關係:str-->encode()-->bytes-->decode()-->str
轉換方式一:encode( ),decode()
>>> a = u'你好' >>> b = a.encode('utf-8') >>> b b'\xe4\xbd\xa0\xe5\xa5\xbd' >>> type(b) <class 'bytes'> >>> new_a = b.decode('utf-8') >>> new_a '你好' >>> type(new_a) <class 'str'>
轉換方式二:bytes(),str()
>>> a = u'你好' >>> b= bytes(a, encoding='utf-8') >>> b b'\xe4\xbd\xa0\xe5\xa5\xbd' >>> type(b) <class 'bytes'> >>> new_a = str(b, encoding='utf-8') >>> new_a '你好' >>> type(new_a) <class 'str'>
#三、bytearray型別
bytearray類別是range 0 < = x < 256的一個可變序列。
可選的來源參數可以用幾種不同的方式來初始化陣列:
•如果它是一個字串,那麼您還必須給出編碼(以及可選的錯誤)參數;bytearray()然後使用str.encode()將字串轉換為位元組。
•如果它是一個整數,那麼陣列將具有這個大小,並將用null位元組初始化。•如果它是符合緩衝區介面的對象,則將使用對象的唯讀緩衝區來初始化位元組數組。
•如果它是可迭代的,那麼它必須是range 0 < = x < 256的整數的迭代,它被用作數組的初始內容•如果沒有參數,則創建一個大小為0的數組。
當來源參數是字串時:
>>> b = bytearray(u'你好', encoding='utf-8') >>> b bytearray(b'\xe4\xbd\xa0\xe5\xa5\xbd') >>> type(b) <class 'bytearray'></p> <p></p> <p>#當來源參數是整數時:</p> <p></p> <pre class="brush:php;toolbar:false"> >>> b = bytearray(5) >>> b bytearray(b'\x00\x00\x00\x00\x00') >>> type(b) <class 'bytearray'>
當來源參數是可迭代對象,那麼這個迭代對象的元素都必須符合0 <= x < 256:
>>> b = bytearray([1, 2, 3, 4, 255]) >>> b bytearray(b'\x01\x02\x03\x04\xff') >>> type(b) <class 'bytearray'