本篇文章為大家帶來了關於Python的相關知識,其中主要整理了numpy資料類型的相關問題,包括了numpy的基本資料型別、numpy自訂複合資料型別、使用ndarray保存日期資料類型等等內容,下面一起來看一下,希望對大家有幫助。
【相關推薦:Python3影片教學 】
類型名稱 | 類型表示符 |
---|---|
布林型 | bool |
有符號整數型 | int8 / int16 / int32 / int64 |
#無符號整數型 | uint8 / uint16 / uint32 / uint64 |
浮點型 | float16 / float32 / float64 |
複數型 | complex64 / complex128 |
#字元類型 | str,每個字元以32 位元Unicode 編碼表示 |
import numpy as np arr = np.array([1, 2, 3]) print(arr, arr.dtype) arr = arr.astype('int64') print(arr, arr.dtype) arr = arr.astype('float32') print(arr, arr.dtype) arr = arr.astype('bool') print(arr, arr.dtype) arr = arr.astype('str') print(arr, arr.dtype)
#如果希望ndarray 中儲存物件類型,numpy 建議使用元組儲存物件的屬性欄位值,然後把元組加入ndarray 中,ndarray 提供了語法方便處理這些資料。
import numpy as np data = [ ('zs', [99, 98, 90], 17), ('ls', [95, 95, 92], 16), ('ww', [97, 92, 91], 18) ] # 姓名 2 个字符 # 3 个 int32 类型的成绩 # 1 个 int32 类型的年龄 arr = np.array(data, dtype='2str, 3int32, int32') print(arr) print(arr.dtype) # 可以通过索引访问 print(arr[0], arr[0][2])
當資料量大時,採用上述方法不便於資料的存取。
ndarray 提供可以採用字典或清單的形式定義陣列元素的資料型別和列的別名。存取資料時,可以透過下標索引訪問,也可以透過列名進行資料存取。
import numpy as np data = [ ('zs', [99, 98, 90], 17), ('ls', [95, 95, 92], 16), ('ww', [97, 92, 91], 18)]# 采用字典定义列名和元素的数据类型arr = np.array(data, dtype={ # 设置每列的别名 'names': ['name', 'scores', 'age'], # 设置每列数据元素的数据类型 'formats': ['2str', '3int32', 'int32']})print(arr, arr[0]['age'])# 采用列表定义列名和元素的数据类型arr = np.array(data, dtype=[ # 第一列 ('name', 'str', 2), # 第二列 ('scores', 'int32', 3), # 第三列 ('age', 'int32', 1)])print(arr, arr[1]['scores'])# 直接访问数组的一列print(arr['scores'])
import numpy as np dates = [ '2011', '2011-02', '2011-02-03', '2011-04-01 10:10:10' ] ndates = np.array(dates) print(ndates, ndates.dtype) # 数据类型为日期类型,采用 64 位二进制进行存储,D 表示日期精确到天 ndates = ndates.astype('datetime64[D]') print(ndates, ndates.dtype) # 日期运算 print(ndates[-1] - ndates[0])
1.日期字串支援不支援
2011/11/11
,使用空格進行分隔日期也不支援2011 11 11
,支援2011-11 -11
2.日期與時間之間需要有空格進行分隔2011-04-01 10:10:10
# 3.時間的書寫格式10: 10:10
numpy 提供了型別字碼可以更方便的處理資料型別。
類型 | 類型表示符 | 字碼 |
---|---|---|
布林型別 | bool | ? |
有符號整數型別 | int8 / int16 / int32 / int64 | i1 / i2 / i4 / i8 |
無符號整數型別 | uint8 / uint16 / uint32 / uint64 | u1 / u2 / u4 / u8 |
浮點型 | float16 / float32 / float64 | f2 / f4 / f8 |
#f2 / f4 / f8 | 複數型 | |
c8 / c16 | 字元型 | |
U | 日期 |
M8[Y] / M8[M] / M8[D] / M8 [h] / M8[m] / M8[s]
import numpy as np data = [ ('zs', [99, 98, 90], 17), ('ls', [95, 95, 92], 16), ('ww', [97, 92, 91], 18) ] # 采用字典定义列名和元素的数据类型 arr = np.array(data, dtype={ # 设置每列的别名 'names': ['name', 'scores', 'age'], # 设置每列数据元素的数据类型 'formats': ['2U', '3i4', 'i4'] }) print(arr) print(arr[1]['scores']) print(arr['scores']) print(arr.dtype)
##5. 案例
選取字段,使用ndarray 儲存資料。
import numpy as np datas = [ (0, '4室1厅', 298.79, 2598, 86951), (1, '3室2厅', 154.62, 1000, 64675), (2, '3室2厅', 177.36, 1200, 67659),]arr = np.array(datas, dtype={ 'names': ['index', 'housetype', 'square', 'totalPrice', 'unitPrice'], 'formats': ['u1', '4U', 'f4', 'i4', 'i4']})print(arr)print(arr.dtype)# 计算 totalPrice 的均值sum_totalPrice = sum(arr['totalPrice'])print(sum_totalPrice/3)
以上是Python資料型別簡介之numpy的詳細內容。更多資訊請關注PHP中文網其他相關文章!