['000001_2017-03-17.csv', '000001_2017-03-20.csv',
'000002_2017-03-21.csv', '000002_2017-03-22.csv',
'000003_2017-03-23.csv', '000004_2017-03-24.csv']
numpy-Array mit insgesamt Zehntausenden Elementen. Jetzt möchte ich die Nummer 000001 oder ähnliches vor jedem Element beibehalten und die Duplikate entfernen, so dass nur eine eindeutige Nummer übrig bleibt. Das Ergebnis sollte sein: ['000001','000002','000003','000004']
Gibt es neben der Verwendung der for-Anweisung eine effizientere Möglichkeit?
写个NumPy的吧~
python3
还可以这样写:
np.frompyfunc
'|S6'
是以6个字节存储字符串'<U6'
是以6个小端序Unicode字符
存储字符串综合两位仁兄的写法
@同意并接受 @xiaojieluoff
如果编号长度固定是前六位,最快的写法下面第一种最快
使用 map 和匿名函数
输出:
运行下面代码可以看到 , 在 6百万 条数据下,map 比 for 快了 0.6s 左右
输出:
如果把测试数据扩大到 6千万, 差距就更明显了