['000001_2017-03-17.csv', '000001_2017-03-20.csv',
'000002_2017-03-21.csv', '000002_2017-03-22.csv',
'000003_2017-03-23.csv', '000004_2017-03-24.csv']
tatasusunan numpy, dengan jumlah puluhan ribu elemen. Sekarang saya mahu mengekalkan nombor 000001 atau sebagainya di hadapan setiap elemen, dan mengalih keluar pendua, hanya meninggalkan nombor unik. Hasilnya sepatutnya ['000001','000002','000003','000004']
Selain menggunakan pernyataan for, adakah cara yang lebih berkesan?
Jom tulis NumPy~
python3
Anda juga boleh menulisnya seperti ini:
np.frompyfunc
'|S6'
ialah untuk menyimpan rentetan dalam 6 bait'<U6'
是以6个小端序Unicode字符
Simpan taliBerdasarkan kaedah penulisan dua beradik
@setuju dan terima @xiaojieluoff
Jika panjang nombor ditetapkan kepada enam digit pertama, cara terpantas untuk menulisnya ialah yang pertama di bawah
Gunakan peta dan fungsi tanpa nama
Keluaran:
Jalankan kod berikut dan anda dapat melihat bahawa dengan 6 juta keping data, peta adalah kira-kira 0.6s lebih pantas daripada
Keluaran:
Jika data ujian dikembangkan kepada 60 juta, jurang akan menjadi lebih jelas