['000001_2017-03-17.csv', '000001_2017-03-20.csv',
'000002_2017-03-21.csv', '000002_2017-03-22.csv',
'000003_2017-03-23.csv', '000004_2017-03-24.csv']
tableau numpy, avec un total de dizaines de milliers d'éléments. Maintenant, je souhaite conserver le numéro 000001 ou similaire devant chaque élément et supprimer les doublons, ne laissant qu'un numéro unique. Le résultat devrait être ['000001','000002','000003','000004']
En plus d'utiliser l'instruction for, existe-t-il un moyen plus efficace ?
Écrivons NumPy~
python3
Vous pouvez également l'écrire comme ceci :
np.frompyfunc
'|S6'
consiste à stocker la chaîne sur 6 octets'<U6'
是以6个小端序Unicode字符
Ficelle de magasinBasé sur les méthodes d'écriture des deux frères
@agree and accept @xiaojieluoff
Si la longueur du nombre est fixée aux six premiers chiffres, la manière la plus rapide de l'écrire est le premier ci-dessous
Utilisez la carte et les fonctions anonymes
Sortie :
Exécutez le code suivant et vous verrez qu'avec 6 millions de données, la carte est environ 0,6 seconde plus rapide que pour
Sortie :
Si les données de test sont étendues à 60 millions, l'écart sera encore plus évident