Python devrait-il utiliser pickle ou csv dans cette situation ?

Question

J'ai de nombreux CSV avec des centaines de Mo disponibles pour stocker certaines données, et j'ai souvent besoin d'utiliser pandas et matplotlib pour lire et tracer ces données. Avant de dessiner, il est généralement nécessaire d'effectuer un prétraitement, un découpage et d'autres opérations de nettoyage. Parce que les figures doivent interagir et être rapportées fréquemment, j'utilise jupyter...

PHP中文网 · Answer

CSV doit être sûr. Il semble que le passage de Pickle à une autre version de Python puisse entraîner un échec de lecture. Ce n'est pas un format universel. S'il s'agit de quelques centaines de mégaoctets, la vitesse de lecture du CSV n'est en réalité pas lente. En plus, il existe hdf5, ce sont des formats d'échange de données sérieux.

天蓬老师 · Answer

csv suffit. Si vous pensez que ce n'est pas assez rapide, vous pouvez essayer le fichier hdf5

.