Donc, en gros, je récupère des données sur le Web et j'ai un fichier de projet importé dans mon fichier spider principal. Désormais, lorsque je récupère les données, les stocke dans un conteneur et les enregistre au format CSV, la colonne liée finit toujours par être la première colonne du CSV. Comment définir la position des colonnes personnalisées ?
pName = response.css('#search .a-size-medium').css('::text').extract() pPrice = response.css('#search .a-price-whole').css('::text').extract() imgs = response.css('.sbv-product-img , .s-image-fixed-height .s-image').css('::attr(src)').extract() for prod in zip(pName , pPrice , imgs): items['prodName'] = prod[0] items['price'] = prod[1] items['imgLink'] = prod[2] yield items
Utilisez les paramètres
settings.py
文件或蜘蛛custom_settings
属性中的FEED_EXPORT_FIELDS
. Les colonnes seront disposées dans l'ordre que vous avez défini dans Paramètres Valeurs.Par exemple :
ou en
settings.py
:documentation scrapylien et lien2