Scrapy : Guide d'enregistrement au format CSV avec des paramètres de colonne personnalisés
P粉576184933
P粉576184933 2024-04-04 14:01:17
0
1
441

Donc, en gros, je récupère des données sur le Web et j'ai un fichier de projet importé dans mon fichier spider principal. Désormais, lorsque je récupère les données, les stocke dans un conteneur et les enregistre au format CSV, la colonne liée finit toujours par être la première colonne du CSV. Comment définir la position des colonnes personnalisées ?

pName = response.css('#search .a-size-medium').css('::text').extract()
        pPrice = response.css('#search .a-price-whole').css('::text').extract()
        imgs = response.css('.sbv-product-img , .s-image-fixed-height .s-image').css('::attr(src)').extract()

        for prod in zip(pName , pPrice , imgs):        
            items['prodName'] = prod[0]     
            items['price'] = prod[1]        
            items['imgLink'] = prod[2]      
            
            yield items

P粉576184933
P粉576184933

répondre à tous(1)
P粉391677921

Utilisez les paramètres settings.py 文件或蜘蛛 custom_settings 属性中的 FEED_EXPORT_FIELDS. Les colonnes seront disposées dans l'ordre que vous avez défini dans Paramètres Valeurs.

Par exemple :

class MySpider(scrapy.Spider):

    custom_settings = {
        "FEED_EXPORT_FIELDS": ["prodName", "price", "imgLink"]
    }

ou en settings.py :

FEED_EXPORT_FIELDS=["prodName", "price", "imgLink"]

documentation scrapylien et lien2

Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal