Seorang pemula ingin meminta nasihat tentang cara menulis gelung dict ke dalam fail csv dalam python3 (masalah yang dihadapi semasa merangkak)?

Question

Selepas perangkak menjana dict, saya ingin menulisnya ke dalam fail csv, tetapi ralat berlaku menggunakan notebook jupyter dan persekitaran tetingkap. Kod khusus adalah seperti berikut {code...} Apabila menjalankan kod di atas, mesej ralat ialah ValueError: terlalu banyak nilai untuk dibongkar (dijangkakan 2 Sebab untuk pertanyaan adalah untuk mengulangi dict...

習慣沉默 · Answer

Maaf, saya hanya mempunyai masa untuk menjawab soalan anda sekarang. Saya melihat bahawa anda telah menukar kod mengikut cadangan saya

import requests
from multiprocessing.dummy import Pool
from lxml import etree
import time
import random
import csv


def spider(url):
    header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'
    }

    timeout = random.choice(range(31, 50))
    html = requests.get(url, headers=header, timeout=timeout)

    time.sleep(random.choice(range(8, 16)))

    selector = etree.HTML(html.text)

    content_field = selector.xpath('//*[@class="inner"]/p[3]/p[2]/ul/li')

    item = {}

    for each in content_field:
        g = each.xpath('a/p[1]/p[1]/h3/span/text()')

        go = each.xpath('a/p[1]/p[2]/p/h3/text()')

        h = each.xpath('a/p[1]/p[2]/p/p/text()[1]')

        j = each.xpath('a/p[1]/p[1]/p/text()[2]')

        ge = each.xpath('a/p[1]/p[2]/p/p/text()[3]')

        x = each.xpath('a/p[1]/p[1]/p/text()[3]')

        city = each.xpath('a/p[1]/p[1]/p/text()[1]')

        gg = each.xpath('a/p[2]/span/text()')

        item['city'] = "".join(city)

        item['hangye'] = "".join(g)

        item['guimo'] = "".join(go)

        item['gongsi'] = "".join(h)

        item['gongzi'] = "".join(j)

        item['jingyan'] = "".join(ge)

        item['xueli'] = "".join(x)

        item['gongzuoneirong'] = "".join(gg)

        fieldnames = ['city', 'hangye', 'guimo', 'gongsi', 'gongzi', 'jingyan', 'xueli', 'gongzuoneirong']

        with open('bj.csv', 'a', newline='', errors='ignore')as f:
            f_csv = csv.DictWriter(f, fieldnames=fieldnames)

            f_csv.writeheader()

            f_csv.writerow(item)


if __name__ == '__main__':
    f = open('bj.csv', 'w')
    page = []
    for i in range(1, 100):
        newpage = 'https://www.zhipin.com/c101010100/h_101010100/?query=%E6%95%B0%E6%8D%AE%E8%BF%90%E8%90%A5&page=' + str(
            i) + '&ka=page-' + str(i)
        page.append(newpage)
    print(page)
    pool = Pool(4)
    results = pool.map(spider, page)
    pool.close()
    pool.join()
    f.close()

Perkara utama di sini ialah

header, anda adalah typeset类型，我修改后是dict

Saya masih memerlukan nasihat untuk anda di sini

Adakah anda menjalankan kod anda dalam IDE atau editor teks? Beberapa perkara jelas akan melaporkan ralat di bawah IDE
Adalah disyorkan bahawa orang baru mematuhi spesifikasi PEP8 dari awal pembelajaran Jangan membina tabiat buruk Lihat nama anda

过去多啦不再A梦 · Answer

item = {'a':1, 'b':2}
fieldnames = ['a', 'b']

with open('test.csv', 'a') as f:
    f_csv = DictWriter(f, fieldnames=fieldnames)
    f_csv.writeheader()
    f_csv.writerow(item)

Saya tidak mendapat ralat apabila saya menulis seperti ini

Writerrow hanya menerima dict secara terus Saya rasa masalah anda adalah kerana kunci item tidak sepadan dengan pengepala jadual anda

漂亮男人 · Answer

Kerana beberapa nama lajur yang dinyatakan dalam medan tidak wujud dalam item