python - scrapy pipeline报错求助

Question

由于不太清楚传输的机制,卡在SCRAPY传输的这个问题上近半个月，翻阅了好多资料，还是不懂,基础比较差所以上来求助各位老师！
不涉及自定义就以SCRAPY默认的格式为例
spider return的东西需要什么样的格式?
dict?{a:1,b:2,.....}
还是[{a:1,aa:11},{b:2,bb:22},{......}]
return的东西传去哪了?
是不是下面代码的item？

PHP中文网 · Answer

直接寫入就行，不用做循環，item是單一處理，並不是你想的那樣的列表：

import time

class Pm25Pipeline(object):

    def process_item(self, item, spider):
        today = time.strftime("%y%m%d", time.localtime())
        fname = str(today) + ".txt"

        with open(fname, "a") as f:
            f.write(item["date"] + '	' +
                    item["rank"] + '	' +
                    item["quality"] + '	' +
                    item["province"] + '	' +
                    item["city"] + '	' +
                    item["aqi"] + '	' +
                    item["pm25"] + '
'
                    )
        f.close()
        return item

伊谢尔伦 · Answer

搜尋：TypeError: string indices must be integers，搞清楚什麼問題
定位行數，解決問題

大家讲道理 · Answer

Scrapy的Item類似python字典，擴充了一些功能而已。

Scrapy的設計，每產生一個Item，即可傳遞到pipeline中處理。你在裡面寫的for tmp in item循環的是item字典的鍵了，鍵應是字串，再用__getitem__語法就會提示你使用的不是數字。

高洛峰 · Answer

你可以把一個item看作一个字典，实际它就是dict类的派生类。你在pipeline里对这个item直接遍历,取到的tmp实际是都是字典的键，类型是字符串，所以tmp['pm25']这种操作报出TypeError：string类型的对象索引必须是int型。