社区

学习

工具库

AI工具

休闲

简体中文

首页 > 后端开发 > Python教程 > scrapy自定义pipeline类实现将采集数据保存到mongodb的方法

scrapy自定义pipeline类实现将采集数据保存到mongodb的方法

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2016-06-10 15:15:01

原创

1284 人浏览过

本文实例讲述了scrapy自定义pipeline类实现将采集数据保存到mongodb的方法。分享给大家供大家参考。具体如下：

# Standard Python library imports
# 3rd party modules
import pymongo
from scrapy import log
from scrapy.conf import settings
from scrapy.exceptions import DropItem
class MongoDBPipeline(object):
  def __init__(self):
    self.server = settings['MONGODB_SERVER']
    self.port = settings['MONGODB_PORT']
    self.db = settings['MONGODB_DB']
    self.col = settings['MONGODB_COLLECTION']
    connection = pymongo.Connection(self.server, self.port)
    db = connection[self.db]
    self.collection = db[self.col]
  def process_item(self, item, spider):
    err_msg = ''
    for field, data in item.items():
      if not data:
        err_msg += 'Missing %s of poem from %s\n' % (field, item['url'])
    if err_msg:
      raise DropItem(err_msg)
    self.collection.insert(dict(item))
    log.msg('Item written to MongoDB database %s/%s' % (self.db, self.col),
        level=log.DEBUG, spider=spider)
    return item

登录后复制

希望本文所述对大家的python程序设计有所帮助。

相关标签：

mongodb scrapy 保持采集数据

上一篇：使用Python的Twisted框架编写简单的网络客户端下一篇：在服务器端实现无间断部署Python应用的教程

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

LLM的工作方式：培训前训练，神经网络，幻觉和推理

2025-02-26 03:58:14
我将区块链和AI组合在一起以生成艺术。接下来发生了什么。

2025-02-26 03:38:10
高级及时工程：思想链（COT）

2025-02-26 03:17:10
在Sqlite中检索增强发电

2025-02-26 02:49:09
如何使用LLM驱动的样板构建自己的节点。JSAPI

2025-02-26 01:08:13
2024年编码的LLM：价格，性能和争取最佳的战斗

2025-02-26 00:46:10
提示视觉语言模型

2025-02-25 23:42:08
如何衡量大语模型的响应的可靠性

2025-02-25 22:50:13
生活的幻想

2025-02-25 21:54:11
科学家对大型语言模型的认真反映了人类思维

2025-02-25 20:45:11

最新问题

scrapy怎么把response转成对象？

来自于 1970-01-01 08:00:00

0

0

0

python scrapy爬虫错误

来自于 1970-01-01 08:00:00

0

0

0

python - Scrapy LOG信息输出到文件

来自于 1970-01-01 08:00:00

0

0

0

python 安装scrapy失败

来自于 1970-01-01 08:00:00

0

0

0

python - Scrapy如何得到原始的start_url

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1435028
php入门教程之一周学会PHP

4294063
JAVA 初级入门视频教程

2649026
小甲鱼零基础入门学习Python视频教程

515651
PHP 零基础入门教程

875865

最新下载

更多>

网站特效

网站源码

网站素材

前端模板