首页 后端开发 XML/RSS教程 分享一个简单的rss阅读工具

分享一个简单的rss阅读工具

May 03, 2017 am 09:32 AM

#!usr/bin/env python
# -*- coding:UTF-8 -*-
 
import re
from lxml import etree
from bs4 import BeautifulSoup as sp
import requests
import urllib2
import StringIO
 
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
 
headers={'User-Agent' : 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'}
 
def urlread(url):
    try:
        req=requests.get(url,headers=headers)
        req.encoding="utf-8"
        return req.text.encode("utf-8")
    except:
        req=urllib2.Request(url,headers=headers)
        response=urllib2.urlopen(req)
        return response.read().encode("utf-8")
             
class Item:
    def __init__(self,title,link,date,description):
        self.title=title.strip()
        self.link=link.strip()
        self.pubDate=date.strip()
        self.decription=self.filter(description).strip()
         
    def filter(self,description):
        description=re.sub("<.*?>",&#39;&#39;,description)
        description=re.sub("\r",&#39;&#39;,description)
        description=re.sub("\n",&#39;&#39;,description)
        description=re.sub(" "," ",description)
        if len(description)>240:
            description=description[:240]+&#39;...&#39;
        return description       
 
    def __str__(self):
        return "%s\n%s\n%s\n<%s>\n" % (
                self.title,
                self.link,
                self.decription,
                self.pubDate
                )
         
    __repr__=__str__
     
class BSParser(object):
    #url=&#39;&#39;
    def __init__(self,url):
        xml=urlread(url)
        self.reset(xml)
         
    def reset(self,xml=None):
        if xml==None:
            self.soup=sp("<xml> </xml>")
        else:
            self.soup=sp(xml,"xml")
 
    def callback(self,method,obj,tags):
        rst=None
        attr=method.lower()
 
        for tag in tags:
            try:
                rst=getattr(obj,attr)(tag)
            except:
                continue
            if rst:
                break
        return rst
 
    def getfields(self,tags=["item",&#39;entry&#39;]):
        return self.callback(method="FIND_ALL",
                            obj=self.soup,
                            tags=tags)
             
    def gettitle(self,obj,tags=["title"]):
        return self.callback("FIND",obj,tags).text
         
    def getlink(self,obj,tags=["link"]):     
        rst=self.callback("FIND",obj,tags).text
        if not rst:          
            rst=self.callback("FIND",obj,tags).get("href")
        return rst
         
    def getdate(self,obj,tags=["pubDate","published"]):
        return self.callback("FIND",obj,tags).text
         
    def getdescription(self,obj,tags=["description","content"]):       
        return self.callback("FIND",obj,tags).text
     
    def run(self):
        for item in self.getfields():
            title=self.gettitle(item)
            link=self.getlink(item)
            date=self.getdate(item)
            description=self.getdescription(item)
            newsitem=Item(title,link,date,description)
            yield newsitem
 
def test():
    parser=Parser()
    for item in parser.run():
        print item
         
if __name__=="__main__":
    test()
登录后复制

以上是分享一个简单的rss阅读工具的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

如何用PHP和XML实现网站的RSS订阅管理和显示 如何用PHP和XML实现网站的RSS订阅管理和显示 Jul 29, 2023 am 10:09 AM

如何用PHP和XML实现网站的RSS订阅管理和显示RSS(ReallySimpleSyndication)是一种用于发布经常更新的博客文章、新闻、音频和视频等内容的标准格式。许多网站都提供了RSS订阅功能,使用户可以方便地获取最新的信息。在本文中,我们将学习如何使用PHP和XML来实现网站的RSS订阅管理和显示功能。首先,我们需要创建一个RSS订阅的XM

PHP应用:通过函数获取rss订阅内容 PHP应用:通过函数获取rss订阅内容 Jun 20, 2023 pm 06:25 PM

随着互联网的迅速发展,越来越多的网站开始提供RSS订阅服务,使得用户可以方便地获取网站更新的内容。而PHP作为一种流行的服务端脚本语言,有着许多用于处理RSS订阅的函数,使得开发人员可以轻松地从RSS源中提取需要的数据。本篇文章将介绍如何使用PHP函数获取RSS订阅内容。一、什么是RSS?RSS全名为“ReallySimpleSyndication”(简

如何通过PHP编写一个简单的RSS订阅器 如何通过PHP编写一个简单的RSS订阅器 Sep 25, 2023 pm 07:05 PM

如何通过PHP编写一个简单的RSS订阅器RSS(ReallySimpleSyndication)是一种用于订阅网站内容的格式,通过订阅器可以获取到最新的文章、新闻和博客等更新。在本文中,我们将使用PHP编写一个简单的RSS订阅器来演示如何获取和显示RSS源的内容。确认环境和准备工作在开始之前,确保你已经有一个PHP环境,并且已经安装了SimpleXML扩

如何使用 PHP 实现 RSS 订阅功能 如何使用 PHP 实现 RSS 订阅功能 Sep 05, 2023 pm 04:43 PM

如何使用PHP实现RSS订阅功能RSS(ReallySimpleSyndication)是一种用于发布和订阅网站更新内容的格式。使用RSS,用户可以方便地获取他们感兴趣的网站的最新信息,而无需定期访问网站。在本文中,我们将学习如何使用PHP实现RSS订阅功能。首先,我们需要了解RSS的基本结构。一个典型的RSS文档由一个或多个项目(item)组成

使用 PHP 爬取其他网站的 RSS 订阅 使用 PHP 爬取其他网站的 RSS 订阅 Jun 13, 2023 pm 02:55 PM

随着互联网内容的不断丰富和多样化,更多的人开始使用RSS技术来订阅自己感兴趣的博客、新闻等内容,让自己不再错过任何重要信息。而作为Web开发中常用的编程语言之一,PHP也提供了一些强大的函数和工具来帮助我们爬取其他网站的RSS订阅,并将其展示在我们自己的网站上。本文将介绍如何使用PHP来爬取其他网站的RSS订阅,并将其解析为数组或对象,

使用PHP和XML实现RSS订阅功能 使用PHP和XML实现RSS订阅功能 Aug 09, 2023 pm 08:13 PM

使用PHP和XML实现RSS订阅功能RSS(ReallySimpleSyndication)是一种用于发布和订阅网站更新内容的标准格式。它以XML为基础,并通过订阅者的RSS阅读器获取最新的内容。在本文中,我们将介绍如何使用PHP和XML来实现简单的RSS订阅功能。创建XML文件首先,我们需要创建一个XML文件来存储我们要发布的内容。假设我们要发布的是文

XML/RSS数据集成:开发人员和建筑师的实用指南 XML/RSS数据集成:开发人员和建筑师的实用指南 Apr 02, 2025 pm 02:12 PM

XML/RSS数据整合可以通过解析和生成XML/RSS文件来实现。1)使用Python的xml.etree.ElementTree或feedparser库解析XML/RSS文件,提取数据。2)使用ElementTree生成XML/RSS文件,逐步添加节点和数据。

Microsoft Edge 正在测试一种现代 RSS 源,可让你关注 YouTube 创作者 Microsoft Edge 正在测试一种现代 RSS 源,可让你关注 YouTube 创作者 May 04, 2023 am 11:25 AM

点击进入:ChatGPT工具插件导航大全在影响者、视频博主和内容创作者的时代,每一种关注我们最喜欢的网红的新方法都很重

See all articles