分享一个简单的rss阅读工具-XML/RSS教程-PHP中文网

首页

后端开发

XML/RSS教程

分享一个简单的rss阅读工具

Y2J

May 03, 2017 am 09:32 AM

#!usr/bin/env python
# -*- coding:UTF-8 -*-
 
import re
from lxml import etree
from bs4 import BeautifulSoup as sp
import requests
import urllib2
import StringIO
 
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
 
headers={&#39;User-Agent&#39; : &#39;Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)&#39;}
 
def urlread(url):
    try:
        req=requests.get(url,headers=headers)
        req.encoding="utf-8"
        return req.text.encode("utf-8")
    except:
        req=urllib2.Request(url,headers=headers)
        response=urllib2.urlopen(req)
        return response.read().encode("utf-8")
             
class Item:
    def __init__(self,title,link,date,description):
        self.title=title.strip()
        self.link=link.strip()
        self.pubDate=date.strip()
        self.decription=self.filter(description).strip()
         
    def filter(self,description):
        description=re.sub("<.*?>",&#39;&#39;,description)
        description=re.sub("\r",&#39;&#39;,description)
        description=re.sub("\n",&#39;&#39;,description)
        description=re.sub(" "," ",description)
        if len(description)>240:
            description=description[:240]+&#39;...&#39;
        return description       
 
    def __str__(self):
        return "%s\n%s\n%s\n<%s>\n" % (
                self.title,
                self.link,
                self.decription,
                self.pubDate
                )
         
    __repr__=__str__
     
class BSParser(object):
    #url=&#39;&#39;
    def __init__(self,url):
        xml=urlread(url)
        self.reset(xml)
         
    def reset(self,xml=None):
        if xml==None:
            self.soup=sp("<xml> </xml>")
        else:
            self.soup=sp(xml,"xml")
 
    def callback(self,method,obj,tags):
        rst=None
        attr=method.lower()
 
        for tag in tags:
            try:
                rst=getattr(obj,attr)(tag)
            except:
                continue
            if rst:
                break
        return rst
 
    def getfields(self,tags=["item",&#39;entry&#39;]):
        return self.callback(method="FIND_ALL",
                            obj=self.soup,
                            tags=tags)
             
    def gettitle(self,obj,tags=["title"]):
        return self.callback("FIND",obj,tags).text
         
    def getlink(self,obj,tags=["link"]):     
        rst=self.callback("FIND",obj,tags).text
        if not rst:          
            rst=self.callback("FIND",obj,tags).get("href")
        return rst
         
    def getdate(self,obj,tags=["pubDate","published"]):
        return self.callback("FIND",obj,tags).text
         
    def getdescription(self,obj,tags=["description","content"]):       
        return self.callback("FIND",obj,tags).text
     
    def run(self):
        for item in self.getfields():
            title=self.gettitle(item)
            link=self.getlink(item)
            date=self.getdate(item)
            description=self.getdescription(item)
            newsitem=Item(title,link,date,description)
            yield newsitem
 
def test():
    parser=Parser()
    for item in parser.run():
        print item
         
if __name__=="__main__":
    test()

登录后复制

以上是分享一个简单的rss阅读工具的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

AI Hentai Generator

免费生成ai无尽的。

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7451

CakePHP 教程

1374

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

如何用PHP和XML实现网站的RSS订阅管理和显示 Jul 29, 2023 am 10:09 AM

如何用PHP和XML实现网站的RSS订阅管理和显示RSS（ReallySimpleSyndication）是一种用于发布经常更新的博客文章、新闻、音频和视频等内容的标准格式。许多网站都提供了RSS订阅功能，使用户可以方便地获取最新的信息。在本文中，我们将学习如何使用PHP和XML来实现网站的RSS订阅管理和显示功能。首先，我们需要创建一个RSS订阅的XM

PHP应用：通过函数获取rss订阅内容 Jun 20, 2023 pm 06:25 PM

随着互联网的迅速发展，越来越多的网站开始提供RSS订阅服务，使得用户可以方便地获取网站更新的内容。而PHP作为一种流行的服务端脚本语言，有着许多用于处理RSS订阅的函数，使得开发人员可以轻松地从RSS源中提取需要的数据。本篇文章将介绍如何使用PHP函数获取RSS订阅内容。一、什么是RSS？RSS全名为“ReallySimpleSyndication”（简

如何通过PHP编写一个简单的RSS订阅器 Sep 25, 2023 pm 07:05 PM

如何通过PHP编写一个简单的RSS订阅器RSS（ReallySimpleSyndication）是一种用于订阅网站内容的格式，通过订阅器可以获取到最新的文章、新闻和博客等更新。在本文中，我们将使用PHP编写一个简单的RSS订阅器来演示如何获取和显示RSS源的内容。确认环境和准备工作在开始之前，确保你已经有一个PHP环境，并且已经安装了SimpleXML扩

如何使用 PHP 实现 RSS 订阅功能 Sep 05, 2023 pm 04:43 PM

如何使用PHP实现RSS订阅功能RSS（ReallySimpleSyndication）是一种用于发布和订阅网站更新内容的格式。使用RSS，用户可以方便地获取他们感兴趣的网站的最新信息，而无需定期访问网站。在本文中，我们将学习如何使用PHP实现RSS订阅功能。首先，我们需要了解RSS的基本结构。一个典型的RSS文档由一个或多个项目（item）组成

使用 PHP 爬取其他网站的 RSS 订阅 Jun 13, 2023 pm 02:55 PM

随着互联网内容的不断丰富和多样化，更多的人开始使用RSS技术来订阅自己感兴趣的博客、新闻等内容，让自己不再错过任何重要信息。而作为Web开发中常用的编程语言之一，PHP也提供了一些强大的函数和工具来帮助我们爬取其他网站的RSS订阅，并将其展示在我们自己的网站上。本文将介绍如何使用PHP来爬取其他网站的RSS订阅，并将其解析为数组或对象，

使用PHP和XML实现RSS订阅功能 Aug 09, 2023 pm 08:13 PM

使用PHP和XML实现RSS订阅功能RSS（ReallySimpleSyndication）是一种用于发布和订阅网站更新内容的标准格式。它以XML为基础，并通过订阅者的RSS阅读器获取最新的内容。在本文中，我们将介绍如何使用PHP和XML来实现简单的RSS订阅功能。创建XML文件首先，我们需要创建一个XML文件来存储我们要发布的内容。假设我们要发布的是文