技术宅是怎样看连载的
问题背景
话说我是个火影迷,所以每到周三的时候,总会为了等火影的更新不停地刷新网页。后来我还迷上了一部连载小说,每天不定期更新,于是每天就在那里刷呀刷,F5都快烂了。F5烂了没关系,程序猿那么忙,怎么可以把宝贵的时间浪费在这种地方 >_
意淫方案
为了避免因为几个连载而日夜煎熬,作为一个能拯救世界的技术宅,当然要做点什么了 >_
实现简述
首先是简化我们的问题,上面提到的解决方案的程序里面,可以分为以下几个部分:
- 定时执行
- 读取连载目录的内容
- 检测是否有更新
- 发邮件
顺便提一下,我最近做PHP比较多,所以开发语言就以 PHP 为主咯 ╮(╯_╰)╭
下面只对技术方案做简单的说明,毕竟程序做的事情也很简单,没有什么很神奇的代码
定时执行 - crontab
前段时间刚好租过一台很矬的玩具级 Linux 服务器,所以我可以让程序在这台服务器上24小时不停地跑。在 Linux 系统里面,定时执行通常可以通过 crontab 命令新增一条定时任务。例如,我要设置每隔10分钟执行一次,那么 crontab 新增项的格式如下:
*/10 * * * * /path/task.sh
读取连载目录的内容
连载目录是在一个网页上的,要读取出目录的内容,还需要再把这个问题分解:
- 下载网页
- 分析网页内容
下载网页 - curl
网页的内容一般是是浏览器作为客户端通过 HTTP 协议从服务器获取的。在我们的方案里,我们要写的程序就需要充当 HTTP 协议通信的客户端来下载网页的数据,熟悉 Linux 的你应该会想到 curl 命令行工具,这里可以用 PHP 提供的 exec 函数来执行 curl 命令,或者使用 PHP 自带的 curl 库。
我使用的是 PHP 的 curl 库,有兴趣可以自行了解。
分析网页的内容 - 正则表达式
下载到的网页文档是 html 代码,以我看的火影忍者为例,http://www.mangapanda.com/93/naruto.html ,(PS:表示看不懂日语而且英文版的更新速度比中文版的快,所以就...)
对于我们来说,连载目录其实就是 html 文档中的这部分 href 属性值为 "/naruto/xxx" 的 元素了。
只要对下载到的 html 代码用简单的模式匹配做文本过滤,就可以得到连载目录的内容了,我觉得你也应该想得到,用正则表达式来做这件事情再适合不过了。以刚才那个网页为例,可以用下面这行正则表达式来粗略地过滤出连载目录:
|href="/naruto/[^"]*"|
因为不同的要使用的正则表达式会不一样,所以这个正则表达式应该是由用户配置的。
在 PHP 里面,可以使用 PHP PCRE Functions 中的 pregmatchall 函数。
检测是否有更新
这个相对比较简单,只有有更新,那么连载上当的内容就一定会有变化。所以只要把每次读取到连载目录和上一次读取到的连载目录的内容进行比较,只要有不同,就认定有有更新即可。
至于历史数据的储存,用一个文件就可以了。我有点小题大作地使用了 MySQL 数据库来做这个事情。
发邮件 - PHPMailer
不熟悉计算机网络的我对邮件协议了解也是一塌糊涂,经过 google 之后,找到了 PHPMailer 库,参考这个库提供的 SMTP 的例子即可。
我使用一个 QQ 邮箱来作为发件人,需要注意的问题是这个 QQ 邮件要开通 SMTP 服务。
效果演示和代码下载
考虑到对用户友好以及通用性,所以做了一个简易的配置页面,如下图所示:
收到的提醒邮件的内容也很简单,内容为空都可以,不过最好还是附上连载目录的链接。
代码可以使用 svn 检出:
svn checkout "https://svn.code.sf.net/p/roxma-proj/code/php_learn"
这里面夹杂着一些个人学习过程中积累的和主题无关的代码,我相信应该不会有人想认真看,如果真的很想看,可以从 phplearn/apps/seriesupdate_remindder/check.php 跟进去。代码真的不建议细看,我觉得最重要的内容其实还是“技术概要”那一节里面的讲到的思路,(好吧代码太难看你偷偷告诉我就行了不要声张)

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











PHP 8.4는 상당한 양의 기능 중단 및 제거를 통해 몇 가지 새로운 기능, 보안 개선 및 성능 개선을 제공합니다. 이 가이드에서는 Ubuntu, Debian 또는 해당 파생 제품에서 PHP 8.4를 설치하거나 PHP 8.4로 업그레이드하는 방법을 설명합니다.

CakePHP는 PHP용 오픈 소스 프레임워크입니다. 이는 애플리케이션을 훨씬 쉽게 개발, 배포 및 유지 관리할 수 있도록 하기 위한 것입니다. CakePHP는 강력하고 이해하기 쉬운 MVC와 유사한 아키텍처를 기반으로 합니다. 모델, 뷰 및 컨트롤러 gu

VS Code라고도 알려진 Visual Studio Code는 모든 주요 운영 체제에서 사용할 수 있는 무료 소스 코드 편집기 또는 통합 개발 환경(IDE)입니다. 다양한 프로그래밍 언어에 대한 대규모 확장 모음을 통해 VS Code는

CakePHP는 오픈 소스 MVC 프레임워크입니다. 이를 통해 애플리케이션 개발, 배포 및 유지 관리가 훨씬 쉬워집니다. CakePHP에는 가장 일반적인 작업의 과부하를 줄이기 위한 여러 라이브러리가 있습니다.

이 튜토리얼은 PHP를 사용하여 XML 문서를 효율적으로 처리하는 방법을 보여줍니다. XML (Extensible Markup Language)은 인간의 가독성과 기계 구문 분석을 위해 설계된 다목적 텍스트 기반 마크 업 언어입니다. 일반적으로 데이터 저장 AN에 사용됩니다
