PHP 实现小偷程序
为什么使用“小偷程序”? 远程抓取文章资讯或商品信息是很多企业要求程序员实现的功能,也就是俗说的 小偷程序 。其最主要的优点是:解决了公司网编繁重的工作,大大提高了效率。只需要一运行就能快速的抓取别人网站的信息。 “小偷程序”在哪里运行? “小
为什么使用“小偷程序”?
远程抓取文章资讯或商品信息是很多企业要求程序员实现的功能,也就是俗说的小偷程序。其最主要的优点是:解决了公司网编繁重的工作,大大提高了效率。只需要一运行就能快速的抓取别人网站的信息。
“小偷程序”在哪里运行?
“小偷程序” 应该在 Windows 下的 DOS(参考文章:http://blog.csdn.net/liruxing1715/article/details/7079488) 或 Linux 下通过 PHP 命令运行为最佳,因为,网页运行会超时。
比如图(Windows 下 DOS 为例):
“小偷程序”的实现
这里主要通过一个实例来讲解,我们来抓取下“华强电子网”的资讯信息,请先看观察这个链接 http://www.hqew.com/info-c10.html,当您打开这个页面的时候发现这个页面会发现一些现象:
1、资讯列表有 500 页(2012-01-03);
2、每页的 url 链接都有规律,比如:第1页为http://www.hqew.com/info-c10-1.html;第2页为http://www.hqew.com/info-c10-2.html;……第500页为http://www.hqew.com/info-c10-500.html;
3、由第二点就可以知道,“华强电子网” 的资讯是伪静态或者是生成的静态页面
其实,基本上大部分的网站都有这样的规律,比如:中关村在线、慧聪网、新浪、淘宝……。
这样,我们可以通过这样的思路来实现页面内容的抓取:
1、先获取文章列表页内容;
2、根据文章列表页内容循环获取文章的 url 地址;
3、根据文章的 url 地址获取文章的详细内容
这里,我们主要抓取资讯页里面的:标题(title)、发布如期(date)、作者(author)、来源(source)、内容(content)
“华强电子网”资讯抓取
首先,先建数据表结构,如下所示:
CREATE TABLE `article`.`article` ( `id` MEDIUMINT( 8 ) UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY , `title` VARCHAR( 255 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `date` VARCHAR( 50 ) NOT NULL , `author` VARCHAR( 100 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `source` VARCHAR( 100 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `content` TEXT NOT NULL ) ENGINE = MYISAM CHARACTER SET utf8 COLLATE utf8_general_ci;로그인 후 복사
抓取程序:
通过上面的程序,就可以实现抓取华强电子网的资讯信息。
入口方法 init($min, $max) 如果想抓取 1-500 页面内容,那么 init(1, 500) 即可!这样,用不了多长时间,华强电子网的资讯就会全部抓取到数据库里面了。^_^
执行界面:
数据库:

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Coinbase 보안 로그인 안내서 : 피싱 사이트 및 사기를 피하는 방법은 무엇입니까? 피싱과 사기는 점점 더 만연해지고 있으며 Coinbase 공식 로그인 포털에 안전하게 액세스하는 것이 중요합니다. 이 기사는 사용자가 코인베이스의 최신 공식 로그인 포털을 안전하게 찾아 사용하여 디지털 자산의 보안을 보호 할 수 있도록 실용적인 가이드를 제공합니다. 우리는 피싱 사이트를 식별하는 방법과 공식 웹 사이트, 모바일 앱 또는 신뢰할 수있는 타사 플랫폼을 통해 안전하게 로그인하는 방법을 다루고 강력한 비밀번호 사용 및 2 요인 검증 가능성과 같은 계정 보안을 향상시키기위한 제안을 제공합니다. 잘못된 로그인으로 인한 자산 손실을 피하려면이 기사를주의 깊게 읽으십시오!

이 기사는 Ouyi OKX Exchange의 공식 웹 사이트에 계정을 등록하고 Cryptocurrency 거래를 시작하는 방법에 대해 자세히 설명합니다. OUYI는 세계 최고의 암호 화폐 거래소로서 광범위한 거래 품종, 여러 거래 방법 및 강력한 보안 보증을 제공하며 다양한 피아트 및 암호 화폐의 편리한 철수를 지원합니다. 이 기사는 OUYI 공식 웹 사이트 등록 입력에 대한 검색 방법, 자세한 등록 단계 (이메일/모바일 등록, 정보 작성, 검증 코드 확인 등) 및 등록 후 예방 조치 (KYC 인증, 보안 설정 등)를 다루고 일반적인 질문에 대한 답변을 제공하여 초보자 사용자를 빠르고 안전하게 완료하고 Cryptocency Vourdy를 시작합니다.

디지털 통화 거래에서 보안이 중요합니다. 피싱의 유병률로 인해 Ouyi OKX 공식 입구 주소와 공식 링크를 찾는 것이 중요합니다. 이 기사는 OUYI OKX 공식 플랫폼에 대한 보안 액세스를위한 포괄적 인 안내서를 제공하여 사용자가 웹 사이트를 식별하고 피하고 디지털 자산의 보안을 보호 할 수 있도록 도와줍니다. 우리는 공식 웹 사이트, 공식 애플리케이션, 공식 소셜 미디어 계정 및 기타 신뢰할 수있는 채널을 통해 Ouyi OKX의 공식 포털을 확인하는 방법을 소개하고, 알 수없는 링크를 피하고 강력한 암호 사용 및 2 인용 인 검증을 가능하게하여 거래가 안전하고 신뢰할 수 있도록하는 중요한 보안 팁을 제공합니다.

디지털 통화 거래의 인기가 높아짐에 따라 안전하고 신뢰할 수있는 거래 플랫폼을 선택하는 것이 중요합니다. 세계 최고의 디지털 자산 거래소로서 OKX의 보안은 많은 관심을 끌었습니다. 그러나 많은 피싱 웹 사이트는 OKX 공무원을 사칭하여 사용자가 계정 보안 및 자산 손실의 위험에 직면하게됩니다. 이 기사는 Phising 웹 사이트 트랩을 피하고 디지털 자산의 보안을 보장하기 위해 실제 OUYI OKX 공식 웹 사이트 및 앱 입구를 식별하고 액세스하는 방법을 자세히 설명합니다. 공식 웹 사이트 확인, 공식 앱 다운로드, 공식 소셜 미디어 채널 및 공식 고객 서비스 상담과 같은 다양한 채널을 통해 OKX 공식 플랫폼을 효과적으로 식별하고 액세스하여 거래 보안을 보장 할 수 있습니다. 도메인 이름을주의 깊게 확인하고 HTTPS 프로토콜을 확인한 후 네트워크 보안 인식을 향상 시키십시오.

시뮬레이션 디스크 또는 가상 거래라고도하는 시뮬레이션 된 거래는 암호 화폐 거래를 배우고 연습하는 훌륭한 방법으로, 사용자가 실제 재무 위험을 감수하지 않고 가상 펀드와 거래 할 수 있습니다. 시뮬레이션 된 거래를 통해 거래 플랫폼 운영을 제로 위험, 테스트 거래 전략, 정서적 제어를 실천하며 레버리지 사용에 익숙해 질 수 있습니다. Binance, Ouyi 및 Sesame Open Door와 같은 거래소는 모두 시뮬레이션 된 거래 플랫폼을 제공하며 Tradingview 및 Metatrader와 같은 소프트웨어도 유사한 기능을 제공합니다. 시뮬레이션 된 거래는 거래 기술을 효과적으로 향상시킬 수 있지만, 당신은 그들과 실제 거래의 차이점에주의를 기울이고 신중하고 과신하지 않아야합니다. 이 기사는 시뮬레이션 트랜잭션의 장점, 사용 방법 및 예방 조치를 상세하게 소개하여 암호 화폐 시장을 안정화시키는 데 도움이됩니다.

베테랑 cryptocurrency 파생 상품 거래 플랫폼으로서 공식 웹 사이트 입학의 정확성이 중요합니다. Phishing 웹 사이트로 인해 가짜 웹 사이트로의 오해 입력은 도난과 자금 손실로 이어질 수 있습니다. 이 기사는 사용자가 Bitmex 공식 웹 사이트에 안전하게 액세스하고 신뢰할 수있는 cryptocurrency 정보 플랫폼 (예 : CoinmarketCap, Coingecko), 공식 소셜 미디어, 기존 주소 검증 및 공식 지원 채널의 검증, 2 인용 검증, 정기적 인 암호 변경 및 보안 소프트웨어의 사용을 강조하여 사용자에게 영향을 미치고 보안을 피할 수 있도록 강조합니다.

Gate.io Open Exchange 앱 다운로드 안내서 :이 기사는 언제 어디서나 암호 화폐를 거래하는 데 도움이되는 공식 Gate.io Exchange 앱 다운로드 방법을 설명합니다. Gate.io App은 편의성, 우수한 사용자 경험, 포괄적 인 기능 (스팟, 계약, 레버리지, 재무 관리 등) 및 강력한 보안의 장점을 가지고 있으며 실시간 시장 정보를 제공합니다. 안전을 보장하려면 Gate.io의 공식 웹 사이트에서 앱을 다운로드하여 맬웨어 다운로드를 피하십시오. 이 기사는 공식 웹 사이트 다운로드 단계와 iOS 및 Android 설치 절차를 자세히 소개하고 Gate.io 앱을 신속하게 시작하고 안전하고 편리한 Cryptocurrency 거래 여정을 시작하는 데 도움이되는 자주 묻는 질문 및 보안 제안을 제공합니다.

이 기사에서는 언제 어디서나 암호 화폐를 거래하는 데 도움이되는 공식 Gate.io (Sesame Open Door) Exchange 앱을 다운로드하는 방법을 소개합니다. Gate.io 앱의 장점은 편의성, 원활한 사용자 경험, 포괄적 인 거래 기능 (STON, 계약, 레버리지, 재무 관리 등) 및 강력한 보안이며 실시간 시장 정보를 제공합니다. 이 기사는 Android 및 iOS 시스템의 설치 방법을 포함하여 공식 웹 사이트를 통해 앱을 다운로드하는 단계에 대해 자세히 설명하고 공식 채널에서 맬웨어를 피하기 위해 다운로드하는 것의 중요성을 강조합니다. 또한이 기사는 자주 묻는 질문 및 보안 제안을 제공하여 사용자가 다운로드 및 설치를 원활하게 작성하고 계정 보안을 보장 할 수 있도록 도와줍니다. cryptocurrency 투자 여행을 시작하려면 gate.io를 선택하십시오!
