


So crawlen Sie Baidu-Seiten und entsprechende Zeichenfolgen in PHP
Dieser Artikel stellt hauptsächlich die PHP-Methode zum Erhalten von Baidu-Wörtern und Baidu-Snapshots vor. Er analysiert die Techniken von PHP zum Erfassen von Baidu-Seiten und zeigt Beispiele für die entsprechende Zeichenfolge an es kann darauf verweisen.
Das Beispiel in diesem Artikel beschreibt, wie man Baidu, Baidu-Hotwords und Baidu-Snapshots in PHP erhält. Die Details sind wie folgt:
Werden Sie in Baidu aufgenommen:
<?php /* 抓取百度收录代码 */ function baidu($s){ $baidu="http://www.baidu.com/s?wd=site%3A".$s; $site=file_get_contents($baidu); //$site=iconv("gb2312", "UTF-8", $site); ereg("找到相关网页(.*)篇,", $site,$count); $count=str_replace("找到相关网页","",$count); $count=str_replace("篇,","",$count); $count=str_replace("约","",$count); $count=str_replace(",","",$count); return $count[0]; } echo baidu(www.jb51.net); //获取脚本之家在百度中的收录数量 ?>
Holen Sie sich Baidus heiße Worte
<?php /** * @return array 返回百度的热词数据(数组返回) */ function getBaiduHotKeyWord() { $templateRss = file_get_contents('http://top.baidu.com/rss_xml.php?p=top10'); if (preg_match('/<table>(.*)<\/table>/is', $templateRss, $_description)) { $templateRss = $_description [0]; $templateRss = str_replace("&", "&", $templateRss); } $templateRss = "<?xml version=1.0 encoding=GBK?>" . $templateRss; $xml = @simplexml_load_String($templateRss); foreach ($xml->tbody->tr as $temp) { if (!empty ($temp->td->a)) { $keyArray [] = trim(($temp->td->a)); } } return $keyArray; } print_r(getBaiduHotKeyWord());
Das habe ich online gefunden und wurde leicht modifiziert. Schreiben Sie den folgenden Code in die PHP-Datei
Baidu enthalten und Baidu-Snapshot-Zeit
<?php $domain = "//www.jb51.net/"; *欲查询的域名*/ $site_url = 'http://www.baidu.com/s?wd=site%3A'; $all = $site_url.$domain; /*域名所有收录的网址*/ $today = $all.'&lm=1'; /*域名今日收录的网址*/ $utf_pattern = "/找到相关结果数(.*)个/"; $kz_pattern = "/<span class="g">(.*)</span>/"; /*用以匹配快照日期的字符串*/ $times = "/d{4}-d{1,2}-d{1,2}/"; /*匹配快照日期的正则表达式,如:2011-8-4*/ $s0 = @file_get_contents($all); /*将site:www.jb51.net的网页置入$s0字符串中*/ $s1 = @file_get_contents($today); preg_match($utf_pattern,$s0,$all_num); /*匹配"找到相关结果数*个"*/ preg_match($utf_pattern,$s1,$today_num); preg_match($kz_pattern,$s0,$temp); preg_match($times,$temp[0],$screenshot); if($all_num[1] == "") $all_num[1] = 0; if($today_num[1] == "") $today_num[1] = 0; if($screenshot[0] == "") $screenshot[0] = "暂无快照"; ?> <html> <head> <title>Test</title> </head> <body> <table> <tr> <td>日期</td><td>百度收录</td><td>百度今日收录</td><td>百度快照日期</td> </tr> <tr> <td><?php echo date('m月d日G时');?> </td><td> <?php echo $all_num[1]; ?></td><td> <?php echo $today_num[1]; ?></td><td> <?php echo $screenshot[0]; ?></td> </tr> </table> <p>百度收录:<a href="<?php echo $all; ?>" target="_blank"> <?php echo $all_num[1]; ?></a></p> <p>百度今日收录:<a href="<?php echo $today; ?>" target="_blank"> <?php echo $today_num[1]; ?></a></p> <p>百度快照日期:<a href="<?php echo $all; ?>"> <?php echo $screenshot[0]; ?></a></p> </body> </html>
Zusammenfassung: Das Obige ist der gesamte Inhalt dieses Artikels, ich hoffe, er wird für das Studium aller hilfreich sein.
Verwandte Empfehlungen:
So implementieren Sie mehrdimensionales Array-Traversal und nicht festgelegtes Löschen in PHP
php Implementierung für Tipps zum Kopieren und Verschieben von Dateien
PHP-Methode zum Erfassen von Thunder VIP-Konten basierend auf der Sammlungsklasse Snoopy
Das obige ist der detaillierte Inhalt vonSo crawlen Sie Baidu-Seiten und entsprechende Zeichenfolgen in PHP. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

In diesem Kapitel werden wir die Umgebungsvariablen, die allgemeine Konfiguration, die Datenbankkonfiguration und die E-Mail-Konfiguration in CakePHP verstehen.

PHP 8.4 bringt mehrere neue Funktionen, Sicherheitsverbesserungen und Leistungsverbesserungen mit einer beträchtlichen Menge an veralteten und entfernten Funktionen. In dieser Anleitung wird erklärt, wie Sie PHP 8.4 installieren oder auf PHP 8.4 auf Ubuntu, Debian oder deren Derivaten aktualisieren. Obwohl es möglich ist, PHP aus dem Quellcode zu kompilieren, ist die Installation aus einem APT-Repository wie unten erläutert oft schneller und sicherer, da diese Repositorys in Zukunft die neuesten Fehlerbehebungen und Sicherheitsupdates bereitstellen.

Um in cakephp4 mit Datum und Uhrzeit zu arbeiten, verwenden wir die verfügbare FrozenTime-Klasse.

Um am Datei-Upload zu arbeiten, verwenden wir den Formular-Helfer. Hier ist ein Beispiel für den Datei-Upload.

In diesem Kapitel lernen wir die folgenden Themen im Zusammenhang mit dem Routing kennen.

CakePHP ist ein Open-Source-Framework für PHP. Es soll die Entwicklung, Bereitstellung und Wartung von Anwendungen erheblich vereinfachen. CakePHP basiert auf einer MVC-ähnlichen Architektur, die sowohl leistungsstark als auch leicht zu verstehen ist. Modelle, Ansichten und Controller gu

Der Validator kann durch Hinzufügen der folgenden zwei Zeilen im Controller erstellt werden.

Visual Studio Code, auch bekannt als VS Code, ist ein kostenloser Quellcode-Editor – oder eine integrierte Entwicklungsumgebung (IDE) –, die für alle gängigen Betriebssysteme verfügbar ist. Mit einer großen Sammlung von Erweiterungen für viele Programmiersprachen kann VS Code c
