PHP爬取糗事百科首页糗事
PHP爬取糗事百科首页糗事
突然想获取一些网上的数据来玩玩,因为有SAE的MySql数据库,让它在那呆着没有什么卵用!于是就开始用PHP编写一个爬取糗事百科首页糗事的小程序,数据都保存在MySql中,岂不是很好玩!
说干就干!首先确定思路
获取HTML源码--->解析HTML--->保存到数据库
没有什么难的
1、创建PHP文件“getDataToDB.php”,
2、获取指定URL的HTML源码
这里我用的是curl函数,详细内容参见PHP手册
代码为
<span new="" style="font-family:Times">// 获取对应链接的HTMLCODE function GetHtmlCode($url) { $ch = curl_init (); // 初始化一个cur对象 curl_setopt ( $ch, CURLOPT_URL, $url ); // 设置需要抓取的网页 curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, 1 ); // 设置crul参数,要求结果保存到字符串中还是输出到屏幕上 curl_setopt ( $ch, CURLOPT_CONNECTTIMEOUT, 1000 ); // 设置链接延迟 $HtmlCode = curl_exec ( $ch ); // 运行curl,请求网页 return $HtmlCode; }</span>
这里我没有能力使用正则表达式,就在网上海搜,终于找到这个,就像Java使用Jsoup(使用Jsoup解析滁州学院官网获取新闻列表)一样,具体参见BLOG
代码如下
<span new="" style="font-family:Times">function getFmlDataToDB() { $link = mysql_connect ( SAE_MYSQL_HOST_M . ':' . SAE_MYSQL_PORT, SAE_MYSQL_USER, SAE_MYSQL_PASS ); // 获取源码 $html = str_get_html ( GetHtmlCode ( http://www.qiushibaike.com/ ) ); if ($link) { mysql_select_db ( SAE_MYSQL_DB, $link ); mysql_query ( 'set names utf8' ); // class=article block untagged mb15 foreach ( $html->find ( 'div[class=article block untagged mb15]' ) as $per ) { $z = null; $t = null; $w = null; $d = null; $p = null; $ds = null; $ps = null; // //作者 $author = $per->find ( 'div[class=author]' ); if ($author != null) { $a = $author [0]->find ( 'a' ); $z = $a [1]->innertext; } else { $z = 'no author'; } // 头像链接 if ($author != null) { $icon = $author [0]->find ( 'a' ); $t = $icon [0]->src->innertext; } else { $t = '...............'; } // 文章内容 $content = $per->find ( 'div[class=content]' ); $w = $content [0]->innertext; // 点赞数 $vote1 = $per->find ( 'div[class=stats]' ); $vote2 = $vote1 [0]->find ( 'span[class=stats-vote]' ); $vote3 = $vote2 [0]->find ( 'i[class=number]' ); $d = $vote3 [0]->innertext; // 评论数 $comments1 = $vote1 [0]->find ( 'span[class=stats-comments]' ); $comments2 = $comments1 [0]->find ( 'a[class=qiushi_comments]' ); $comments3 = $comments2 [0]->find ( 'i[class=number]' ); $p = $comments3 [0]->innertext; // 顶 数 $up_down = $per->find ( 'div[class=stats-buttons bar clearfix]' ); $up_down1 = $up_down [0]->find ( 'ul' ); $li = $up_down1 [0]->find ( 'li' ); $up = $li [0]->find ( 'span[class=number hidden]' ); $ds = $up [0]->innertext; // 拍 数 $down = $li [1]->find ( 'span[class=number hidden]' ); $ps = $down [0]->innertext; } } else { echo '数据库链接KO'; } }</span>
4、创建数据库,将数据插入到数据库中
这里我使用的SAE中的MySQL,具体的连接方发参见使用PHP连接SAE中的MySql数据库
需要注意的就是编码格式,区要在执行语句前加上这样一句话
<span style="font-family:Microsoft">mysql_query ( 'set names utf8' );</span>
<span style="font-family:Microsoft"> $sql = INSERT INTO `app_bmhjqs`.`db_fml` (`id`, `author`, `icon_url`, `content`, `vote`, `comments`, `up`, `down`) VALUES (NULL, '$z', '$t', '$w', '$d', '$p', '$ds', '$ps');; // 解决乱码 mysql_query ( 'set names utf8' ); $result = mysql_query ( $sql );</span>
这样一来,获取--->解析--->插入就完成了,效果就是运行一次PHP文件,数据库就添加了糗事百科首页上的糗事!我想可不可以写个定时器,每隔一定时间就运行一次代码,这一点在java我可以实现,在php我不会,毕竟是个没长毛的小鸟!百度吧。。。搜到这样的写法
<span new="" style="font-family:Times">// 定时器 // ignore_user_abort (); // run script. in background // set_time_limit ( 0 ); // run script. forever // $interval = 30; // do every 15 minutes.. // do { // echo date ( 'Y-m-d H:i:s', time () ); // echo '写入数据库'; // //getFmlDataToDB (); // } while ( true );</span>
今天早上,我迫不及待的打开电脑,打开SAE数据库,情况如下:
额滴神!受不鸟了,赶紧把定时器关掉了,写了个按钮触发事件!这样下去,数据库会被挤满的!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Wie richte ich die Google Chrome-Startseite ein? Google Chrome ist heute die beliebteste Webbrowser-Software. Bei der Verwendung von Browsern haben verschiedene Benutzer unterschiedliche Einstellungspräferenzen. Der Browser ist als Standard-Startseite festgelegt. Und manche Leute legen die Startseite gerne wie andere Suchmaschinen fest. Wo sollte sie also eingestellt werden? Als Nächstes zeigt Ihnen der Editor eine schnelle Methode zum Einrichten der Startseite von Google Chrome. Ich hoffe, dass sie Ihnen hilfreich sein kann. So richten Sie schnell die Google Chrome-Startseite ein: 1. Öffnen Sie Google Chrome (wie im Bild gezeigt). 2. Klicken Sie auf die Menüschaltfläche in der oberen rechten Ecke der Benutzeroberfläche (wie im Bild gezeigt). 3. Wählen Sie die Option „Einstellungen“ (wie im Bild gezeigt). 4. Suchen Sie im Einstellungsmenü nach „Suchmaschine“ (z. B

Was soll ich tun, wenn sich die Google Chrome-Startseite auf 360 ändert? Google Chrome ist ein einfacher und praktischer Browser, aber viele Freunde stellen fest, dass die einfache Startseite während der Nutzung durch eine 360-Grad-Startseite ersetzt wurde. Wenn sie ihren ursprünglichen Stil wiederherstellen möchten, wie sollte sie eingestellt werden? Nachfolgend zeigt Ihnen der Editor, wie Sie die Google Chrome-Startseite wiederherstellen. Lösung: 1. Öffnen Sie zunächst Google Chrome. 2. Wenn Sie die Standardeinstellung ändern möchten, klicken Sie auf die drei Punkte in der oberen rechten Ecke. 3. Klicken Sie auf [Einstellungen], um die Einstellungsseite zu öffnen. 4. Klicken Sie auf [Starten]. 5. Wie im Bild gezeigt, [Eine bestimmte Webseite oder eine Gruppe von Webseiten öffnen] ist hier die URL von 360 Navigation. 6. Klicken Sie auf die drei Punkte auf der rechten Seite der 360-Navigation. 7. Klicken Sie auf [Entfernen].

UniApp-Design- und Entwicklungsmethode für Homepage und Navigationsseite 1. Einführung UniApp ist ein plattformübergreifendes Entwicklungstool, das auf dem Vue.js-Framework basiert und eine Reihe von Codes kompilieren kann, um Anwendungen für mehrere Plattformen zu erstellen. In UniApp sind die Homepage und die Navigationsseite zwei notwendige Seiten bei der Entwicklung von Anwendungen. In diesem Artikel wird erläutert, wie diese beiden Seiten in UniApp entworfen und entwickelt werden, und es werden entsprechende Codebeispiele bereitgestellt. 2. Homepage-Design und Entwicklungsmethode Seitenstruktur Die Homepage von UniApp umfasst im Allgemeinen eine Titelleiste, ein Karussell und Kategorien.

Methoden, um von HTML-Unterseiten zur Startseite zurückzukehren: 1. Verwenden Sie Hyperlinks. 2. Verwenden Sie JavaScript. 3. Verwenden Sie den Browserverlauf. Ausführliche Einführung: 1. Verwenden Sie Hyperlinks, fügen Sie einen Hyperlink auf der Unterseite hinzu, verlinken Sie ihn mit der URL der Startseite, fügen Sie unten auf der Unterseite oder in der Navigationsleiste einen Link „Zurück zur Startseite“ hinzu. Verwenden Sie das Tag „<a>“, um einen Hyperlink zu erstellen, und setzen Sie das Attribut „href“ auf die URL der Homepage. 2. Verwenden Sie JavaScript, um die Funktion der Rückkehr zur Homepage über JavaScript-Code usw. zu implementieren.

„Adventure Treasure Hunt and Defeat the Demon King“ ist ein schurkenhaftes Kriegsschachspiel mit Western-Fantasy-Hintergrund. Neue Spieler sind beim Betreten auf viele Probleme gestoßen. Als nächstes bringt Ihnen der Editor eine Freigabeliste der vier Homepage-NPC-Funktionen in „Abenteuer Schatzsuche und Besiege den Dämonenkönig“. Abenteuer-Schatzsuche und dann den Teufel besiegen. Stellen Sie die Funktionen der 4 Homepage-NPCs vor: 1. Abenteuergruppe: Upgrade der Abenteuergruppe, Upgrade der Obergrenze der Ausrüstung (Rucksack). , denken Sie daran, einige Abfallgeräte aufzuräumen, da sie sonst den Platz im Raster belegen) und die Obergrenze der Zeichenanzahl erhöht wird (es gibt zunächst nur 8 Zeichenplätze, und goldene Zeichen können diese überschreiten). 2. Trainer : Charaktere trainieren (Lila und Gold können trainiert werden), upgraden

Wie richte ich die 360-Browser-Homepage ein? 360 Browser ist eine sehr sichere Webbrowser-Software. Viele Benutzer verwenden diesen Browser sehr gerne für die Arbeit Diese Homepage, und viele Benutzer bevorzugen eine einfachere Homepage. Wie richten wir also die Homepage von 360 Browser ein? Als nächstes stellt Ihnen der Redakteur vor, wie Sie die 360-Browser-Homepage einrichten. Einführung in die Einrichtung der Startseite von 360 Browser 1. Zuerst müssen Sie die Hauptoberfläche von 360 Secure Browser aufrufen (wie im Bild gezeigt). 2. Klicken Sie auf die Option „Drei Streifen“ in der oberen rechten Ecke und dann auf die Option „Einstellungen“, die im Dropdown-Menü erscheint, um die Einstellungsoberfläche aufzurufen.

So gestalten Sie ein Java-Switch-Einkaufssystem mit Karussellfunktion auf der Homepage. Mit der Entwicklung des Internets ändern sich auch die Lebensstile der Menschen ständig. Immer mehr Menschen entscheiden sich dafür, online einzukaufen, auch Lebensmittel. Um den Bedürfnissen der Nutzer gerecht zu werden, haben viele Lebensmitteleinkaufsplattformen die Funktion der Online-Bestellung von Lebensmitteln eingeführt. Auf diesen Plattformen ist das Homepage-Karussell eine der sehr wichtigen Funktionen. In diesem Artikel wird erläutert, wie Sie ein Java-Switch-Lebensmitteleinkaufssystem mit einer Karussellfunktion auf der Homepage entwerfen. 1. Analyse der funktionalen Anforderungen Bevor wir die Karussellfunktion der Startseite entwerfen, müssen wir sie analysieren und verstehen

Die Antwort auf die Naturkunde-Enzyklopädie Si Ling Shui Yuan ist eine Antwort-Herausforderung in der Naturgeschichte-Enzyklopädie im Spiel. Was ist also die Antwort auf diese Antwort-Herausforderung? Heute hat der Herausgeber die Antworten auf die Fragen in dieser Enzyklopädie der Naturgeschichte für jedermann zusammengestellt und Ihnen den detaillierten Ort der Antworten bereitgestellt, damit Sie die Herausforderung der Beantwortung der Fragen in dieser Enzyklopädie der Naturgeschichte besser meistern können Den detaillierten Inhalt finden Sie in diesem Artikel. Werfen wir einen Blick auf die Enzyklopädie der Naturgeschichte und die Antworten auf alle Fragen und Antworten zu Si Ling Shui Yuan. Leitfaden zur Beantwortung von Fragen in der Enzyklopädie des Condor-Museums Si Ling Shui Yuan 1. Kommen Sie zuerst zu dem Ort, wie im Bild unten gezeigt. 2. Sie können hier einen Charakter namens Meng Gong finden, sich dann mit ihm unterhalten und dann an der Frage-Antwort-Herausforderung von Silingshuiyuan teilnehmen. 1. Wer hat Lingshui Yuan gebaut? Antwort: [Wanyan Jing] 2. Der Veranstalter der Show wurde erneut verhaftet
