Detaillierte Einführung, wie PHP+JavaScript Webinhalte crawlt
Der Inhalt dieses Artikels ist eine detaillierte Einführung in die Art und Weise, wie PHP+JavaScript Webinhalte crawlt. Er hat einen gewissen Referenzwert.
php +js crawlt Webinhalte – Schauen wir uns zunächst den Effekt an
Wie geht das?
Wir haben immer gedacht, dass nur Python Webinhalte crawlen kann. Das liegt daran, dass Python selbst über viele Bibliotheken verfügt, die zum Crawlen von Webseiten sehr praktisch sind Wir erhalten die Webinhalte, die wir wollen, und es muss nicht kompliziert sein.
Zuerst benötigen wir PHP, um eine Anfrage zu simulieren, um den HTML-Code der gesamten Website abzurufen
// 允许所有域访问 header("Access-Control-Allow-Origin: *"); / 接收一个参数,参数名叫parm $parm=$_GET['mod']; if (empty($parm)) { $url = 'http://m.80s.tw/';//Detaillierte Einführung, wie PHP+JavaScript Webinhalte crawlt $html = file_get_contents($url); }else{ $url = 'http://m.80s.tw/'.$parm; $html = file_get_contents($url); } preg_match("/<body[^>]*?>(.*\s*?)<\/body>/is",$html,$match1);//正则匹配body里面的内容 echo $match1[0];//输出网页
Hinweis: Wenn ein file_get_contents-Fehler auftritt, versuchen Sie bitte, extension=php_openssl zu finden .dll in php.ini Es ist in Ordnung, es zu aktivieren
Dann erhält das Frontend die Daten zur Verarbeitung
Schreiben Sie zuerst eine asynchrone Anfrage
$.ajax({ type:'get', url: '.././admin/test.php', success: function(data) { console.log(data)//可以看到获取的HTML,很简单吧,很兴奋吧 } });
Nachdem wir den HTML-Code erhalten haben, können wir tun, was wir wollen.
Wie verwendet man diesen HTML-Code? Ist das ein Problem? Nein
//首先创建一个容器 var p = document.createElement('p'); // 把整个html的字符串存到这个p节点里 p.innerHTML = data; //然后就可以对p一顿检查了 //比如获取类list_mov_title下所有的a标签 var list = p.querySelectorAll('.list_mov_title a'); //赶紧打印出来看一下 console.log(list) //想要的东西都在吧 //然后就把想要的东西往自己的页面里面塞吧
Dies ist das Ende eines Tutorials zum Crawlen von Webinhalten. Wenn Sie es nicht verstehen, hinterlassen Sie bitte eine Nachricht
Das obige ist der detaillierte Inhalt vonDetaillierte Einführung, wie PHP+JavaScript Webinhalte crawlt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

In diesem Kapitel werden wir die Umgebungsvariablen, die allgemeine Konfiguration, die Datenbankkonfiguration und die E-Mail-Konfiguration in CakePHP verstehen.

PHP 8.4 bringt mehrere neue Funktionen, Sicherheitsverbesserungen und Leistungsverbesserungen mit einer beträchtlichen Menge an veralteten und entfernten Funktionen. In dieser Anleitung wird erklärt, wie Sie PHP 8.4 installieren oder auf PHP 8.4 auf Ubuntu, Debian oder deren Derivaten aktualisieren. Obwohl es möglich ist, PHP aus dem Quellcode zu kompilieren, ist die Installation aus einem APT-Repository wie unten erläutert oft schneller und sicherer, da diese Repositorys in Zukunft die neuesten Fehlerbehebungen und Sicherheitsupdates bereitstellen.

Um in cakephp4 mit Datum und Uhrzeit zu arbeiten, verwenden wir die verfügbare FrozenTime-Klasse.

Um am Datei-Upload zu arbeiten, verwenden wir den Formular-Helfer. Hier ist ein Beispiel für den Datei-Upload.

In diesem Kapitel lernen wir die folgenden Themen im Zusammenhang mit dem Routing kennen.

CakePHP ist ein Open-Source-Framework für PHP. Es soll die Entwicklung, Bereitstellung und Wartung von Anwendungen erheblich vereinfachen. CakePHP basiert auf einer MVC-ähnlichen Architektur, die sowohl leistungsstark als auch leicht zu verstehen ist. Modelle, Ansichten und Controller gu

Visual Studio Code, auch bekannt als VS Code, ist ein kostenloser Quellcode-Editor – oder eine integrierte Entwicklungsumgebung (IDE) –, die für alle gängigen Betriebssysteme verfügbar ist. Mit einer großen Sammlung von Erweiterungen für viele Programmiersprachen kann VS Code c

Der Validator kann durch Hinzufügen der folgenden zwei Zeilen im Controller erstellt werden.
