Detaillierte Einführung, wie PHP+JavaScript Webinhalte crawlt-PHP-Tutorial-php.cn

Inhaltsverzeichnis

php +js crawlt Webinhalte – Schauen wir uns zunächst den Effekt an

Zuerst benötigen wir PHP, um eine Anfrage zu simulieren, um den HTML-Code der gesamten Website abzurufen

Hinweis: Wenn ein file_get_contents-Fehler auftritt, versuchen Sie bitte, extension=php_openssl zu finden .dll in php.ini Es ist in Ordnung, es zu aktivieren

Dann erhält das Frontend die Daten zur Verarbeitung

Nachdem wir den HTML-Code erhalten haben, können wir tun, was wir wollen.

Wie verwendet man diesen HTML-Code? Ist das ein Problem? Nein

Heim

Backend-Entwicklung

PHP-Tutorial

Detaillierte Einführung, wie PHP+JavaScript Webinhalte crawlt

零到壹度

Apr 11, 2018 pm 05:27 PM

网页

Der Inhalt dieses Artikels ist eine detaillierte Einführung in die Art und Weise, wie PHP+JavaScript Webinhalte crawlt. Er hat einen gewissen Referenzwert.

php +js crawlt Webinhalte – Schauen wir uns zunächst den Effekt an

Detaillierte Einführung, wie PHP+JavaScript Webinhalte crawlt

Wie geht das?

Wir haben immer gedacht, dass nur Python Webinhalte crawlen kann. Das liegt daran, dass Python selbst über viele Bibliotheken verfügt, die zum Crawlen von Webseiten sehr praktisch sind Wir erhalten die Webinhalte, die wir wollen, und es muss nicht kompliziert sein.

Zuerst benötigen wir PHP, um eine Anfrage zu simulieren, um den HTML-Code der gesamten Website abzurufen

  // 允许所有域访问
  header("Access-Control-Allow-Origin: *");
  / 接收一个参数，参数名叫parm
  $parm=$_GET[&#39;mod&#39;];
  if (empty($parm)) {  
    $url = &#39;http://m.80s.tw/&#39;;//Detaillierte Einführung, wie PHP+JavaScript Webinhalte crawlt
    $html = file_get_contents($url);
}else{  
  $url = &#39;http://m.80s.tw/&#39;.$parm;    
  $html = file_get_contents($url);
} 
    preg_match("/<body[^>]*?>(.*\s*?)<\/body>/is",$html,$match1);//正则匹配body里面的内容
    echo $match1[0];//输出网页

Nach dem Login kopieren

Hinweis: Wenn ein file_get_contents-Fehler auftritt, versuchen Sie bitte, extension=php_openssl zu finden .dll in php.ini Es ist in Ordnung, es zu aktivieren

Dann erhält das Frontend die Daten zur Verarbeitung

Schreiben Sie zuerst eine asynchrone Anfrage

$.ajax({ 
        type:&#39;get&#39;,
        url: &#39;.././admin/test.php&#39;,
        success: function(data) {
        console.log(data)//可以看到获取的HTML，很简单吧，很兴奋吧
        }
    });

Nach dem Login kopieren

Nachdem wir den HTML-Code erhalten haben, können wir tun, was wir wollen.

Wie verwendet man diesen HTML-Code? Ist das ein Problem? Nein

        //首先创建一个容器
        var p = document.createElement(&#39;p&#39;);        
        // 把整个html的字符串存到这个p节点里
        p.innerHTML = data;        
        //然后就可以对p一顿检查了
        //比如获取类list_mov_title下所有的a标签
        var list = p.querySelectorAll(&#39;.list_mov_title a&#39;);        
        //赶紧打印出来看一下
        console.log(list)        
        //想要的东西都在吧
        //然后就把想要的东西往自己的页面里面塞吧

Nach dem Login kopieren

Dies ist das Ende eines Tutorials zum Crawlen von Webinhalten. Wenn Sie es nicht verstehen, hinterlassen Sie bitte eine Nachricht

Das obige ist der detaillierte Inhalt vonDetaillierte Einführung, wie PHP+JavaScript Webinhalte crawlt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Repo: Wie man Teamkollegen wiederbelebt

1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Wie lange dauert es, um Split Fiction zu schlagen?

3 Wochen vor By DDD

R.E.P.O. Dateispeicherspeicherort: Wo ist es und wie schützt sie?

3 Wochen vor By DDD

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7342

Java-Tutorial

1627

CakePHP-Tutorial

1352

Laravel-Tutorial

1265

PHP-Tutorial

1210

Related knowledge

CakePHP-Projektkonfiguration Sep 10, 2024 pm 05:25 PM

In diesem Kapitel werden wir die Umgebungsvariablen, die allgemeine Konfiguration, die Datenbankkonfiguration und die E-Mail-Konfiguration in CakePHP verstehen.

PHP 8.4 Installations- und Upgrade-Anleitung für Ubuntu und Debian Dec 24, 2024 pm 04:42 PM

PHP 8.4 bringt mehrere neue Funktionen, Sicherheitsverbesserungen und Leistungsverbesserungen mit einer beträchtlichen Menge an veralteten und entfernten Funktionen. In dieser Anleitung wird erklärt, wie Sie PHP 8.4 installieren oder auf PHP 8.4 auf Ubuntu, Debian oder deren Derivaten aktualisieren. Obwohl es möglich ist, PHP aus dem Quellcode zu kompilieren, ist die Installation aus einem APT-Repository wie unten erläutert oft schneller und sicherer, da diese Repositorys in Zukunft die neuesten Fehlerbehebungen und Sicherheitsupdates bereitstellen.

CakePHP Datum und Uhrzeit Sep 10, 2024 pm 05:27 PM

Um in cakephp4 mit Datum und Uhrzeit zu arbeiten, verwenden wir die verfügbare FrozenTime-Klasse.

CakePHP-Datei hochladen Sep 10, 2024 pm 05:27 PM

Um am Datei-Upload zu arbeiten, verwenden wir den Formular-Helfer. Hier ist ein Beispiel für den Datei-Upload.

CakePHP-Routing Sep 10, 2024 pm 05:25 PM

In diesem Kapitel lernen wir die folgenden Themen im Zusammenhang mit dem Routing kennen.

Besprechen Sie CakePHP Sep 10, 2024 pm 05:28 PM

CakePHP ist ein Open-Source-Framework für PHP. Es soll die Entwicklung, Bereitstellung und Wartung von Anwendungen erheblich vereinfachen. CakePHP basiert auf einer MVC-ähnlichen Architektur, die sowohl leistungsstark als auch leicht zu verstehen ist. Modelle, Ansichten und Controller gu

So richten Sie Visual Studio-Code (VS-Code) für die PHP-Entwicklung ein Dec 20, 2024 am 11:31 AM

Visual Studio Code, auch bekannt als VS Code, ist ein kostenloser Quellcode-Editor – oder eine integrierte Entwicklungsumgebung (IDE) –, die für alle gängigen Betriebssysteme verfügbar ist. Mit einer großen Sammlung von Erweiterungen für viele Programmiersprachen kann VS Code c

CakePHP erstellt Validatoren Sep 10, 2024 pm 05:26 PM

Der Validator kann durch Hinzufügen der folgenden zwei Zeilen im Controller erstellt werden.

See all articles