Heim Backend-Entwicklung PHP-Tutorial Verwenden Sie die Crawler-Komponente, um HTML in Laravel zu analysieren

Verwenden Sie die Crawler-Komponente, um HTML in Laravel zu analysieren

Aug 07, 2017 pm 05:10 PM
html laravel

In diesem Artikel wird hauptsächlich die Verwendung der Crawler-Komponente von Symfony zum Analysieren von HTML in Laravel vorgestellt.

Crawlers vollständiger Name ist DomCrawler, eine Komponente des Symfony-Frameworks. Was empörend ist, ist, dass DomCrawler keine chinesische Dokumentation hat und Symfony diesen Teil nicht übersetzt hat, sodass die Entwicklung mit DomCrawler nur Stück für Stück erkundet werden kann. Jetzt werde ich die Erfahrungen im Verwendungsprozess zusammenfassen.

Zuerst installieren Sie


composer require symfony/dom-crawler
composer require symfony/css-selector
Nach dem Login kopieren

css-seelctor ist ein CSS-Selektor. Einige Funktionen werden bei der Auswahl von Knoten verwendet css. Das im

-Handbuch verwendete Beispiel ist


use Symfony\Component\DomCrawler\Crawler;
$html = <<<‘HTML‘
Hello World!
Hello Crawler!
HTML;
$crawler = new Crawler($html);
foreach ($crawler as $domElement)
{
var_dump($domElement->nodeName);
}
Nach dem Login kopieren

und das gedruckte Ergebnis ist


string ‘html‘ (length=4)
Nach dem Login kopieren

Da der Knotenname dieses HTML-Codes html ist und mein Englisch nicht gut ist, dachte ich, das Programm sei falsch, als ich anfing, es zu verwenden. . .

Wenn im tatsächlichen Verwendungsprozess der neue Crawler ($html) verstümmelte Zeichen aufweist, sollte dies mit der Seitencodierung zusammenhängen. Sie können also die folgende Methode verwenden: Initialisieren Sie zuerst den Crawler und fügen Sie dann den Knoten < hinzu 🎜>


$crawler = new Crawler();
$crawler->addHtmlContent($html);
Nach dem Login kopieren
Der zweite Parameter von addHtmlContent ist der Zeichensatz und der Standardwert ist utf-8.

Weitere Beispiele finden Sie in der offiziellen Dokumentation: http://symfony.com/doc/current/components/dom_crawler.html

Notieren Sie die Verwendungen, die Sie bei der Arbeit ausprobieren

filterXPath(string $xpath) Methode, laut Handbuch ist der Parameter dieser Methode $xpath, und p, p und andere Blöcke werden häufig verwendet.


echo $crawler->filterXPath(‘//body/p‘)->text();
echo $crawler->filterXPath(‘//body/p‘)->last()->text();
Nach dem Login kopieren
Die Ausgabe ist der Text des ersten und nächsten p-Tag-Blocks


var_dump($crawler->filterXPath(‘//body‘)->html());
Nach dem Login kopieren
Der Ausgabe Der HTML-


foreach ($crawler->filterXPath(‘//body/p‘) as $i => $node) {
$c = new Crawler($node);
echo $c->filter(‘p‘)->text();
}
Nach dem Login kopieren
filterXPath im Körper erhält ein Array von DOMElement-Blöcken. Jeder DOMElement-Block kann ein neues Crawler-Objekt verwenden, um mit der Analyse fortzufahren


$nodeValues =
$crawler->filterXPath(‘//body/p‘)->each(function (Crawler $node, $i) {
return $node->text();
});
Nach dem Login kopieren
Crawler stellt jede Schleife bereit und verwendet Abschlussfunktionen, um den Code zu vereinfachen. Bitte beachten Sie jedoch, dass diese Art des Schreibens von $nodeValues ​​zu einem Array führt, das eine weitere Verarbeitung erfordert.

Andere Verwendungen


echo $crawler->filterXPath(‘//body/p‘)->attr(‘class‘);
Nach dem Login kopieren
können den Wert des Klassenattributs erhalten, das dem ersten entspricht p-Tag „Nachricht“


$crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a‘)->attr(‘href‘);
$crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a>img‘)->extract(array(‘alt‘, ‘href‘))
Nach dem Login kopieren
Die oben genannten Methoden zum Abrufen von Tag-Attributen

filter unterscheidet sich von filterXPath Im Handbuch heißt es CSS-Selektor, Ich verstehe nicht, dass es sich um ein im XPath-Knoten enthaltenes Element wie p handelt. Die spezifische Situation muss in der tatsächlichen Entwicklung ausprobiert werden.

Generell habe ich das Gefühl, dass DomCrawler einfacher zu verwenden ist als einfaches HTML-Dom, vielleicht liegt es daran, dass ich es einfacher verwende.

Die oben genannten sind nur die Grundfunktionen von Crawler. Weitere Informationen zur Verwendung finden Sie in den Funktionen im Crawler-Teil des Symfony-Handbuchs

http://api.symfony.com/3.2 /Symfony/Component/DomCrawler/Crawler .html

Das Hauptproblem bei Crawler besteht darin, dass es zu wenige Anwendungsbeispiele im Funktionshandbuch gibt, sodass Sie es nur in der tatsächlichen Verwendung erkunden können. . . .

Symfonys Dokumentation zu DomCrawler, die einige Beispiele enthält

http://symfony.com/doc/current/components/dom_crawler.html

Das obige ist der detaillierte Inhalt vonVerwenden Sie die Crawler-Komponente, um HTML in Laravel zu analysieren. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Tabellenrahmen in HTML Tabellenrahmen in HTML Sep 04, 2024 pm 04:49 PM

Anleitung zum Tabellenrahmen in HTML. Hier besprechen wir verschiedene Möglichkeiten zum Definieren von Tabellenrändern anhand von Beispielen für den Tabellenrand in HTML.

Verschachtelte Tabelle in HTML Verschachtelte Tabelle in HTML Sep 04, 2024 pm 04:49 PM

Dies ist eine Anleitung für verschachtelte Tabellen in HTML. Hier diskutieren wir anhand der entsprechenden Beispiele, wie man eine Tabelle innerhalb der Tabelle erstellt.

HTML-Rand links HTML-Rand links Sep 04, 2024 pm 04:48 PM

Anleitung zum HTML-Rand links. Hier besprechen wir einen kurzen Überblick über HTML margin-left und seine Beispiele sowie seine Code-Implementierung.

HTML-Tabellenlayout HTML-Tabellenlayout Sep 04, 2024 pm 04:54 PM

Leitfaden zum HTML-Tabellenlayout. Hier besprechen wir die Werte des HTML-Tabellenlayouts zusammen mit den Beispielen und Ausgaben im Detail.

HTML-geordnete Liste HTML-geordnete Liste Sep 04, 2024 pm 04:43 PM

Leitfaden zur HTML-geordneten Liste. Hier besprechen wir auch die Einführung von HTML-geordneten Listen und Typen sowie deren Beispiele

Text in HTML verschieben Text in HTML verschieben Sep 04, 2024 pm 04:45 PM

Anleitung zum Verschieben von Text in HTML. Hier besprechen wir eine Einführung, wie Marquee-Tags funktionieren, mit Syntax und Beispielen für die Implementierung.

HTML-Eingabeplatzhalter HTML-Eingabeplatzhalter Sep 04, 2024 pm 04:54 PM

Leitfaden für HTML-Eingabeplatzhalter. Hier besprechen wir die Beispiele für HTML-Eingabeplatzhalter zusammen mit den Codes und Ausgaben.

Wie analysiert und verarbeitet man HTML/XML in PHP? Wie analysiert und verarbeitet man HTML/XML in PHP? Feb 07, 2025 am 11:57 AM

Dieses Tutorial zeigt, wie XML -Dokumente mit PHP effizient verarbeitet werden. XML (Extensible Markup-Sprache) ist eine vielseitige textbasierte Markup-Sprache, die sowohl für die Lesbarkeit des Menschen als auch für die Analyse von Maschinen entwickelt wurde. Es wird üblicherweise für die Datenspeicherung ein verwendet und wird häufig verwendet

See all articles