在laravel使用Crawler元件對HTML進行分析-php教程-PHP中文網

首頁

後端開發

php教程

在laravel使用Crawler元件對HTML進行分析

巴扎黑

Aug 07, 2017 pm 05:10 PM

html laravel

這篇文章主要介紹了在laravel中使用Symfony的Crawler元件分析HTML,需要的朋友可以參考下

Crawler全名是DomCrawler，是Symfony框架的元件。令人髮指的是DomCrawler的沒有中文文檔，Symfony也沒有翻譯該部分，所以使用DomCrawler開發只能一點一點摸索，現將使用過程中的經驗總結。

首先是安裝

composer require symfony/dom-crawler
composer require symfony/css-selector

登入後複製

css-seelctor 是css選擇器，用css選擇節點時有些函式會用到

手冊裡面使用的例子是

use Symfony\Component\DomCrawler\Crawler;
$html = <<<‘HTML‘
Hello World!
Hello Crawler!
HTML;
$crawler = new Crawler($html);
foreach ($crawler as $domElement)
{
var_dump($domElement->nodeName);
}

登入後複製

列印的結果是

string ‘html‘ (length=4)

登入後複製

因為這段html程式碼的nodeName就是html，英文不好，開始使用的時候還以為程式錯了。。。

實際使用過程，如果new Crawler($html)會出現亂碼問題，應該是跟頁面編碼有關，所以可以採用下面的方式，先初始化crawler，然後再加入node

$crawler = new Crawler();
$crawler->addHtmlContent($html);

登入後複製

addHtmlContent的第二個參數是charset，預設是utf-8。

其他範例可以參考官方文檔，http://symfony.com/doc/current/components/dom_crawler.html

記錄工作中一點點試出來的用法

filterXPath(string $xpath) 方法，依照手冊上的說法，該方法的參數是$xpath，常用的是p，p等塊。

echo $crawler->filterXPath(‘//body/p‘)->text();
echo $crawler->filterXPath(‘//body/p‘)->last()->text();

登入後複製

輸出是第一個和下一個p標籤區塊的文字

var_dump($crawler->filterXPath(‘//body‘)->html());

登入後複製

輸出body內的html

foreach ($crawler->filterXPath(‘//body/p‘) as $i => $node) {
$c = new Crawler($node);
echo $c->filter(‘p‘)->text();
}

登入後複製

filterXPath獲得的是DOMElement區塊的數組，每個DOMElement區塊可以使用新的crawler物件繼續解析

$nodeValues =
$crawler->filterXPath(‘//body/p‘)->each(function (Crawler $node, $i) {
return $node->text();
});

登入後複製

crawler提供了each循環，使用閉包函數簡化程式碼，不過注意的是，這種寫法$nodeValues得到的是數組，需要進一步處理。

其他用法

echo $crawler->filterXPath(‘//body/p‘)->attr(‘class‘);

登入後複製

可以取得第一個p標籤對應class屬性的值「message ”

$crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a‘)->attr(‘href‘);
$crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a>img‘)->extract(array(‘alt‘, ‘href‘))

登入後複製

以上是獲得標籤屬性的一些方法

filter和filterXPath不同，手冊上寫的是css選擇器，不太明白，我理解是p這種XPath節點包含的元素，具體情況還需要在實際開發中嘗試。

總的來說感覺DomCrawler要比simple html dom好用一些，可能是我用的比較淺顯。

上述只是Crawler的基本功能，更過用法請查閱symfony手冊關於Crawler部分的函數

http://api.symfony.com/3.2/Symfony/Component/DomCrawler/Crawler .html

Crawler主要問題還是範例太少，函數手冊裡面沒有使用實例，只能在實際使用中去摸索。。。。

symfony關於DomCrawler的文檔，裡面有少數例子

http://symfony.com/doc/current/components/dom_crawler.html

以上是在laravel使用Crawler元件對HTML進行分析的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1664

CakePHP 教程

1421

Laravel 教程

1315

PHP教程

1266

C# 教程

1239

Related knowledge

HTML：結構，CSS：樣式，JavaScript：行為 Apr 18, 2025 am 12:09 AM

HTML、CSS和JavaScript在Web開發中的作用分別是：1.HTML定義網頁結構，2.CSS控製網頁樣式，3.JavaScript添加動態行為。它們共同構建了現代網站的框架、美觀和交互性。

laravel入門實例 Apr 18, 2025 pm 12:45 PM

Laravel 是一款 PHP 框架，用於輕鬆構建 Web 應用程序。它提供一系列強大的功能，包括：安裝：使用 Composer 全局安裝 Laravel CLI，並在項目目錄中創建應用程序。路由：在 routes/web.php 中定義 URL 和處理函數之間的關係。視圖：在 resources/views 中創建視圖以呈現應用程序的界面。數據庫集成：提供與 MySQL 等數據庫的開箱即用集成，並使用遷移來創建和修改表。模型和控制器：模型表示數據庫實體，控制器處理 HTTP 請求。

解決 Craft CMS 中的緩存問題：使用 wiejeben/craft-laravel-mix 插件 Apr 18, 2025 am 09:24 AM

在使用CraftCMS開發網站時，常常會遇到資源文件緩存的問題，特別是當你頻繁更新CSS和JavaScript文件時，舊版本的文件可能仍然被瀏覽器緩存，導致用戶無法及時看到最新的更改。這個問題不僅影響用戶體驗，還會增加開發和調試的難度。最近，我在項目中遇到了類似的困擾，經過一番探索，我找到了wiejeben/craft-laravel-mix這個插件，它完美地解決了我的緩存問題。

laravel用戶登錄功能 Apr 18, 2025 pm 12:48 PM

Laravel 提供了一個全面的 Auth 框架，用於實現用戶登錄功能，包括：定義用戶模型（Eloquent 模型）創建登錄表單（Blade 模板引擎）編寫登錄控制器（繼承 Auth\LoginController）驗證登錄請求（Auth::attempt）登錄成功後重定向（redirect）考慮安全因素：哈希密碼、防 CSRF 保護、速率限制和安全標頭。此外，Auth 框架還提供重置密碼、註冊和驗證電子郵件等功能。詳情請參閱 Laravel 文檔：https://laravel.com/doc

laravel框架安裝方法 Apr 18, 2025 pm 12:54 PM

文章摘要：本文提供了詳細分步說明，指導讀者如何輕鬆安裝 Laravel 框架。 Laravel 是一個功能強大的 PHP 框架，它 упростил 和加快了 web 應用程序的開發過程。本教程涵蓋了從系統要求到配置數據庫和設置路由等各個方面的安裝過程。通過遵循這些步驟，讀者可以快速高效地為他們的 Laravel 項目打下堅實的基礎。

Laravel如何學習怎麼免費學習Laravel Apr 18, 2025 pm 12:51 PM

想要學習 Laravel 框架，但苦於沒有資源或經濟壓力？本文為你提供了免費學習 Laravel 的途徑，教你如何利用網絡平台、文檔和社區論壇等資源，從入門到掌握，為你的 PHP 開發之旅奠定堅實基礎。

laravel有哪些版本 laravel新手版本選擇方法 Apr 18, 2025 pm 01:03 PM

在面向初学者的 Laravel 框架版本选择指南中，本文深入探討了 Laravel 的版本差異，旨在協助初學者在眾多版本之間做出明智的選擇。我們將重點介紹每個版本的關鍵特徵、比較它們的優缺點，並提供有用的建議，幫助新手根據他們的技能水準和項目需求挑選最合適的 Laravel 版本。對於初學者來說，選擇一個合適的 Laravel 版本至關重要，因為它可以顯著影響他們的學習曲線和整體開發體驗。