在laravel使用Symfony的Crawler元件實例分析-php教程-PHP中文網

首頁

後端開發

php教程

在laravel使用Symfony的Crawler元件實例分析

微波

Jun 28, 2017 am 11:44 AM

laravel symfony

這篇文章主要介紹了在laravel中使用Symfony的Crawler元件分析HTML,需要的朋友可以參考下

Crawler全名是DomCrawler，是Symfony框架的元件。令人髮指的是DomCrawler的沒有中文文檔，Symfony也沒有翻譯該部分，所以使用DomCrawler開發只能一點一點摸索，現將使用過程中的經驗總結。

首先是安裝

composer require symfony/dom-crawler
composer require symfony/css-selector

登入後複製

css-seelctor 是css選擇器，用css選擇節點時有些函數會用到

#手冊裡面使用的範例是

use Symfony\Component\DomCrawler\Crawler;
$html = <<<‘HTML‘
Hello World!
Hello Crawler!
HTML;
$crawler = new Crawler($html);
foreach ($crawler as $domElement)
{
var_dump($domElement->nodeName);
}

登入後複製

列印的結果是

string ‘html‘ (length=4)

登入後複製

因為這段html程式碼的nodeName就是html，英文不好，開始使用的時候還以為程式錯了。。。

實際使用過程，如果new Crawler($html)會出現亂碼問題，應該是跟頁面編碼有關，所以可以採用下面的方式，先初始化crawler，然後再加入node

$crawler = new Crawler();
$crawler->addHtmlContent($html);

登入後複製

addHtmlContent的第二個參數是charset，預設是utf-8。

其他範例可以參考官方文檔，http://symfony.com/doc/current/components/dom_crawler.html

記錄工作中一點點試出來的用法

filterXPath(string $xpath) 方法，依照手冊上的說法，該方法的參數是$xpath，常用的是p，p等塊。

echo $crawler->filterXPath(‘//body/p‘)->text();
echo $crawler->filterXPath(‘//body/p‘)->last()->text();

登入後複製

#輸出是第一個和下一個p標籤區塊的文字

var_dump($crawler->filterXPath(‘//body‘)->html());

登入後複製

輸出body內的html

foreach ($crawler->filterXPath(‘//body/p‘) as $i => $node) {
$c = new Crawler($node);
echo $c->filter(‘p‘)->text();
}

登入後複製

filterXPath獲得的是DOMElement區塊的數組，每個DOMElement區塊可以使用新的crawler物件繼續解析

$nodeValues =
$crawler->filterXPath(‘//body/p‘)->each(function (Crawler $node, $i) {
return $node->text();
});

登入後複製

crawler提供了each循環，使用閉包函數簡化程式碼，不過注意的是，這種寫法$nodeValues得到的是數組，需要進一步處理。

其他用法

echo $crawler->filterXPath(‘//body/p‘)->attr(‘class‘);

登入後複製

可以取得第一個p標籤對應class屬性的值「message」

$crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a‘)->attr(‘href‘);
$crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a>img‘)->extract(array(‘alt‘, ‘href‘))

登入後複製

以上是獲得標籤屬性的一些方法

filter和filterXPath不同，手冊上寫的是css選擇器，不太明白，我理解是p這種XPath節點包含的元素，具體情況還需要在實際開發中去嘗試。

總的來說感覺DomCrawler要比simple html dom好用一些，可能是我用的比較淺顯。

上述只是Crawler的基本功能，更過用法請查閱symfony手冊關於Crawler部分的函數

http://api.symfony.com/3.2/Symfony/Component/DomCrawler/Crawler .html

Crawler主要問題還是範例太少，函數手冊裡面沒有使用實例，只能在實際使用中去摸索。。。。

symfony關於DomCrawler的文檔，裡面有少數例子

http://symfony.com/doc/current/components/dom_crawler.html

以上所述是小編給大家介紹的在laravel中使用Symfony的Crawler組件分析HTML，希望對大家有幫助，如果大家有任何疑問請給我留言，小編會及時回覆大家的。

以上是在laravel使用Symfony的Crawler元件實例分析的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7500

CakePHP 教程

1377

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

Laravel和CodeIgniter的最新版本對比 Jun 05, 2024 pm 05:29 PM

Laravel9和CodeIgniter4的最新版本提供了更新的功能和改進。 Laravel9採用MVC架構，提供資料庫遷移、驗證及模板引擎等功能。 CodeIgniter4採用HMVC架構，提供路由、ORM和快取。在性能方面，Laravel9的基於服務提供者設計模式和CodeIgniter4的輕量級框架使其具有出色的性能。在實際應用中，Laravel9適用於需要靈活性和強大功能的複雜項目，而CodeIgniter4適用於快速開發和小型應用程式。

Laravel 和 CodeIgniter 中資料處理能力的比較如何？ Jun 01, 2024 pm 01:34 PM

比較Laravel和CodeIgniter的資料處理能力：ORM：Laravel使用EloquentORM，提供類別物件關係映射，而CodeIgniter使用ActiveRecord，將資料庫模型表示為PHP類別的子類別。查詢建構器：Laravel具有靈活的鍊式查詢API，而CodeIgniter的查詢建構器更簡單，基於陣列。資料驗證：Laravel提供了一個Validator類，支援自訂驗證規則，而CodeIgniter的驗證功能內建較少，需要手動編碼自訂規則。實戰案例：用戶註冊範例展示了Lar

Laravel - Artisan 指令 Aug 27, 2024 am 10:51 AM

Laravel - Artisan 指令 - Laravel 5.7 提供了處理和測試新指令的新方法。它包括測試 artisan 命令的新功能，下面提到了演示？

Laravel 和 CodeIgniter 對於初學者來說哪一個比較友善？ Jun 05, 2024 pm 07:50 PM

對於初學者來說，CodeIgniter的學習曲線更平緩，功能較少，但涵蓋了基本需求。 Laravel提供了更廣泛的功能集，但學習曲線稍陡。在性能方面，Laravel和CodeIgniter都表現出色。 Laravel有更廣泛的文件和活躍的社群支持，而CodeIgniter更簡單、輕量級，具有強大的安全功能。在建立部落格應用程式的實戰案例中，Laravel的EloquentORM簡化了資料操作，而CodeIgniter需要更多的手動配置。

Laravel和CodeIgniter：哪種框架更適合大型專案？ Jun 04, 2024 am 09:09 AM

在選擇大型專案框架時，Laravel和CodeIgniter各有優勢。 Laravel針對企業級應用程式而設計，提供模組化設計、相依性注入和強大的功能集。 CodeIgniter是一款輕量級框架，更適合小型到中型項目，強調速度和易用性。對於具有複雜需求和大量用戶的大型項目，Laravel的強大功能和可擴展性更為合適。而對於簡單專案或資源有限的情況下，CodeIgniter的輕量級和快速開發能力則較為理想。