在laravel使用Symfony的Crawler元件實例分析
這篇文章主要介紹了在laravel中使用Symfony的Crawler元件分析HTML,需要的朋友可以參考下
Crawler全名是DomCrawler,是Symfony框架的元件。令人髮指的是DomCrawler的沒有中文文檔,Symfony也沒有翻譯該部分,所以使用DomCrawler開發只能一點一點摸索,現將使用過程中的經驗總結。
首先是安裝
composer require symfony/dom-crawler composer require symfony/css-selector
css-seelctor 是css選擇器,用css選擇節點時有些函數會用到
#手冊裡面使用的範例是
use Symfony\Component\DomCrawler\Crawler; $html = <<<‘HTML‘ Hello World! Hello Crawler! HTML; $crawler = new Crawler($html); foreach ($crawler as $domElement) { var_dump($domElement->nodeName); }
列印的結果是
string ‘html‘ (length=4)
因為這段html程式碼的nodeName就是html,英文不好,開始使用的時候還以為程式錯了。 。 。
實際使用過程,如果new Crawler($html)會出現亂碼問題,應該是跟頁面編碼有關,所以可以採用下面的方式,先初始化crawler,然後再加入node
$crawler = new Crawler(); $crawler->addHtmlContent($html);
addHtmlContent的第二個參數是charset,預設是utf-8。
其他範例可以參考官方文檔,http://symfony.com/doc/current/components/dom_crawler.html
記錄工作中一點點試出來的用法
filterXPath(string $xpath) 方法,依照手冊上的說法,該方法的參數是$xpath,常用的是p,p等塊。
echo $crawler->filterXPath(‘//body/p‘)->text(); echo $crawler->filterXPath(‘//body/p‘)->last()->text();
#輸出是第一個和下一個p標籤區塊的文字
var_dump($crawler->filterXPath(‘//body‘)->html());
輸出body內的html
foreach ($crawler->filterXPath(‘//body/p‘) as $i => $node) { $c = new Crawler($node); echo $c->filter(‘p‘)->text(); }
filterXPath獲得的是DOMElement區塊的數組,每個DOMElement區塊可以使用新的crawler物件繼續解析
$nodeValues = $crawler->filterXPath(‘//body/p‘)->each(function (Crawler $node, $i) { return $node->text(); });
crawler提供了each循環,使用閉包函數簡化程式碼,不過注意的是,這種寫法$nodeValues得到的是數組,需要進一步處理。
其他用法
echo $crawler->filterXPath(‘//body/p‘)->attr(‘class‘);
可以取得第一個p標籤對應class屬性的值「message」
$crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a‘)->attr(‘href‘); $crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a>img‘)->extract(array(‘alt‘, ‘href‘))
以上是獲得標籤屬性的一些方法
filter和filterXPath不同,手冊上寫的是css選擇器,不太明白,我理解是p這種XPath節點包含的元素,具體情況還需要在實際開發中去嘗試。
總的來說感覺DomCrawler要比simple html dom好用一些,可能是我用的比較淺顯。
上述只是Crawler的基本功能,更過用法請查閱symfony手冊關於Crawler部分的函數
http://api.symfony.com/3.2/Symfony/Component/DomCrawler/Crawler .html
Crawler主要問題還是範例太少,函數手冊裡面沒有使用實例,只能在實際使用中去摸索。 。 。 。
symfony關於DomCrawler的文檔,裡面有少數例子
http://symfony.com/doc/current/components/dom_crawler.html
以上所述是小編給大家介紹的在laravel中使用Symfony的Crawler組件分析HTML,希望對大家有幫助,如果大家有任何疑問請給我留言,小編會及時回覆大家的。
以上是在laravel使用Symfony的Crawler元件實例分析的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel9和CodeIgniter4的最新版本提供了更新的功能和改進。 Laravel9採用MVC架構,提供資料庫遷移、驗證及模板引擎等功能。 CodeIgniter4採用HMVC架構,提供路由、ORM和快取。在性能方面,Laravel9的基於服務提供者設計模式和CodeIgniter4的輕量級框架使其具有出色的性能。在實際應用中,Laravel9適用於需要靈活性和強大功能的複雜項目,而CodeIgniter4適用於快速開發和小型應用程式。

比較Laravel和CodeIgniter的資料處理能力:ORM:Laravel使用EloquentORM,提供類別物件關係映射,而CodeIgniter使用ActiveRecord,將資料庫模型表示為PHP類別的子類別。查詢建構器:Laravel具有靈活的鍊式查詢API,而CodeIgniter的查詢建構器更簡單,基於陣列。資料驗證:Laravel提供了一個Validator類,支援自訂驗證規則,而CodeIgniter的驗證功能內建較少,需要手動編碼自訂規則。實戰案例:用戶註冊範例展示了Lar

Laravel - Artisan 指令 - Laravel 5.7 提供了處理和測試新指令的新方法。它包括測試 artisan 命令的新功能,下面提到了演示?

對於初學者來說,CodeIgniter的學習曲線更平緩,功能較少,但涵蓋了基本需求。 Laravel提供了更廣泛的功能集,但學習曲線稍陡。在性能方面,Laravel和CodeIgniter都表現出色。 Laravel有更廣泛的文件和活躍的社群支持,而CodeIgniter更簡單、輕量級,具有強大的安全功能。在建立部落格應用程式的實戰案例中,Laravel的EloquentORM簡化了資料操作,而CodeIgniter需要更多的手動配置。

在選擇大型專案框架時,Laravel和CodeIgniter各有優勢。 Laravel針對企業級應用程式而設計,提供模組化設計、相依性注入和強大的功能集。 CodeIgniter是一款輕量級框架,更適合小型到中型項目,強調速度和易用性。對於具有複雜需求和大量用戶的大型項目,Laravel的強大功能和可擴展性更為合適。而對於簡單專案或資源有限的情況下,CodeIgniter的輕量級和快速開發能力則較為理想。

微服務架構使用PHP框架(如Symfony和Laravel)來實現微服務,並遵循RESTful原則和標準資料格式來設計API。微服務透過訊息佇列、HTTP請求或gRPC進行通信,並使用工具(如Prometheus和ELKStack)進行監控和故障排除。

對於小型項目,Laravel適用於大型項目,需要強大的功能和安全性。 CodeIgniter適用於非常小的項目,需要輕量級和易用性。

比較了Laravel的Blade和CodeIgniter的Twig模板引擎,根據專案需求和個人偏好進行選擇:Blade基於MVC語法,鼓勵良好程式碼組織和模板繼承。 Twig是第三方函式庫,提供靈活語法、強大過濾器、擴充支援和安全沙箱。
