php解析HTML

WBOY
Freigeben: 2016-06-23 13:56:06
Original
1226 Leute haben es durchsucht

PHP Simple HTML DOM 解析器显然是相当不多的html文件解析工具,他可以在服务器端采用类似于jquery的方式进行dom查找和修改。目前这个解析器支持PHP5。

但是,这个首先将html进行了标签解析,占用了大量的内存。在解析复杂一点的html文件时,甚至占用超过10M的内存,现在在高并发的情况下,这个是无法接受的。

当你加载了5个10个甚至更多的文档的时候,用完一个就清理内存:

<?php $html->clear();?>
Nach dem Login kopieren

该兴趣的朋友可以访问该项目的地址为:http://simplehtmldom.sourceforge.net/ 。

该解析的中文手册在线地址为:http://www.ecartchina.com/php-simple-html-dom/manual.htm。

您也可以通过上传到CSDN的离线版:


本文提供同类的div查找和修改操作方法:

<?phplibxml_use_internal_errors (true) ;$doc = new DOMDocument();// We don't want to bother with white spaces$doc->preserveWhiteSpace = false;$doc->loadHTMLFile("testdoc.html");$xpath = new DOMXPath($doc);//查找带aconf_edit_section的div元素$query = '//div[@aconf_edit_section]';//$entries = $xpath->query($query);$entries=$xpath->query($query);foreach ($entries as $entry) {    //echo  " {$entry->nodeValue}<br>";    print_r($entry);}// $rs = $dom->getElementById("test");// echo $rs->nodeValue;//   print_r($entries->save('xxx.html'));function domNodeList_to_string($DomNodeList) {   $output = '';   $doc = new DOMDocument;   $i=0;   while ( $node = $DomNodeList->item($i) ) {       // import node       $domNode = $doc->importNode($node, true);       // append node       $doc->appendChild($domNode);       $i++;   }   $output = $doc->saveXML();   $output = print_r($output, 1);   // I added this because xml output and ajax do not like each others   //$output = htmlspecialchars($output);   return $output;}echo domNodeList_to_string($entries);?>
Nach dem Login kopieren



http://hi.baidu.com/tdweb/item/ac6e00ed831dbc3a87d9de2e

PHP DOMXpath 查询表达式详解:

http://blog.csdn.net/wmsjlihuan/article/details/9000790

XPath 语法

http://www.w3school.com.cn/xpath/xpath_syntax.asp

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage