首頁 後端開發 php教程 PHP抓取和分析_PHP

PHP抓取和分析_PHP

Jun 01, 2016 pm 12:32 PM
head li url 分析 我們

抓取和分析一个文件是非常简单的事。这个教程将通过一个例子带领你一步一步地去实现它。让我们开始吧! 

  首先,我首必须决定我们将抓取的URL地址。可以通过在脚本中设定或通过$QUERY_STRING传递。为了简单起见,让我们将变量直接设在脚本中。 

 
$url = 'http://www.php.net'; 
?> 

  第二步,我们抓取指定文件,并且通过file()函数将它存在一个数组里。 

 
$url = 'http://www.php.net'; 
$lines_array = file($url); 
?> 

  好了,现在在数组里已经有了文件了。但是,我们想分析的文本可能不全在一行里面。为了解这个文件,我们可以简单地将数组$lines_array转化成一个字符串。我们可以使用implode(x,y)函数来实现它。如果在后面你想用explode(将字符串变量数组),将x设成"|"或"!"或其它类似的分隔符可能会更好。但是出于我们的目的,最好将x设成空格。y是另一个必要的参数,因为它是你想用implode()处理的数组。 

 
$url = 'http://www.php.net'; 
$lines_array = file($url); 
$lines_string = implode('', $lines_array); 
?> 

  现在,抓取工作就做完了,下面该进行分析了。出于这个例子的目的,我们想得到在到 之间的所有东西。为了分析出字符串,我们还需要叫做正规表达式的东西。 

 
$url = 'http://www.php.net'; 
$lines_array = file($url); 
$lines_string = implode('', $lines_array); 
eregi("(.*)", $lines_string, $head); 
?> 

  让我们看一下代码。正如你所见,eregi()函数按下面的格式执行: 

eregi("(.*)", $lines_string, $head); 

  "(.*)"表示所有东西,可以解释为,"分析在和间的所以东西"。$lines_string是我们正在分析的字符串,$head是分析后的结果存放的数组。 

  最后,我们可以输数据。因为仅在和间存在一个实例,我们可以安全的假设数组中仅存在着一个元素,而且就是我们想要的。让我们把它打印出来吧。 

 
$url = 'http://www.php.net'; 
$lines_array = file($url); 
$lines_string = implode('', $lines_array); 
eregi("(.*)", $lines_string, $head); 
echo $head[0]; 
?> 

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 週前 By 尊渡假赌尊渡假赌尊渡假赌
倉庫:如何復興隊友
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 週前 By 尊渡假赌尊渡假赌尊渡假赌
倉庫:如何復興隊友
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱門文章標籤

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

為什麼NameResolutionError(self.host, self, e) from e,怎麼解決 為什麼NameResolutionError(self.host, self, e) from e,怎麼解決 Mar 01, 2024 pm 01:20 PM

為什麼NameResolutionError(self.host, self, e) from e,怎麼解決

如何在uniapp中實現資料統計與分析 如何在uniapp中實現資料統計與分析 Oct 24, 2023 pm 12:37 PM

如何在uniapp中實現資料統計與分析

html和url的差別是什麼 html和url的差別是什麼 Mar 06, 2024 pm 03:06 PM

html和url的差別是什麼

li是什麼元素 li是什麼元素 Aug 03, 2023 am 11:19 AM

li是什麼元素

織夢CMS二級目錄打不開的原因分析 織夢CMS二級目錄打不開的原因分析 Mar 13, 2024 pm 06:24 PM

織夢CMS二級目錄打不開的原因分析

ThinkPHP6程式碼效能分析:定位效能瓶頸 ThinkPHP6程式碼效能分析:定位效能瓶頸 Aug 27, 2023 pm 01:36 PM

ThinkPHP6程式碼效能分析:定位效能瓶頸

TP6 Think-Swoole RPC服務的效能分析與最佳化策略 TP6 Think-Swoole RPC服務的效能分析與最佳化策略 Oct 12, 2023 am 10:34 AM

TP6 Think-Swoole RPC服務的效能分析與最佳化策略

url是啥意思 url是啥意思 Aug 04, 2023 am 11:43 AM

url是啥意思

See all articles