ファイルのクロールと分析は非常に簡単です。このチュートリアルでは、それを実装するための例を段階的に説明します。はじめましょう!
まず、どの URL アドレスをクロールするかを決定する必要があります。これはスクリプトで設定するか、$QUERY_STRING 経由で渡すことができます。簡単にするために、変数をスクリプト内で直接設定しましょう。
$url = http://www.php.net;
?>
2 番目のステップは、指定されたファイルを取得し、file() 関数を通じて配列に保存することです。
$url = http://www.php.net;
$lines_array = file($url);
これで、配列にファイルができました。ただし、分析したいテキストがすべて 1 行に収まるわけではありません。このファイルを解決するには、配列 $lines_array を文字列に変換するだけです。これを実現するには、implode(x,y) 関数を使用します。後で爆発(文字列変数の配列)を使用したい場合は、x を「|」または「!」またはその他の同様の区切り文字に設定することをお勧めします。ただし、今回の目的では、x をスペースに設定するのが最善です。 y は、implode() で処理する配列であるため、もう 1 つの必須パラメータです。
$url = http://www.php.net;
$lines_string = implode(, $lines_array); さて、クロール作業は次のとおりです。それが完了したら、分析を始めます。この例では、
と
の間のすべてを取得したいと考えています。文字列を解析するには、正規表現と呼ばれるものも必要です。
$url = http://www.php.net;
$lines_string = implode("
の間のすべてを分析する」と解釈されます。 $lines_string は分析対象の文字列、$head は分析結果が格納される配列です。 |