ホームページ バックエンド開発 PHPチュートリアル PHP ページのキャプチャとコード分析のチュートリアル

PHP ページのキャプチャとコード分析のチュートリアル

Jun 13, 2016 pm 01:14 PM
html lines php string url

PHPページキャプチャとコード解析解説
PHP ページ キャプチャとコード分析の説明 この記事の主な内容について簡単に説明します。

1. PHP ページ キャプチャの主な方法:

1. . file_get_contents() 関数
3. fopen()->fread()->fclose() モード
5. fsockopen() 関数ソケット モード
6.プラグイン (例: http://sourceforge.net/projects/snoopy/)

2. PHP が HTML または XML コードを解析する主な方法:

1.
2. PHP DOMDocument オブジェクト
3. プラグイン (例: PHP Simple HTML DOM Parser)

上記の内容を既に理解している場合は、次の内容を渡すことができます。

PHP クロール ページ

1. file() 関数
次のようにコードをコピーします。
<?php
$url='http://www. surfphpseo.com';
$lines_array=implode('',$lines_array);
echo htmlspecialchars($lines_string); >

2. file_get_contents() 関数
file_get_contents と fopen を使用して、allow_url_fopen を有効にします。方法: php.ini を編集し、allow_url_fopen = On に設定します。allow_url_fopen がオフの場合、fopen も file_get_contents もリモート ファイルを開くことができません。
次のようにコードをコピーします。
<?php
$url='http://t.qq.com'
$lines_string=file_get_contents($url); htmlspecialchars ($lines_string);
?>


3. fopen()->fread()->fclose() モード

次のようにコードをコピーします。 :
<?php
$url='http://t.qq.com';
$handle=fopen($url,"rb");
$lines_string="" ;
do{
$data=fread($handle,1024);
if(strlen($data)==0){break;}
$lines_string.=$data; >} while(true);
echo htmlspecialchars($lines_string);


4.カールを使用する場合 カールをオンにします。方法: Windows で php.ini を変更し、extension=php_curl.dll の前のセミコロンを削除し、ssleay32.dll と libeay32.dll を C:WINDOWSsystem32 にコピーします。Linux では、curl 拡張機能をインストールします。
次のようにコードをコピーします。
<?php
$url='http://t.qq.com'
$ch=curl_init(); 5 ;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout); ( $ch);
curl_close($ch);
echo htmlspecialchars($lines_string)

5.ソケット モードが正しく実行できるかどうかは、サーバーの設定にも関係します。具体的には、phpinfo を使用して、サーバーでどの通信プロトコルが有効になっているかを確認できます。たとえば、私のローカルの php ソケットでは http しか使用できません。 udp を使用してテストします。
次のようにコードをコピーします。
<?php
$fp = fsockopen("udp://127.0.0.1", 13, $errno, $errstr);
if (!$ fp ) {
echo "エラー: $errno - $errstr<br />n";
} else {
fwrite($fp, "n"); , 26);
fclose($fp);
}
?>


インターネット上にはさらに多くのプラグインがあるはずです、スヌーピーのプラグインはオンラインで見つかりました。興味があれば調べてください。

PHP は XML (html) を解析します

1. 正規表現:

次のようにコードをコピーします:
<?php
$url='http ://t.qq.com';
$lines_string=file_get_contents($url);
eregi('<title>(.*)</title>',$lines_string,$title);
echo htmlspecialchars($title[0]);
?>


2. PHP DOMDocument() オブジェクト
リモート HTML または XML に構文エラーがある場合, php will dom を解析するとエラーが報告されます。

次のようにコードをコピーします。
<?php
$url='http://www.136web.cn';
$html=new DOMDocument(); > $html->loadHTMLFile($url);
$title=$html->getElementsByTagName('title');
echo $title->item(0)->nodeValue; > ?>


3. プラグイン
この記事では、PHP Simple HTML DOM Parser を例として簡単に説明します。 dom を操作するには、jQuery を使用して dom を操作するのと同じくらい簡単です。
次のようにコードをコピーします。
<?php
$url='http://t.qq.com'
include_once('../simplehtmldom/simple_html_dom.php') ;
$html=file_get_html($url);
$title=$html->find('title');
echo $title[0]->plaintext; ;



詳細なソース参照: http://www.surfphpseo.com

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットな記事タグ

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Ubuntu および Debian 用の PHP 8.4 インストールおよびアップグレード ガイド Ubuntu および Debian 用の PHP 8.4 インストールおよびアップグレード ガイド Dec 24, 2024 pm 04:42 PM

Ubuntu および Debian 用の PHP 8.4 インストールおよびアップグレード ガイド

CakePHP の日付と時刻 CakePHP の日付と時刻 Sep 10, 2024 pm 05:27 PM

CakePHP の日付と時刻

CakePHP プロジェクトの構成 CakePHP プロジェクトの構成 Sep 10, 2024 pm 05:25 PM

CakePHP プロジェクトの構成

CakePHP ファイルのアップロード CakePHP ファイルのアップロード Sep 10, 2024 pm 05:27 PM

CakePHP ファイルのアップロード

CakePHP ルーティング CakePHP ルーティング Sep 10, 2024 pm 05:25 PM

CakePHP ルーティング

CakePHP について話し合う CakePHP について話し合う Sep 10, 2024 pm 05:28 PM

CakePHP について話し合う

HTML テーブルのレイアウト HTML テーブルのレイアウト Sep 04, 2024 pm 04:54 PM

HTML テーブルのレイアウト

CakePHP クイックガイド CakePHP クイックガイド Sep 10, 2024 pm 05:27 PM

CakePHP クイックガイド

See all articles