URL クローラー

Jul 25, 2016 am 08:48 AM

csdn のポイント無料ダウンロード、pudn のポイント無料ダウンロード、またはポイント無料の 51cto が必要な場合は、http://www.itziy.com/ にアクセスしてください。
コマンドラインから直接 php を呼び出すと、使用方法が表示されます。メソッド
機能説明
1. サポートエージェント
2. 再帰チェック数の設定をサポート
3. 出力タイプ制御とチェックコンテンツ制御をサポート

機能:代替主肉眼尽量多的抓取可能请求包及url地址等,方便渗透测试
  1. error_reporting(E_ERROR | E_WARNING | E_PARSE);
  2. ini_set('memory_limit','1024M');
  3. set_time_limit(0);
  4. define('CHECK_A_TAG', false);
  5. define(' CHECK_JS_TAG', true);
  6. define('CHECK_URL', true);
  7. define('SAVE_ERROR', true);
  8. $checkArr = array(
  9. '$.load',
  10. '.ajax',
  11. '$. post',
  12. '$.get',
  13. '.getJSON'
  14. );
  15. if ($argc < 2)
  16. die(showerror('申し訳ありませんが、パラメータエラー', array('例: php debug.php url num ファイル名ヘッダープロキシ', '詳細情報:', 'url: 確認したい対象URLアドレス', 'num: 再帰のページ数、デフォルト3', 'filename: 出力ファイル名デフォルト名ret.txt ', 'header: リクエスト ヘッダー ファイルのデフォルト null', 'proxy: プロキシを使用したい場合は、ここに設定します。デフォルトはプロキシを使用しません')));
  17. if (!check_extension())
  18. die(showerror('extension curl はサポートされていません', 'PHP Curl 拡張機能のサポートを開いてください'));
  19. //グローバル変数
  20. $url = トリム($argv[1]);
  21. if (stripos($url, 'http') === false)
  22. $url = 'http://'.$url;
  23. $num = isset($argv[2]) ? intval($argv[2]) : 3;
  24. $output = isset($argv[3]) ?トリム(str_replace("\", '/', $argv[3])) : str_replace("\", '/', dirname(__FILE__)).'/ret.txt';
  25. $header = null;
  26. $proxy = null;
  27. $host = null;
  28. if (isset($argv[4]))
  29. {
  30. $header = トリム(str_replace("\", '/', $argv[4]));
  31. if (file_exists($header))
  32. $header = array_filter(explode("n", str_replace("r", '', file_get_contents($header))));
  33. else
  34. {
  35. $file = str_replace(" \", '/', dirname(__FILE__)).'/'.$header;
  36. if (file_exists($file))
  37. $header = array_filter(explode("n", str_replace("r", '', file_get_contents($file))));
  38. else
  39. $header = null;
  40. }
  41. }
  42. if (isset($argv[5]))
  43. $proxy = trim($argv[5]);
  44. if (!is_array($header) || empty($header))
  45. $header = null;
  46. $result = check_valid_url($url);
  47. $outputArr = array();
  48. if (!empty($result))
  49. {
  50. $result = str_replace("r", '', $result);
  51. $result = str_replace("n", '', $result);
  52. $tmpArr = parse_url($url);
  53. if (! isset($tmpArr['host']))
  54. die(showerror('URL 解析エラー', 'ホスト フォーム URL を取得できません: '.$url));
  55. $host = $tmpArr['host'];
  56. if (stripos($host, 'http') === false)
  57. $host = 'http://'.$host;
  58. unset($tmpArr);
  59. //現在のページを確認します
  60. if (!isset ($outputArr[md5($url)]))
  61. {
  62. $outputArr[md5($url)] = $url;
  63. file_put_contents($output, $url."n", FILE_APPEND);
  64. echo 'url: ' ,$url,' ajax が必要なので保存',PHP_EOL;
  65. }
  66. work($result);
  67. }
  68. echo 'runfinish',PHP_EOL;
  69. function work($result, $reverse = false)
  70. {
  71. グローバル $num, $host, $outputArr, $checkArr, $output;
  72. if (!$result)
  73. return;
  74. $result = str_replace("r", '', $result);
  75. $result = str_replace ("n", '', $result);
  76. while ($num > 0)
  77. {
  78. echo 'remain: ',$num、' URL アドレスのチェックを開始します',PHP_EOL,PHP_EOL;
  79. preg_match_all('//i', $result, $match);
  80. if (CHECK_A_TAG && isset($match[2]) && !empty($match) [2]))
  81. {
  82. foreach ($match[2] as $mc)
  83. {
  84. $mc = トリム($mc);
  85. if ($mc == '#')
  86. continue;
  87. if (stripos( $mc, 'http') === false)
  88. $mc = $host.$mc;
  89. if (($ret = check_valid_url($mc)))
  90. {
  91. if (!isset($outputArr[md5( $mc)]))
  92. {
  93. $outputArr[md5($mc)] = $mc;
  94. file_put_contents($output, $mc."n", FILE_APPEND);
  95. echo 'url: ',$mc,' find ajax が必要なので保存',PHP_EOL;
  96. }
  97. }
  98. }
  99. }
  100. // ページ URL をチェック
  101. echo 'remain: ',$num,' 今、ページ URL のチェックを開始します',PHP_EOL,PHP_EOL;
  102. preg_match_all('/(https?|ftp|mms)://([A-z0-9]+[_-]?[A-z0-9]+.)*[A-z0-9]+-? [A-z0-9]+.[A-z]{2,}(/.*)*/?/i', $result, $match);
  103. if (CHECK_URL && isset($match[2]) && !empty($match[2]))
  104. {
  105. foreach ($match [2] as $mc)
  106. {
  107. $mc = トリム($mc);
  108. if ($mc == '#')
  109. continue;
  110. if (stripos($mc, 'http') === false)
  111. $mc = $host.$mc;
  112. if (($ret = check_valid_url($mc)))
  113. {
  114. if (!isset($outputArr[md5($mc)]))
  115. {
  116. $outputArr[ md5($mc)] = $mc;
  117. file_put_contents($output, $mc."n", FILE_APPEND);
  118. echo 'url: ',$mc,' ajax が必要なので保存',PHP_EOL;
  119. }
  120. }
  121. }
  122. }
  123. //javascript ajax require
  124. をチェックします echo 'remain: ',$num,' now start to check for javascript ajax require',PHP_EOL,PHP_EOL;
  125. preg_match_all('//i', $result, $match);
  126. if (CHECK_JS_TAG && isset($) match[2]) && !empty($match[2]))
  127. {
  128. foreach ($match[2] as $mc)
  129. {
  130. $mc = トリム($mc);
  131. if ($mc == ' #')
  132. 続行;
  133. if (stripos($mc, 'http') === false)
  134. $mc = $host.$mc;
  135. if (($ret = check_valid_url($mc)))
  136. {
  137. //現在のページを確認します
  138. foreach ($checkArr as $ck)
  139. {
  140. if (!isset($outputArr[md5($mc)]) && strpos($ret, $ck) !== false)
  141. {
  142. $outputArr[md5($mc)] = $mc;
  143. file_put_contents($output, $mc."n", FILE_APPEND);
  144. echo 'url: ',$mc,' ajax が必要なので保存',PHP_EOL ;
  145. Break;
  146. }
  147. }
  148. }
  149. }
  150. }
  151. if ($reverse)
  152. return;
  153. //次のページをチェック
  154. preg_match_all('//i', $result, $match);
  155. if (isset($match[2]) && !empty( $match[2]))
  156. {
  157. echo '次のページをチェック、残りのページ数: ',$num,PHP_EOL;
  158. foreach ($match[2] as $mc)
  159. {
  160. $mc = trim($mc );
  161. if ($mc == '#')
  162. continue;
  163. if (stripos($mc, 'http') === false)
  164. $mc = $host.$mc;
  165. echo '次のページを確認します: ',$mc,PHP_EOL;
  166. work(check_valid_url($mc), true);
  167. }
  168. }
  169. $num--;
  170. sleep(3);
  171. }
  172. }
  173. function check_valid_url($url)
  174. {
  175. if (stripos($url, 'http') === false)
  176. $url = 'http://'.$url;
  177. $ch =curl_init();
  178. curl_setopt($ch, CURLOPT_URL, $url) ;
  179. curl_setopt($ch、CURLOPT_HEADER、true);
  180. curl_setopt($ch、CURLOPT_FOLLOWLOCATION、true);
  181. curl_setopt($ch、CURLOPT_RETURNTRANSFER、true);
  182. curl_setopt($ch、CURLOPT_USERAGENT、'Mozilla/5.0 (互換性あり; Googlebot/2.​​1; +http://www.google.com/bot.html)');
  183. if (!is_null($header))
  184. curl_setopt($ch, CURLOPT_HTTPHEADER, $header);
  185. if (!is_null($proxy))
  186. curl_setopt($ch, CURLOPT_PROXY, $proxy);
  187. $ret =curl_exec($ch);
  188. $errinfo =curl_error($ch);
  189. curl_close($ch);
  190. unset($ch);
  191. if (! empty($errinfo) || ((strpos($ret, '200 OK') === false) && (strpos($ret, '302 Moved') === false)) || 114so.cn') !== false)
  192. {
  193. showerror('url をチェック: '.$url. ' いくつかのエラーを見つけます', array($errinfo, $ret));
  194. if (SAVE_ERROR)
  195. file_put_contents(dirname( __FILE__).'/error.txt', $url."n", FILE_APPEND);
  196. return false;
  197. }
  198. return $ret;
  199. }
  200. function check_extension()
  201. {
  202. if (!function_exists('curl_init' ) || !extension_loaded('curl'))
  203. return false;
  204. return true;
  205. }
  206. 関数 showerror($t, $c)
  207. {
  208. $str = "######## ################################################ ############n";
  209. $str .= "# ".$t."n";
  210. if (is_string($c))
  211. $str .= "# ".$ c;
  212. elseif (is_array($c) && !empty($c))
  213. {
  214. foreach ($c as $c1)
  215. $str .= "# ".$c1."n";
  216. }
  217. $str .= "n########################################### ###########################n";
  218. echo $str;
  219. unset($str);
  220. }
复制代


このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

JSON Web Tokens(JWT)とPHP APIでのユースケースを説明してください。 JSON Web Tokens(JWT)とPHP APIでのユースケースを説明してください。 Apr 05, 2025 am 12:04 AM

JWTは、JSONに基づくオープン標準であり、主にアイデンティティ認証と情報交換のために、当事者間で情報を安全に送信するために使用されます。 1。JWTは、ヘッダー、ペイロード、署名の3つの部分で構成されています。 2。JWTの実用的な原則には、JWTの生成、JWTの検証、ペイロードの解析という3つのステップが含まれます。 3. PHPでの認証にJWTを使用する場合、JWTを生成および検証でき、ユーザーの役割と許可情報を高度な使用に含めることができます。 4.一般的なエラーには、署名検証障害、トークンの有効期限、およびペイロードが大きくなります。デバッグスキルには、デバッグツールの使用とロギングが含まれます。 5.パフォーマンスの最適化とベストプラクティスには、適切な署名アルゴリズムの使用、有効期間を合理的に設定することが含まれます。

確固たる原則と、それらがPHP開発にどのように適用されるかを説明してください。 確固たる原則と、それらがPHP開発にどのように適用されるかを説明してください。 Apr 03, 2025 am 12:04 AM

PHP開発における固体原理の適用には、次のものが含まれます。1。単一責任原則(SRP):各クラスは1つの機能のみを担当します。 2。オープンおよびクローズ原理(OCP):変更は、変更ではなく拡張によって達成されます。 3。Lischの代替原則(LSP):サブクラスは、プログラムの精度に影響を与えることなく、基本クラスを置き換えることができます。 4。インターフェイス分離原理(ISP):依存関係や未使用の方法を避けるために、細粒インターフェイスを使用します。 5。依存関係の反転原理(DIP):高レベルのモジュールと低レベルのモジュールは抽象化に依存し、依存関係噴射を通じて実装されます。

PHPにおける後期静的結合の概念を説明します。 PHPにおける後期静的結合の概念を説明します。 Mar 21, 2025 pm 01:33 PM

記事では、PHP 5.3で導入されたPHPの後期静的結合(LSB)について説明し、より柔軟な継承を求める静的メソッドコールのランタイム解像度を可能にします。 LSBの実用的なアプリケーションと潜在的なパフォーマ

システムの再起動後にUnixSocketの権限を自動的に設定する方法は? システムの再起動後にUnixSocketの権限を自動的に設定する方法は? Mar 31, 2025 pm 11:54 PM

システムが再起動した後、UnixSocketの権限を自動的に設定する方法。システムが再起動するたびに、UnixSocketの許可を変更するために次のコマンドを実行する必要があります:sudo ...

PHPのCurlライブラリを使用してJSONデータを含むPOSTリクエストを送信する方法は? PHPのCurlライブラリを使用してJSONデータを含むPOSTリクエストを送信する方法は? Apr 01, 2025 pm 03:12 PM

PHP開発でPHPのCurlライブラリを使用してJSONデータを送信すると、外部APIと対話する必要があることがよくあります。一般的な方法の1つは、Curlライブラリを使用して投稿を送信することです。

フレームワークセキュリティ機能:脆弱性から保護します。 フレームワークセキュリティ機能:脆弱性から保護します。 Mar 28, 2025 pm 05:11 PM

記事では、入力検証、認証、定期的な更新など、脆弱性から保護するためのフレームワークの重要なセキュリティ機能について説明します。

フレームワークのカスタマイズ/拡張:カスタム機能を追加する方法。 フレームワークのカスタマイズ/拡張:カスタム機能を追加する方法。 Mar 28, 2025 pm 05:12 PM

この記事では、フレームワークにカスタム機能を追加し、アーキテクチャの理解、拡張ポイントの識別、統合とデバッグのベストプラクティスに焦点を当てています。

See all articles