ホームページ > バックエンド開発 > PHPチュートリアル > PHPでWebページからデータをクロールする方法

PHPでWebページからデータをクロールする方法

WBOY
リリース: 2016-06-13 13:46:43
オリジナル
1075 人が閲覧しました

PHPでWebページからデータをクロールするにはどうすればよいですか?
たとえば、Web サイトには、人々の名前、住所、電話番号、習得した言語などに関するデータが含まれています。
プログラムを使用して言語の習得などの情報を取得したいのですが、言語は複数ありますマスターできた、たぶん2、3種類!

専門家の方、申し訳ありませんが、この機能を実現するには PHP を使用する方法を教えてください。コードを直接表示するのが最善です。 。

-----解決策--------------------------------
curl または file_get_contents を使用します
ターゲット Web サイトの HTML コードを読み取り、そのコードに従って正規表現を記述して必要なものを抽出する必要があります
例を挙げるのは難しいです特定の Web ページなしで。
------解決策---------
curl+regex
------解決策---------
覚えています、前に機関車に尋ねました。実際、このコードは Locomotive によってインターセプトされる可能性があります。もちろん、正規表現については、4 階を参照してください。これらの文字はエスケープする必要があるようです。自分で試してみて、結果を確認してください。
------解決策---------
文字列インターセプトを使用する
------解決策---------
正規表現を記述してください!
------解決策---------
curl でデータを取得、htmldom 解析
------解決策---------

話し合う

具体的に何か教えてもらえますか?すごく簡単なんですが、まだ分かりません!私は基本的に PHP について何も知りません。'
使用しているカール コードを書いてもらえますか?ありがとうございました! ! ! ! ! ! ! ! ! !
このcurl+regexは、機関車コレクターのインターフェイスプラグインで直接使用できますか?

------解決策---------
CURL、Baidu で検索すると、多くの使用法があります。情報、定期 PHP とは関係ありません。どの言語にも関係あります。
投稿者には、自分でもっと研究をすることをお勧めします。研究から得たものは生涯役立つでしょう。また、実際の運用でコードに問題が発生した場合に、それを解決する能力も向上します。彼はそれを投稿して議論することができます。これは学者の精神です。参考までに、私は話しすぎました。ふふ!
------解決策---------
curl+regex
------解決策------------------
リモート URL
を読み取り、通常の URL を使用しますマッチング
結果を取得
データベースまたはファイルに保存できます
------解決策---------------
アイデアを教えます、あなたは勉強する必要があります
上で非常に具体的な手順をすでに説明しました。
勉強しましょう
------解決策--------
通常は Curl + Regular ですが、現在はそれを使用していますJava のオープンソース プログラムなので、作成者はそれを参照できます。
私のブログは、NARUTO-ナルト-の漫画をキャプチャするこの用途について書いています。
http://web-harvest.sourceforge.net/index.php
関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート