PHPでWebページからデータをクロールするにはどうすればよいですか?
たとえば、Web サイトには、人々の名前、住所、電話番号、習得した言語などに関するデータが含まれています。
プログラムを使用して言語の習得などの情報を取得したいのですが、言語は複数ありますマスターできた、たぶん2、3種類!
専門家の方、申し訳ありませんが、この機能を実現するには PHP を使用する方法を教えてください。コードを直接表示するのが最善です。 。
-----解決策--------------------------------
curl または file_get_contents を使用します
ターゲット Web サイトの HTML コードを読み取り、そのコードに従って正規表現を記述して必要なものを抽出する必要があります
例を挙げるのは難しいです特定の Web ページなしで。
------解決策---------
curl+regex
------解決策---------
覚えています、前に機関車に尋ねました。実際、このコードは Locomotive によってインターセプトされる可能性があります。もちろん、正規表現については、4 階を参照してください。これらの文字はエスケープする必要があるようです。自分で試してみて、結果を確認してください。
------解決策---------
文字列インターセプトを使用する
------解決策---------
正規表現を記述してください!
------解決策---------
curl でデータを取得、htmldom 解析
------解決策---------
------解決策---------CURL、Baidu で検索すると、多くの使用法があります。情報、定期 PHP とは関係ありません。どの言語にも関係あります。
投稿者には、自分でもっと研究をすることをお勧めします。研究から得たものは生涯役立つでしょう。また、実際の運用でコードに問題が発生した場合に、それを解決する能力も向上します。彼はそれを投稿して議論することができます。これは学者の精神です。参考までに、私は話しすぎました。ふふ!
------解決策---------curl+regex
------解決策------------------リモート URL
を読み取り、通常の URL を使用しますマッチング
結果を取得
データベースまたはファイルに保存できます
------解決策---------------アイデアを教えます、あなたは勉強する必要があります
上で非常に具体的な手順をすでに説明しました。
勉強しましょう
------解決策--------通常は Curl + Regular ですが、現在はそれを使用していますJava のオープンソース プログラムなので、作成者はそれを参照できます。
私のブログは、NARUTO-ナルト-の漫画をキャプチャするこの用途について書いています。
http://web-harvest.sourceforge.net/index.php