PHPで企業情報サイトを収集する具体的な方法
ある企業情報サイトの内容を収集し、加工してWebサイトに表示する小さなプログラムを作りたい いちいち情報を入力したくない。
DIV IDの内容を一つずつ切り出してデータベースに保存したいのですが、同じページ内に同じ値のDIV IDがたくさんあり、切り出す方法が分かりません。
誰か良い方法を教えてくれませんか?
例:
<?php $url="http://www.smartweb.cn"; $str=file_get_contents($url); preg_match_all('/<h2>(.*)</h2>/Usi',$str,$matches); print_r($matches); <div class="clear"></div> </h2>