1.問題の説明
固定 Web ページで必要な情報をキャプチャし、表形式で保存します。 wustojのランキングリストを参考に練習してみました、アドレス:wustoj
2. アイデア
私は自分の Web サイトで PHP を簡単に学び、それを使って何かをしただけです。私の考えは次のとおりです。
(1) Webページのソースコードを表示し、ファイルに保存します。(2) 必要な情報に基づいて正規表現を記述し、ファイルを読み込み、正規表現に基づいて必要な情報を抽出します。正規表現を作成するときは、正規表現をグループ化して抽出を容易にすることをお勧めします。
(3) Excel操作の場合、抽出した情報をExcel形式で出力します。
Excel リンクを処理するためのオープンソース PHP の改善: クリックしてリンクを開きます
3. 体験
^ は元の文字列の先頭である場合を意味し、$ は元の文字列の末尾である場合を意味します。
ヌル文字は必ずしもスペースである必要はありません。
preg_macth_all(/$pattern/,$subject,matches) のように、() を使用してグループ化するのが良い方法です。
matches は 2 次元配列です。_all がない場合は、1 次元配列である最初の部分のみが一致します。
$matches[0] には、完全なパターンのすべての一致が保持されます。 $matches[1] は、最初のサブグループ内のすべての一致、つまりすべての一致の最初の部分を保存します。
私が使用する中国語の一致文字列は $patt_ch=chr(0x80)."-".chr(0xff) です。
4.コード
リーリー