Rumah pembangunan bahagian belakang tutorial php php匹配指定标签的内容

php匹配指定标签的内容

Jun 23, 2016 pm 01:32 PM

php匹配指定div内容,在用php编写采集程序的时候,抓取到的网页数据有时候我们只需要一小段标签内容,怎么才能冲html代码中提取出来呢,这里提供一个函数示例,实现php匹配任意html标签内的所有内容:

/*** 匹配任意id的html标签内容* */function getWebTag($tag_id,$tag='div',$data=false){             $charset_pos = stripos($data,'charset');        if($charset_pos) {            if(stripos($data,'utf-8',$charset_pos)) {                $data = iconv('utf-8','utf-8',$data);            }else if(stripos($data,'gb2312',$charset_pos)) {                $data = iconv('gb2312','utf-8',$data);            }else if(stripos($data,'gbk',$charset_pos)) {                $data = iconv('gbk','utf-8',$data);            }        }               preg_match_all('/<'.$tag.'/i',$data,$pre_matches,PREG_OFFSET_CAPTURE);    //获取所有div前缀        preg_match_all('/<\/'.$tag.'/i',$data,$suf_matches,PREG_OFFSET_CAPTURE); //获取所有div后缀        $hit = strpos($data,$tag_id);        if($hit == -1) return false;    //未命中        $divs = array();    //合并所有div        foreach($pre_matches[0] as $index=>$pre_div){            $divs[(int)$pre_div[1]] = 'p';            $divs[(int)$suf_matches[0][$index][1]] = 's';           }               //对div进行排序        $sort = array_keys($divs);        asort($sort);               $count = count($pre_matches[0]);        foreach($pre_matches[0] as $index=>$pre_div){            //<div $hit <div+1    时div被命中            if(($pre_matches[0][$index][1] < $hit) && ($hit < $pre_matches[0][$index+1][1])){                $deeper = 0;                //弹出被命中div前的div                while(array_shift($sort) != $pre_matches[0][$index][1] && ($count--)) continue;                //对剩余div进行匹配,若下一个为前缀,则向下一层,$deeper加1,                //否则后退一层,$deeper减1,$deeper为0则命中匹配,计算div长度                foreach($sort as $key){                    if($divs[$key] == 'p') $deeper++;                    else if($deeper == 0) {                        $length = $key-$pre_matches[0][$index][1];                        break;                    }else {                        $deeper--;                    }                }                $hitDivString = substr($data,$pre_matches[0][$index][1],$length).'</'.$tag.'>';                break;            }        }        return $hitDivString;}
Salin selepas log masuk

调用示例

$html=file_get_contents('http://www.baidu.com');

$divContent=getWebTag('id="content"','div',$html);


Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Tag artikel panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

11 skrip pemendek URL terbaik PHP (percuma dan premium) 11 skrip pemendek URL terbaik PHP (percuma dan premium) Mar 03, 2025 am 10:49 AM

11 skrip pemendek URL terbaik PHP (percuma dan premium)

Pengenalan kepada API Instagram Pengenalan kepada API Instagram Mar 02, 2025 am 09:32 AM

Pengenalan kepada API Instagram

Bekerja dengan Data Sesi Flash di Laravel Bekerja dengan Data Sesi Flash di Laravel Mar 12, 2025 pm 05:08 PM

Bekerja dengan Data Sesi Flash di Laravel

Bina aplikasi React dengan hujung belakang Laravel: Bahagian 2, React Bina aplikasi React dengan hujung belakang Laravel: Bahagian 2, React Mar 04, 2025 am 09:33 AM

Bina aplikasi React dengan hujung belakang Laravel: Bahagian 2, React

Respons HTTP yang dipermudahkan dalam ujian Laravel Respons HTTP yang dipermudahkan dalam ujian Laravel Mar 12, 2025 pm 05:09 PM

Respons HTTP yang dipermudahkan dalam ujian Laravel

Curl dalam PHP: Cara Menggunakan Pelanjutan PHP Curl dalam API REST Curl dalam PHP: Cara Menggunakan Pelanjutan PHP Curl dalam API REST Mar 14, 2025 am 11:42 AM

Curl dalam PHP: Cara Menggunakan Pelanjutan PHP Curl dalam API REST

12 skrip sembang php terbaik di codecanyon 12 skrip sembang php terbaik di codecanyon Mar 13, 2025 pm 12:08 PM

12 skrip sembang php terbaik di codecanyon

Pemberitahuan di Laravel Pemberitahuan di Laravel Mar 04, 2025 am 09:22 AM

Pemberitahuan di Laravel

See all articles