C# 正则解析HTML抓取所有的图片_html/css_WEB-ITnose

WBOY
풀어 주다: 2016-06-24 12:01:14
원래의
1228명이 탐색했습니다.

抓取html中的所有图片,目前img标签中的已经能够拿出来了,但是还有一些是这样写的

比如

<div style="background-image:url('../image/493aid.png')"></div><div style="background-image:url(../image/493aid.png)"></div>
로그인 후 복사

或者是这种写法
<div style="background:url('../image/493aid.png')"></div>
로그인 후 복사

也有可能不是div,可能是td,或者其他标签。


弄了半天,始终没弄好。

求大神帮助。


回复讨论(解决方案)

有的图片是流输出的 也是要考虑的

<body ><div id = "a"><div style="background-image:url('../image/493aid.png')"></div><div style="background-image:url(../image/491aid.png)"></div><div style="background:url('../image/492aid.png')"></div></div></body><script>var all = document.getElementById("a").innerHTML,	reg = /[^\'\"\(]+(\.png|\.jpf|\.bmp)/g;console.log(all);allImg = all.match(reg);console.log(allImg);var allimg = [];all.replace(reg,function($1){	allimg.push($1);});console.log(allimg);
로그인 후 복사
로그인 후 복사


说起来,感觉你去抓取这些没有意义的啊,大部分的背景图片,都是以class中加载过来的。

一般不写在标签中的啊。

<body ><div id = "a"><div style="background-image:url('../image/493aid.png')"></div><div style="background-image:url(../image/491aid.png)"></div><div style="background:url('../image/492aid.png')"></div></div></body><script>var all = document.getElementById("a").innerHTML,	reg = /[^\'\"\(]+(\.png|\.jpf|\.bmp)/g;console.log(all);allImg = all.match(reg);console.log(allImg);var allimg = [];all.replace(reg,function($1){	allimg.push($1);});console.log(allimg);
로그인 후 복사
로그인 후 복사


说起来,感觉你去抓取这些没有意义的啊,大部分的背景图片,都是以class中加载过来的。

一般不写在标签中的啊。




虽然你完全没达到我的要求,但是还是给分,我已经自己实现,一边看正则表达式的基础,一遍写正则验证,已经搞定了我的这个需求,虽然不是那么完美。
관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!