本功能类似于将<img>标签替换成markdown格式的文本,要提取其中的文件名,并替换<img>标签。如:
图片:<font color="#000000"><img width="147" height="52" src="http://127.0.0.1:80/admin/../upload/pimg1054_1.png" alt="" /></font></p> <img width="147" height="52" src="admin/../upload/asffas_ad.jpg" alt="" /><p style="margin-bottom: 0cm;">保留两位小数</p> </p>
替换结果为:
图片:<font color="#000000">pimg1054_1.png</font></p> asffas_ad.jpg<p style="margin-bottom: 0cm;">保留两位小数</p> </p>
我写的正则:
import re a = '图片:<font color="#000000"><img width="147" height="52" src="http://127.0.0.1:80/JudgeOnline/admin/../upload/pimg1054_1.png" alt="" /></font></p> <img width="147" height="52" src="http://127.0.0.1:80/JudgeOnline/admin/../upload/asffas_ad.png" alt="" /><p style="margin-bottom: 0cm;">保留两位小数</p> </p>' #re_img = re.compile('<\s*img.*src=[\"\']?.*?(\/\.[jpngif]+)[\"\']?.*\/>') re_img = re.compile('''<\s*img.*src=["']?[\S]+\/([^\/]+\.[jpngif]+)["']?.*?>''') s = re_img.sub(r'\1', a) print(s)
貌似匹配了第一图片标签的<img和最后一个图片标签的/>,结果只保留了一个图片。
请问该怎么替换?
是这样吗?