正则表达式 - 请教一个 Python 爬虫信息提取问题
PHP中文网
PHP中文网 2017-04-17 13:57:30
0
1
691

最近在学写爬虫,聚合程序员的招聘信息,已经聚合了几个网站数据: http://www.codejob.me

但在写智联招聘爬虫的时候,薪酬如'6001-8000'

我的python代码:

s = '6001-8000'
if '-' in s:
    m = re.match(r'(.*?)-(.*?)', s)
    print m.group(1)
    print m.group(2)

为什么m.group(1)成功得到6001,而m.group(2)得到的是空? 想请教一下大家了。

PHP中文网
PHP中文网

认证高级PHP讲师

全部回覆(1)
洪涛

.*? 非貪婪匹配,代表任意盡可能短的字串

空字串就可以匹配了 所以第二個.*?匹配到的就是空字符串

換用 (d+)-(d+)

熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板