python - 这个字段的src属性如何用xpath选择？

Question

{代码...} 这个字段的src属性如何用xpath选择？ 我的写法是： {代码...} 中间的xpath是从chrome直接copy的但是无法显示出src属性，最后弹出的是[]不知道哪里有问题、另外如果知道css选择器怎么写的，也可以告知一...

迷茫 · Answer

你想幹啥，抓取到的html進行過濾嗎？可以考慮正規查找

大家讲道理 · Answer

chrome有個工具叫xpath-helper,可以去應用程式商店下載，這樣就可以用這個工具來檢查你的xpath語法是否正確了。
另外如果語法正確，但是在程式中提取不到，這時就要考慮原網頁是動態頁面，需要用到jsjs解析了。

PHPz · Answer

瀏覽器有容錯機制，對於不規範的html標籤，會進行修正，所以你在控制台看到的頁面結構，和你用程式碼請求到的頁面結構可能是不一樣的。
解：
把選擇器的範圍放的鬆一點
使用class去定位
在程式碼中打斷點，單步執行去定位這個標籤的xpath規則

黄舟 · Answer

我通常使用bs4, 無腦解決. 用正則也行,但是傷腦

img_tag = soup.find('img', attrs=dict(class="js-refreshCaptcha captcha") )
img_tag_src = img_tag['src']

大家讲道理 · Answer