如何使用 Selenium Python 从影子根中提取信息
Selenium 为 Web 自动化提供了一个强大的框架,包括提取信息的能力来自动态加载的 Web 元素(例如影子根)的信息。本指南将演示如何克服从影子根中的特定在线商店提取产品标签和其他字段的挑战。
挑战:从影子根中提取信息
当遇到影子根时,有必要探索元素定位和提取的替代策略。传统的 XPath 方法可能还不够。本指南提供了一个利用 Selenium 的 execute_script() 方法来访问影子根并检索所需信息的解决方案。
解决方案:使用 ShadowRoot.querySelector()
到提取产品标签,使用以下方法:
<code class="python">driver.get('https://www.tiendasjumbo.co/buscar?q=mani') item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')") print(item.text) </code>
输出:
La especial mezcla de nueces, maní, almendras y marañones x 450 g
结论
此解决方案演示了如何有效提取使用 Selenium Python 从影子根中获取信息,即使在具有挑战性的场景中也能提供可靠的自动化 Web 交互技术。
以上是如何使用 Selenium Python 从 Shadow Root 中提取信息?的详细内容。更多信息请关注PHP中文网其他相关文章!