如何使用 Selenium Python 從 Shadow Root 擷取資料？-Python教學-PHP中文網

如何使用 Selenium Python 從 Shadow Root 擷取資料？

Linda Hamilton

發布： 2024-10-19 06:38:30

原創

1149 人瀏覽過

How to Extract Data from a Shadow Root Using Selenium Python?

使用Selenium Python 從影子根提取資訊

在提供的URL https://www.tiendasjumbo.co/ 的上下文中Buscar ?q=mani，從#shadow-root（開放）中的元素提取資訊提出了挑戰。以下程式碼片段說明了這個問題：

<code class="python">from selenium import webdriver
import time
from random import randint

driver = webdriver.Firefox(executable_path="C:\Program Files (x86)\geckodriver.exe")
driver.implicitly_wait(10)
time.sleep(4)

url = "https://www.tiendasjumbo.co/buscar?q=mani"
driver.maximize_window()
driver.get(url)
driver.find_element_by_xpath('//h1[@class="impulse-title"]')</code>

登入後複製

解決方案：

網頁中的產品封裝在影子根中。要存取這些元素，必須使用shadowRoot.querySelector()方法。以下代碼演示了此策略：

<code class="python">driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
print(item.text)</code>

登入後複製

輸出：

La especial mezcla de nueces, maní, almendras y marañones x 450 g

登入後複製

參考：

[無法使用Selenium 和Python 在#shadow-root (open) 中找到登入元素](https://stackoverflow.com/questions/66779988/unable-to-locate-the-sign-in-element-within- Shadow- root-open-using-selenium-a)
[如何使用Selenium 和Python 在網站https://www.virustotal.com 中找到Shadow-root (open) 中的名字字段] (https:/ /stackoverflow.com/questions/66820107/how-to-locate-the-first-name-field-within-shadow-root-open-within-the-website)

注意：

Microsoft Edge 和Google Chrome 版本96 引入了影子根處理方面的變更。如需更新信息，請參閱以下資源：

Java: https://gist.github.com/chandrashekar4242/c2ef0878241f737cc89ec1878d60f974
https://gist.github.com/hongtaocao/6409059fd2bb8d250f925b6b68c3a660

a2473 8

紅寶石：

https://gist.github.com/yuusuke-tanaka1/3493c57d228f759be374aeb0b64e51d9

以上是如何使用 Selenium Python 從 Shadow Root 擷取資料？的詳細內容。更多資訊請關注PHP中文網其他相關文章！