Selenium Python を使用した Shadow DOM 抽出
指定されたオンライン ストア URL 内で、製品情報は #shadow-root (open) 内に存在します。要素。 Selenium Python を使用してこのデータにアクセスするには、shadowRoot.querySelector() メソッドを利用する必要があります。
解決策:
製品ラベルを取得するには、次のコードを使用します。 :
<code class="python">driver.get('https://www.tiendasjumbo.co/buscar?q=mani') item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')") print(item.text)</code>
このスクリプトは、指定された URL に移動し、JavaScript を実行してシャドウ DOM 内の要素にアクセスします。
参照:
参照さらに詳しい情報については、次のディスカッションを参照してください:
Microsoft Edge および Google Chrome バージョン 96 のメモ:
Chrome v96 では、Selenium のシャドウ ルートの戻り値が変更されました。この特定のバージョンに関するガイダンスとして、提供されているリソースを利用してください。
以上がSelenium と Python を使用して Shadow DOM 要素を抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。