Selenium Python を使用してシャドウ ルート内から情報を抽出する方法
Selenium は、Web 自動化のための堅牢なフレームワークを提供します。シャドウ ルートなど、動的に読み込まれる Web 要素からの情報。このガイドでは、シャドウ ルート内の特定のオンライン ストアから製品ラベルやその他のフィールドを抽出するという課題を克服する方法を説明します。
課題: シャドウ ルートからの情報の抽出
シャドウ ルートに遭遇した場合、要素の位置と抽出のための代替戦略を検討する必要があります。従来の XPath アプローチでは十分ではない可能性があります。このガイドでは、Selenium のexecute_script() メソッドを利用してシャドウ ルートにアクセスし、必要な情報を取得するソリューションを紹介します。
解決策: ShadowRoot.querySelector() を使用する
To製品ラベルを抽出するには、次のアプローチを使用します:
<code class="python">driver.get('https://www.tiendasjumbo.co/buscar?q=mani') item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')") print(item.text) </code>
出力:
La especial mezcla de nueces, maní, almendras y marañones x 450 g
結論
このソリューションは、効果的に抽出する方法を示します。 Selenium Python を使用してシャドウ ルート内から情報を取得し、困難なシナリオでも Web インタラクションを自動化するための信頼できる技術を提供します。
以上がSelenium Python を使用してシャドウ ルート内から情報を抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。