Web スクレイピングのコンテキストでは、CSS クラスに基づいて特定の要素を正確にターゲットにすることが重要です。 CSS セレクターは、HTML を操作する場合には簡単ですが、XML ドキュメントを処理する場合や高度な Web スクレイピング技術を利用する場合には、XPath が必要になります。
この質問は、 XPath を使用して「日付」クラスのみに基づいて要素を選択する必要があります。ただし、提供されたコード スニペットは予期しない結果を生成します。
//[@class="date"]
XPath で特定のクラスを持つ要素を適切に選択するには、次の構文を使用する必要があります。
//*[contains(concat(" ", normalize-space(@class), " "), " foo ")]
この中で式:
一般的だが欠陥のある 2 つの XPath避けるべきセレクターには以下が含まれます:
ここで提供される解決策は、この特定の問題に対処する貴重なブログ投稿を公開した仲間の Web スクレーパーによるものです。洞察を共有してくれた彼らに感謝します。
以上がXPath で CSS クラスを正しく選択するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。