Im Zusammenhang mit Web Scraping ist die genaue Ausrichtung auf bestimmte Elemente basierend auf ihren CSS-Klassen von entscheidender Bedeutung. Während CSS-Selektoren bei der Arbeit mit HTML unkompliziert sind, wird XPath erforderlich, wenn man mit XML-Dokumenten arbeitet oder fortgeschrittene Web-Scraping-Techniken verwendet.
Diese Frage ergibt sich aus der Sie müssen Elemente ausschließlich anhand ihrer „Datums“-Klasse mithilfe von XPath auswählen. Das bereitgestellte Code-Snippet führt jedoch zu unerwarteten Ergebnissen.
//[@class="date"]
Um Elemente mit einer bestimmten Klasse in XPath richtig auszuwählen, sollte die folgende Syntax verwendet werden:
//*[contains(concat(" ", normalize-space(@class), " "), " foo ")]
In diesem Ausdruck:
Zwei häufige, aber fehlerhafte XPath-Selektoren, die Sie vermeiden sollten, sind:
Die hier bereitgestellte Lösung wird einem anderen Web-Scraper zugeschrieben, der einen wertvollen Blog-Beitrag zu diesem speziellen Problem veröffentlicht hat. Unser Dank gilt ihnen für das Teilen ihrer Erkenntnisse.
Das obige ist der detaillierte Inhalt vonWie wähle ich eine CSS-Klasse mit XPath richtig aus?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!