Python 구현: 웹 사이트에 있는 모든 XPath의 트리 구조를 얻는 방법은 무엇입니까?

Question

방법 1 Python을 사용하여 웹 사이트(https://startpagina.nl)에 있는 모든 xpath의 계층적 트리를 얻으려고 할 때 먼저 다음을 사용하여 분기의 xpath를 얻으려고 했습니다. /html/body:fromseleniumimportwebdriverurl='https: //startpagina .nl'driver=webdriver.Firefox()driver.get(url)test=driver.fin

P粉127901279 · Answer

하나 이상의 요소를 선택하는 XPath의 총 수는 무한합니다(예: /a/b/../b/../b/../b 这样的路径），但是如果您限制将自己添加到 /a[i]/b[j]/c[k] 형식의 경로가 포함되며, 경로 수는 요소 수와 같고 XPath의 "트리"는 원래 XML 트리와 동형입니다.

/a/b/c、/a/b/d과 같이 숫자 조건자 없이 다른 경로를 원하는 경우 가장 쉬운 방법은 아마도 XML 문서를 반복하고 각 요소에 대한 경로(이 형식)를 가져와 중복을 제거하는 것입니다. 단순한 경로 목록 대신 트리 구조를 원하는 경우 중첩된 맵/사전을 사용하여 빌드하세요.

불평/html/body/ 的原因是合法的 XPath 表达式不能包含尾随 /.

방법 1

방법 2

질문

예상 출력