BeautifulSoup은 모든 데이터를 수집하지만 .findAll()은 하나의 상위 항목에 대한 링크만 반환합니다.

Question

Python에서 BeautifulSoup을 사용하여 웹사이트를 긁어내려고 합니다. 내가 액세스하려는 모든 링크를 포함하여 모든 데이터가 수집됩니다. 그러나 .findAll() 함수를 사용하면 내가 찾고 있는 링크의 일부만 반환됩니다. 즉, 다음 xpath의 /html/body/div[1]/div/div[2]/div/div[2]/div[1] 링크만 반환됩니다. 그러면 /html 링크가 무시됩니다. /body/div [1]/div/div[2]/div/di

P粉553428780 · Answer

페이지에 표시되는 데이터는 요소에 Json으로 저장됩니다. 이를 구문 분석하려면 다음 예를 사용할 수 있습니다.

으아아아

인쇄:

으아아아