
Python용 Selenium WebDriver를 사용하여 페이지가 로드될 때까지 대기
웹 스크래핑 성능을 최적화하는 것이 중요하며, 페이지가 완전히 로드되는 시기를 결정하는 것은 효율적인 데이터 추출을 위해 필수적입니다. 무한 스크롤 시나리오의 맥락에서 고정된 기간 동안 맹목적으로 기다리는 것은 비효율적일 수 있습니다. 따라서 질문이 생깁니다. 페이지가 스크롤한 후 새 콘텐츠 로드를 완료한 시기를 어떻게 감지할 수 있습니까?
한 가지 해결책은 특정 요소 기반 대기 조건을 허용하는 WebDriverWait를 활용하는 것입니다. 고정된 기간을 기다리는 대신 특정 요소가 나타날 때까지 기다리도록 WebDriver에 지시하여 페이지가 준비되었음을 나타낼 수 있습니다.
답변에 제공된 코드는 이 접근 방식을 보여줍니다.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 | from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.common.exceptions import TimeoutException
# Set up the webdriver and navigate to the target page
browser = webdriver.Firefox()
browser.get( "url" )
# Define the element to wait for , in this case , an element with a specific ID
element_id = 'IdOfMyElement'
# Set a reasonable waiting time
delay = 3 # seconds
try :
# Use WebDriverWait to wait for the element to appear
myElem = WebDriverWait(browser, delay).until(EC.presence_of_element_located((By.ID, element_id)))
# If the element is found, proceed with data extraction
print ( "Page is ready!" )
except TimeoutException:
# If the element is not found within the time frame, raise an exception
print ( "Loading took too much time!" )
|
로그인 후 복사
페이지의 특정 구조에 따라 기다릴 요소를 사용자 정의함으로써 WebDriver가 페이지의 필요한 부분이 로드될 때까지만 기다리도록 할 수 있습니다. 이 접근 방식은 불필요한 대기를 방지하여 웹 스크래핑 프로세스의 효율성을 크게 향상시킵니다.
위 내용은 페이지가 Python용 Selenium WebDriver에서 새 콘텐츠 로드를 완료한 시기를 효율적으로 감지하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!