안녕하세요 저는 프로그래밍이 처음이라 웹스크래핑에 능숙하신 분의 도움이 필요합니다. 채용 링크에서 "클라이언트 정보" 섹션을 추출하는 임무가 있습니다. 내 스크립트는 "클라이언트 정보" 하나만 추출하지만 다른 링크의 경우에는 그렇게 하지 않고 오류를 발생시킵니다. 문제는 작업 링크를 추출하는 XML 파일 링크가 있고 해당 링크가 열리면 html 코드가 셀레늄을 사용하는 자바 스크립트 아래에 있다는 것입니다. 모든 것을 시도했지만 해결책을 찾지 못했습니다.`def extract_client_info(job_url):
client_info = {'클라이언트 정보': np.nan}
if job_url and job_url != "N/A": try: # Open the job URL driver.get(job_url) # Wait for the page to load WebDriverWait(driver, 30).until( EC.presence_of_element_located((By.CSS_SELECTOR, '.cfe-about-client-v2')) ) # Extract specific details about_client_section = driver.find_element(By.CSS_SELECTOR, '.cfe-about-client-v2') client_location = about_client_section.find_element(By.CSS_SELECTOR, '[data-qa="client-location"]').text.strip() client_job_posting_stats = about_client_section.find_element(By.CSS_SELECTOR, '[data-qa="client-job-posting-stats"]').text.strip() if about_client_section.find_elements(By.CSS_SELECTOR, '[data-qa="client-job-posting-stats"]') else "N/A" client_company_profile = about_client_section.find_element(By.CSS_SELECTOR, '[data-qa="client-company-profile"]').text.strip() # Combine extracted information client_info['About the Client'] = ( f"Location: {client_location}\n" f"Job Posting Stats: {client_job_posting_stats}\n" f"Company Profile: {client_company_profile}" ) except Exception as e: print(f"Failed to get 'About the Client' for {job_url}: {e}") client_info['About the Client'] = np.nan finally: # Wait for 10 seconds before making the next request time.sleep(10) return client_info`
위 내용은 도움이 필요하세요!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!