현재 저는 크롤러에 대한 지식을 배우고 셀레늄을 사용하여 일부 복잡한 웹사이트를 크롤링하고 있습니다.
크롤링해야 하는 작업 주문 웹사이트(비밀번호를 모릅니다)에 먼저 인증 시스템에 로그인한 후 인증 시스템 페이지에서 작업 주문 시스템 연결을 클릭해야 하는 데 문제가 발생했습니다. 로그인하지 않고 자동으로 작업 주문으로 이동합니다. 단일 시스템 웹사이트에서 이 시스템의 데이터를 크롤링하려면 크롤러를 어떻게 사용해야 합니까?
다음은 셀레늄으로 얻은 작업 지시 시스템, 인증 시스템에 대한 html입니다
Firefox 확장 프로그램인 Selenium ide를 사용하여 작업을 기록하세요.
그런 다음 Python 파일로 내보냅니다.
변경하고 실행하면 됩니다.
곤충의 달인이 쓴 책을 읽어보시길 권합니다.
예를 들어 요청 라이브러리를 크롤러로 사용하는 경우 먼저 session()을 생성하고 A가 로그인하면 B가 이동할 페이지입니다.
으아아아생성된 T는 영원히 유지되는 저장된 쿠키를 나타냅니다.