58.com 작업 페이지를 크롤링 할 때 올바른 수의 지원자 및 시청자를 얻는 방법은 무엇입니까?
58.com 채용 정보 크롤링 : 지원자 및 시청자의 일관되지 않은 데이터 문제 해결
58.com 채용 페이지를 크롤링 할 때는 종종 어려운 문제가 발생합니다. 웹 페이지 소스 코드로 표시되는 신청자 수와 시청자 수는 페이지에 실제로 표시된 데이터와 일치하지 않으며 소스 코드는 종종 0으로 표시되는 반면 페이지의 실시간으로 업데이트 된 데이터는 브라우저 개발자 도구 (F12)의 요소 내용과 일치합니다. 이 기사는이 문제를 해결하고 정확한 지원자와 시청자를 얻는 방법을 살펴 봅니다.
문제 분석 :
58.com은 데이터가 악의적으로 크롤링되는 것을 방지하기 위해 데이터를 동적으로로드하는 방법을 채택했습니다. 페이지의 지원자 및 시청자 수는 HTML 소스 코드에서 직접 얻지 못하지만 JavaScript를 통해 비동기로로드됩니다. 따라서 직접 구문 분석 HTML 소스 코드는 올바른 데이터를 얻을 수 없습니다.
해결책:
올바른 수의 지원자 및 시청자를 얻으려면 58.com에서 제공하는 API 인터페이스를 찾아야합니다. 네트워크 요청을 분석하면 채용 정보 통계를 얻기위한 API 인터페이스를 찾을 수 있으며 다음 형식과 유사한 URL을 찾을 수 있습니다.
<code>https://statisticszp.58.com/position/totalcount/?infoId=27988...</code>
infoId
매개 변수는 특정 위치 ID를 나타내며 대상 모집 페이지의 URL에 따라 추출해야합니다.
API는 데이터를 반환합니다. 예제 :
API 인터페이스에서 반환 한 JSON 데이터에는 필요한 정보가 포함되어 있습니다.
{ "DeliveryCount": 1141, // 지원자 수 "CommentCount": 0, "Infocount": 4, // 시청자 수 "ResumerEdpercent": 0, "추천": "", "NextUrl": "null" }
deliveryCount
필드는 신청자 수를 나타내고 infoCount
필드는 시청자 수를 나타냅니다.
구현 단계 :
작업 ID (Infoid) : 대상 모집 페이지의 URL을 분석하고 작업 ID에 해당하는 매개 변수 값을 찾으십시오. 이를 위해서는 일반 표현식 또는 기타 문자열 처리 방법을 사용해야 할 수 있습니다.
구조 API 요청 URL : 추출 된
infoId
API URL 템플릿으로 바꾸어 완전한 API 요청 URL을 형성하십시오.API 요청 보내기 : Python의
requests
라이브러리 또는 기타 HTTP 클라이언트를 사용하여 API URL에 요청을 보냅니다.JSON 데이터 분석 : API에 의해 반환 된 JSON 데이터를 Python 사전으로 구문 분석하고,
deliveryCount
와infoCount
의 값, 즉 올바른 수의 지원자 및 시청자 수를 추출합니다.
위의 단계를 통해 58.com 웹 페이지의 동적로드 메커니즘을 우회하고 채용 페이지에서 지원자 및 시청자 수를 정확하게 얻을 수 있습니다. API 인터페이스의 주소 및 매개 변수 이름은 변경 될 수 있으며 실제 조건에 따라 조정해야합니다. 동시에 서버에 과도한 압력을 피하기 위해 58.com의 robots.txt 규칙을 따르십시오.
위 내용은 58.com 작업 페이지를 크롤링 할 때 올바른 수의 지원자 및 시청자를 얻는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











파이썬은 자동화, 스크립팅 및 작업 관리가 탁월합니다. 1) 자동화 : 파일 백업은 OS 및 Shutil과 같은 표준 라이브러리를 통해 실현됩니다. 2) 스크립트 쓰기 : PSUTIL 라이브러리를 사용하여 시스템 리소스를 모니터링합니다. 3) 작업 관리 : 일정 라이브러리를 사용하여 작업을 예약하십시오. Python의 사용 편의성과 풍부한 라이브러리 지원으로 인해 이러한 영역에서 선호하는 도구가됩니다.

Python은 부드러운 학습 곡선과 간결한 구문으로 초보자에게 더 적합합니다. JavaScript는 가파른 학습 곡선과 유연한 구문으로 프론트 엔드 개발에 적합합니다. 1. Python Syntax는 직관적이며 데이터 과학 및 백엔드 개발에 적합합니다. 2. JavaScript는 유연하며 프론트 엔드 및 서버 측 프로그래밍에서 널리 사용됩니다.

Visual Studio Code (VSCODE)는 Microsoft에 의해 개발되었으며 Electron Framework를 사용하여 구축되었으며 주로 JavaScript로 작성되었습니다. JavaScript, Python, C, Java, HTML, CSS 등을 포함한 광범위한 프로그래밍 언어를 지원하며 확장을 통해 다른 언어에 대한 지원을 추가 할 수 있습니다.

코드에서 코드 실행은 6 단계 만 가져갑니다. 1. 프로젝트 열기; 2. 코드 파일을 작성하고 작성합니다. 3. 터미널을 엽니 다. 4. 프로젝트 디렉토리로 이동; 5. 적절한 명령으로 코드를 실행하십시오. 6. 출력을 봅니다.

VS Code와 Pycharm의 주요 차이점은 다음과 같습니다. 1. 확장 성 : VS 코드는 확장 가능하며 플러그인 시장이 풍부하고 Pycharm은 기본적으로 더 넓은 기능을 가지고 있습니다. 2. 가격 : vs 코드는 무료이며 오픈 소스이며 Pycharm은 전문 버전에 대해 지불됩니다. 3. 사용자 인터페이스 : VS 코드는 현대적이고 친근하며 Pycharm은 더 복잡합니다. 4. 코드 내비게이션 : 대 코드는 소규모 프로젝트에 적합하며 Pycharm은 대규모 프로젝트에 더 적합합니다. 5. 디버깅 : vs 코드는 기본적이며 Pycharm은 더 강력합니다. 6. 코드 리팩토링 : vs 코드는 기본적이며 Pycharm은 더 풍부합니다. 7. 코드

Visual Studio Code에서 언어를 변경하려면 : 1. 언어 상태 표시 줄을 엽니 다. 2. 언어 상태 표시 줄을 클릭하여 메뉴를 엽니 다. 3. 원하는 언어를 선택하십시오. 4. vscode가 다시로드 될 때까지 기다리십시오. 5. 언어가 변경되었는지 확인하십시오.

Visual Studio Code (VSCODE)는 Microsoft가 개발 한 크로스 플랫폼, 오픈 소스 및 무료 코드 편집기입니다. 광범위한 프로그래밍 언어에 대한 가볍고 확장 성 및 지원으로 유명합니다. VSCODE를 설치하려면 공식 웹 사이트를 방문하여 설치 프로그램을 다운로드하고 실행하십시오. VScode를 사용하는 경우 새 프로젝트를 만들고 코드 편집, 디버그 코드, 프로젝트 탐색, VSCODE 확장 및 설정을 관리 할 수 있습니다. VSCODE는 Windows, MacOS 및 Linux에서 사용할 수 있으며 여러 프로그래밍 언어를 지원하며 Marketplace를 통해 다양한 확장을 제공합니다. 이점은 경량, 확장 성, 광범위한 언어 지원, 풍부한 기능 및 버전이 포함됩니다.

VS 코드는 가상 환경을 활성화 할 수 없습니다.이 이유는 다음과 같은 이유로 발생할 수 있습니다. 통역 경로 오류, 환경 변수 구성 문제, 플러그인 또는 가상 환경 오류. 솔루션에는 올바른 통역사 경로 설정, 환경 변수 확인, 플러그인 업데이트, 가상 환경 재생성 및 플러그인 업데이트 정기적 인 솔루션이 포함됩니다.
