> 백엔드 개발 > 파이썬 튜토리얼 > 채용정보 검색 자동화: Python으로 LinkedIn 채용정보 스크래핑

채용정보 검색 자동화: Python으로 LinkedIn 채용정보 스크래핑

Patricia Arquette
풀어 주다: 2025-01-21 04:15:14
원래의
810명이 탐색했습니다.

LinkedIn 데이터에 따르면 평균 구직자는 구직 활동에 매주 11시간을 투자합니다. 기술 역할은 다양한 플랫폼에 걸쳐 수백 개의 목록을 선별하는 등 이를 크게 증폭시킵니다. 내 파트너의 구직 활동은 이러한 비효율성을 강조했습니다. 매일 LinkedIn만 스크롤하는 데 몇 시간이 소요됩니다. 보다 효율적인 솔루션이 필요했습니다.

도전

글의 양이 웹 개발자를 압도합니다. 런던에서 간단한 "프런트엔드 개발자" 검색을 하면 401개의 결과가 나왔습니다. 요구되는 각 목록:

  • 제목 검토에 5초
  • 세부정보에 액세스하려면 3~4번 클릭
  • 요구 사항을 스캔하는 데 30~60초
  • 유망한 역할을 추적하기 위한 수동 복사 및 붙여넣기
  • 지속적인 탭 전환 및 역추적

401개 작업을 처리하는 것은 몇 시간의 반복적인 육체 노동으로 이어집니다.

솔루션: 자동화된 작업 흐름

3단계 자동화 파이프라인을 통해 이 프로세스가 약 10분으로 단축되었습니다.

  1. Python 기반 작업 데이터 스크래핑
  2. 스프레드시트 기반 대량 필터링
  3. 우수 후보 집중 검토

1단계: 지능형 스크래핑

JobSpy는 JobsParser 처리를 통해 기초를 형성했습니다.

  • 명령줄 인터페이스(CLI)
  • 비율 제한(LinkedIn 차단 방지)
  • 오류 처리 및 재시도

실행:

<code>pip install jobsparser</code>
로그인 후 복사
<code>jobsparser \
    --search-term "Frontend Developer" \
    --location "London" \
    --site linkedin \
    --results-wanted 200 \
    --distance 25 \
    --job-type fulltime</code>
로그인 후 복사

CSV 출력에는 포괄적인 데이터가 포함되었습니다.

  • 직위 및 회사
  • 전체 설명
  • 직종 및 등급
  • 게시일
  • 신청 바로가기

Automate Your Job Search: Scraping   LinkedIn Jobs with Python

JobSpy와 JobsParser는 LinkedIn, 인디드, Glassdoor, Google, ZipRecruiter를 포함한 다른 채용 게시판도 지원합니다.

2단계: 효율적인 대량 필터링

Pandas를 고려하고 테스트하는 동안 Google Sheets는 더 큰 유연성을 제공했습니다. 관련된 필터링 전략:

  1. 시간 기반 필터링: 지난 7일
  • 오래된 직업일수록 응답률이 낮습니다.
  • 최근 게시물을 보면 채용이 활발한 것으로 나타났습니다.
  1. 경험 기반 필터링: "job_level"을 경험과 일치:

처음 구직자의 경우:

  • "인턴십"
  • "입문 레벨"
  • "해당 사항 없음"
  1. 기술 스택 필터링: 다음을 포함하는 "설명":
  • 리액트라는 용어

보다 정교한 필터는 여러 기술을 통합할 수 있습니다.

이로 인해 401개의 일자리가 관리 가능한 8개로 줄었습니다.

3단계: 대상 검토

필터링된 작업이 수행되었습니다.

  1. 빠른 제목/회사 스캔(10초)
  2. 새 탭에서 유망한 "job_url" 열기
  3. 자세한 설명 리뷰입니다.

결론

이 도구는 구직 과정을 간소화하는 것을 목표로 합니다. 피드백과 질문을 환영합니다.

위 내용은 채용정보 검색 자동화: Python으로 LinkedIn 채용정보 스크래핑의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿