채용정보 검색 자동화: Python으로 LinkedIn 채용정보 스크래핑
LinkedIn 데이터에 따르면 평균 구직자는 구직 활동에 매주 11시간을 투자합니다. 기술 역할은 다양한 플랫폼에 걸쳐 수백 개의 목록을 선별하는 등 이를 크게 증폭시킵니다. 내 파트너의 구직 활동은 이러한 비효율성을 강조했습니다. 매일 LinkedIn만 스크롤하는 데 몇 시간이 소요됩니다. 보다 효율적인 솔루션이 필요했습니다.
도전
글의 양이 웹 개발자를 압도합니다. 런던에서 간단한 "프런트엔드 개발자" 검색을 하면 401개의 결과가 나왔습니다. 요구되는 각 목록:
- 제목 검토에 5초
- 세부정보에 액세스하려면 3~4번 클릭
- 요구 사항을 스캔하는 데 30~60초
- 유망한 역할을 추적하기 위한 수동 복사 및 붙여넣기
- 지속적인 탭 전환 및 역추적
401개 작업을 처리하는 것은 몇 시간의 반복적인 육체 노동으로 이어집니다.
솔루션: 자동화된 작업 흐름
3단계 자동화 파이프라인을 통해 이 프로세스가 약 10분으로 단축되었습니다.
- Python 기반 작업 데이터 스크래핑
- 스프레드시트 기반 대량 필터링
- 우수 후보 집중 검토
1단계: 지능형 스크래핑
JobSpy는 JobsParser 처리를 통해 기초를 형성했습니다.
- 명령줄 인터페이스(CLI)
- 비율 제한(LinkedIn 차단 방지)
- 오류 처리 및 재시도
실행:
<code>pip install jobsparser</code>
<code>jobsparser \ --search-term "Frontend Developer" \ --location "London" \ --site linkedin \ --results-wanted 200 \ --distance 25 \ --job-type fulltime</code>
CSV 출력에는 포괄적인 데이터가 포함되었습니다.
- 직위 및 회사
- 전체 설명
- 직종 및 등급
- 게시일
- 신청 바로가기
JobSpy와 JobsParser는 LinkedIn, 인디드, Glassdoor, Google, ZipRecruiter를 포함한 다른 채용 게시판도 지원합니다.
2단계: 효율적인 대량 필터링
Pandas를 고려하고 테스트하는 동안 Google Sheets는 더 큰 유연성을 제공했습니다. 관련된 필터링 전략:
- 시간 기반 필터링: 지난 7일
- 오래된 직업일수록 응답률이 낮습니다.
- 최근 게시물을 보면 채용이 활발한 것으로 나타났습니다.
- 경험 기반 필터링: "job_level"을 경험과 일치:
처음 구직자의 경우:
- "인턴십"
- "입문 레벨"
- "해당 사항 없음"
- 기술 스택 필터링: 다음을 포함하는 "설명":
- 리액트라는 용어
보다 정교한 필터는 여러 기술을 통합할 수 있습니다.
이로 인해 401개의 일자리가 관리 가능한 8개로 줄었습니다.
3단계: 대상 검토
필터링된 작업이 수행되었습니다.
- 빠른 제목/회사 스캔(10초)
- 새 탭에서 유망한 "job_url" 열기
- 자세한 설명 리뷰입니다.
결론
이 도구는 구직 과정을 간소화하는 것을 목표로 합니다. 피드백과 질문을 환영합니다.
위 내용은 채용정보 검색 자동화: Python으로 LinkedIn 채용정보 스크래핑의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Linux 터미널에서 Python 버전을 보려고 할 때 Linux 터미널에서 Python 버전을 볼 때 권한 문제에 대한 솔루션 ... Python을 입력하십시오 ...

Python의 Pandas 라이브러리를 사용할 때는 구조가 다른 두 데이터 프레임 사이에서 전체 열을 복사하는 방법이 일반적인 문제입니다. 두 개의 dats가 있다고 가정 해

10 시간 이내에 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법은 무엇입니까? 컴퓨터 초보자에게 프로그래밍 지식을 가르치는 데 10 시간 밖에 걸리지 않는다면 무엇을 가르치기로 선택 하시겠습니까?

Uvicorn은 HTTP 요청을 어떻게 지속적으로 듣습니까? Uvicorn은 ASGI를 기반으로 한 가벼운 웹 서버입니다. 핵심 기능 중 하나는 HTTP 요청을 듣고 진행하는 것입니다 ...

파이썬에서 문자열을 통해 객체를 동적으로 생성하고 메소드를 호출하는 방법은 무엇입니까? 특히 구성 또는 실행 해야하는 경우 일반적인 프로그래밍 요구 사항입니다.

Fiddlerevery Where를 사용할 때 Man-in-the-Middle Reading에 Fiddlereverywhere를 사용할 때 감지되는 방법 ...

이 기사는 Numpy, Pandas, Matplotlib, Scikit-Learn, Tensorflow, Django, Flask 및 요청과 같은 인기있는 Python 라이브러리에 대해 설명하고 과학 컴퓨팅, 데이터 분석, 시각화, 기계 학습, 웹 개발 및 H에서의 사용에 대해 자세히 설명합니다.
