Ganji.com에서 채용 정보를 얻는 Python 방법
이 글은 Python을 사용하여 Ganji.com에서 채용 정보를 얻는 방법에 대한 이전 기사를 주로 공유합니다. 관심 있는 친구는
웹사이트에서 관련 정보를 얻고 Ganji 네트워크 채용 정보를 얻는 방법을 참조할 수 있습니다. , 본 글에서는 참고용으로 간지닷컴 채용 정보를 얻기 위해 파이썬을 사용하기 위한 키 코드를 소개하고 있습니다. 구체적인 내용은 다음과 같습니다
import re import urllib import urllib.request #获取赶集网数据 def begin(url): #要伪装成的浏览器(我这个是用的chrome) headers = ('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36') opener = urllib.request.build_opener() #将要伪装成的浏览器添加到对应的http头部 opener.addheaders=[headers] #读取相应的url data = opener.open(url).read() #将获得的html解码为utf-8 data=data.decode('utf-8') return data #处理数据,返回字典城市对应城市的url def get_cityinfo(data): city_info1=re.findall(r'dl>(.*?)</dl>',data,re.S) city_info2=re.findall(r'(<a.*?</a>)',city_info1[0],re.S) city_dict={} for each in city_info2: key=re.findall('>(.*?)</',each,re.S) city_url=re.findall('href="(.*?)"',each,re.S) city_dict[key[0]]=city_url[0] return city_dict #获取所有的a标签,并从a标签中获取信息 def a_info(data): a_info=re.findall(r'(<a.*?</a>)',data[0],re.S) a_dict={} for each in a_info: key=re.findall('>(.*?)</',each,re.S) a_url=re.findall('"(.*?)"',each,re.S) a_dict[key[0]]=a_url[0] return a_dict #获取对应城市信息的所有分类 def get_cityinfoclass(): #目前先获取招聘信息,后面有时间再继续补充完善这个模块 info= 'zhaopin/' return info #获取对应城市和其城市分类的信息 def getzhaopin(city_info,infoclass): #先搞成都的信息招聘 city_url=city_info['成都'] cdzp_url=city_url+infoclass cdzp_info=begin(cdzp_url) return city_url,cdzp_info #获取成都市招聘信息 def get_zhaopin_info(city_url,cdzp_info): allzp_info=re.findall('class="f-all-news"(.*?)</p>',cdzp_info,re.S) a_dict={} class_info=re.findall('<dd>(.*?)</dd>',allzp_info[0],re.S) for each in class_info: a_info=re.findall(r'(<a.*?</a>)',each,re.S) for each1 in a_info: key=re.findall('>(.*?)</',each1,re.S) a_url=re.findall('href="/(.*?)"',each1,re.S) a_dict[key[0].strip()]=city_url+a_url[0] return a_dict #获取招聘信息的具体内容 def get_city_zpinfo_detail(url): #先获取软件工程师 sorft_engineer=(zp_class_info['软件工程师']) job_url_info=begin(sorft_engineer) get_detail_info(job_url_info) #处理详情页的信息 def get_detail_info(list_info): job_info=re.findall('<dl class="list-noimg job-list clearfix"(.*?)</dl',list_info,re.S) print(job_info[0]) if __name__=='__main__': url='http://www.ganji.com/index.htm'; data=begin(url); #所有城市信息 city_info=get_cityinfo(data) #对应的分类 infoclass=get_cityinfoclass() cdzp_url,xiaoshou=getzhaopin(city_info,infoclass) #获取招聘的分类信息 zp_class_info=get_zhaopin_info(cdzp_url,xiaoshou) get_city_zpinfo_detail(zp_class_info)
위 내용은 이 글의 요약 모든 내용, 모든 분들의 공부에 도움이 되었으면 좋겠습니다.
Ganji.com에서 채용 정보를 얻는 더 많은 Python 방법을 보려면 PHP 중국어 웹사이트를 주목하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Linux 터미널에서 Python 버전을 보려고 할 때 Linux 터미널에서 Python 버전을 볼 때 권한 문제에 대한 솔루션 ... Python을 입력하십시오 ...

10 시간 이내에 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법은 무엇입니까? 컴퓨터 초보자에게 프로그래밍 지식을 가르치는 데 10 시간 밖에 걸리지 않는다면 무엇을 가르치기로 선택 하시겠습니까?

Python의 Pandas 라이브러리를 사용할 때는 구조가 다른 두 데이터 프레임 사이에서 전체 열을 복사하는 방법이 일반적인 문제입니다. 두 개의 dats가 있다고 가정 해

Fiddlerevery Where를 사용할 때 Man-in-the-Middle Reading에 Fiddlereverywhere를 사용할 때 감지되는 방법 ...

Uvicorn은 HTTP 요청을 어떻게 지속적으로 듣습니까? Uvicorn은 ASGI를 기반으로 한 가벼운 웹 서버입니다. 핵심 기능 중 하나는 HTTP 요청을 듣고 진행하는 것입니다 ...

파이썬에서 문자열을 통해 객체를 동적으로 생성하고 메소드를 호출하는 방법은 무엇입니까? 특히 구성 또는 실행 해야하는 경우 일반적인 프로그래밍 요구 사항입니다.

Linux 터미널에서 Python 사용 ...
