Python 크롤링 중 배가 고프신가요?-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

Python 크롤링 중 배가 고프신가요?

步履不停

Jul 01, 2019 pm 01:31 PM

python 배고프나요?

Python 크롤링 중 배가 고프신가요?

데이터 시각화를 배우고 있는데 실제 운영에 필요한 데이터가 부족하여 Ele.me에서 테이크아웃 매장 정보를 크롤링하고 싶습니다.

주요 목적은 데이터를 얻는 것이므로 코드는 비교적 간단합니다. 다음 코드로 이동하세요.

import requests
import json
import csv
def crawler_ele(page=0):
def get_page(page):
url = &#39;https://h5.ele.me/restapi/shopping/v3/restaurants?latitude=xxxx&longitude=xxxx&offset={page}&limit=8&terminal=h5&#39;.format(page=page*8)
headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.80 Safari/537.36",
    &#39;cookie&#39;: r&#39;xxxx&#39;
}
re = json.loads(requests.get(url,headers=headers).text)
return re
re = get_page(page)
if re.get(&#39;items&#39;):
with open(&#39;data.csv&#39;,&#39;a&#39;,newline=&#39;&#39;) as f:
writer = csv.DictWriter(f,fieldnames=[&#39;名称&#39;, &#39;月销售量&#39;,&#39;配送费&#39;, &#39;起送价&#39;, &#39;风味&#39;,&#39;评分&#39;, &#39;配送时长&#39;, &#39;评分统计&#39;, &#39;距离&#39;, &#39;地址&#39;])
writer.writeheader()
for item in re.get(&#39;items&#39;):
info = dict()
restaurant = item.get(&#39;restaurant&#39;)
info[&#39;地址&#39;] = restaurant.get(&#39;address&#39;)
info[&#39;配送费&#39;] = restaurant.get(&#39;float_delivery_fee&#39;)
info[&#39;名称&#39;] = restaurant.get(&#39;name&#39;)
info[&#39;配送时长&#39;] = restaurant.get(&#39;order_lead_time&#39;)
info[&#39;距离&#39;] = restaurant.get(&#39;distance&#39;)
info[&#39;起送价&#39;] = restaurant.get(&#39;float_minimum_order_amount&#39;)
info[&#39;评分&#39;] = restaurant.get(&#39;rating&#39;)
info[&#39;月销售量&#39;] = restaurant.get(&#39;recent_order_num&#39;)
info[&#39;评分统计&#39;] = restaurant.get(&#39;rating_count&#39;)
info[&#39;风味&#39;] = restaurant.get(&#39;flavors&#39;)[0].get(&#39;name&#39;)
writer.writerow(info) 
# print(info)
if re.get(&#39;has_next&#39;) == True:
crawler_page(page+1)
crawler_ele(0)

로그인 후 복사

여기에 몇 가지 간단한 설명이 있습니다.

URL의 경도와 위도가 제거됩니다. 직접 크롤링해야 하는 위치의 경도와 위도 또는 호출할 수 있습니다. 지도 API는 위도와 경도를 가져옵니다.

헤더에 쿠키를 추가해야 합니다. 그렇지 않으면 로그인 권한으로 인해 크롤링되는 페이지 수가 제한됩니다. 호출은 루프가 아닌 반복적이므로 결과를 저장하는 CSV 파일에 여러 개의 반복 헤더가 있으므로 Excel을 열고 중복 값을 삭제할 수 있습니다.

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7528

Cakephp 튜토리얼

1378

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

PHP 및 Python : 두 가지 인기있는 프로그래밍 언어를 비교합니다 Apr 14, 2025 am 12:13 AM

PHP와 Python은 각각 고유 한 장점이 있으며 프로젝트 요구 사항에 따라 선택합니다. 1.PHP는 웹 개발, 특히 웹 사이트의 빠른 개발 및 유지 보수에 적합합니다. 2. Python은 간결한 구문을 가진 데이터 과학, 기계 학습 및 인공 지능에 적합하며 초보자에게 적합합니다.

파이썬 : 게임, Guis 등 Apr 13, 2025 am 12:14 AM

Python은 게임 및 GUI 개발에서 탁월합니다. 1) 게임 개발은 Pygame을 사용하여 드로잉, 오디오 및 기타 기능을 제공하며 2D 게임을 만드는 데 적합합니다. 2) GUI 개발은 Tkinter 또는 PYQT를 선택할 수 있습니다. Tkinter는 간단하고 사용하기 쉽고 PYQT는 풍부한 기능을 가지고 있으며 전문 개발에 적합합니다.

Debian Readdir가 다른 도구와 통합하는 방법 Apr 13, 2025 am 09:42 AM

데비안 시스템의 readdir 함수는 디렉토리 컨텐츠를 읽는 데 사용되는 시스템 호출이며 종종 C 프로그래밍에 사용됩니다. 이 기사에서는 ReadDir를 다른 도구와 통합하여 기능을 향상시키는 방법을 설명합니다. 방법 1 : C 언어 프로그램을 파이프 라인과 결합하고 먼저 C 프로그램을 작성하여 readDir 함수를 호출하고 결과를 출력하십시오.#포함#포함#포함#포함#includinTmain (intargc, char*argv []) {dir*dir; structdirent*entry; if (argc! = 2) {

파이썬과 시간 : 공부 시간을 최대한 활용 Apr 14, 2025 am 12:02 AM

제한된 시간에 Python 학습 효율을 극대화하려면 Python의 DateTime, Time 및 Schedule 모듈을 사용할 수 있습니다. 1. DateTime 모듈은 학습 시간을 기록하고 계획하는 데 사용됩니다. 2. 시간 모듈은 학습과 휴식 시간을 설정하는 데 도움이됩니다. 3. 일정 모듈은 주간 학습 작업을 자동으로 배열합니다.

NGINX SSL 인증서 업데이트 Debian Tutorial Apr 13, 2025 am 07:21 AM

이 기사에서는 Debian 시스템에서 NginxSSL 인증서를 업데이트하는 방법에 대해 안내합니다. 1 단계 : CertBot을 먼저 설치하십시오. 시스템에 CERTBOT 및 PYTHON3-CERTBOT-NGINX 패키지가 설치되어 있는지 확인하십시오. 설치되지 않은 경우 다음 명령을 실행하십시오. sudoapt-getupdatesudoapt-getinstallcertbotpython3-certbot-nginx 2 단계 : 인증서 획득 및 구성 rectbot 명령을 사용하여 nginx를 획득하고 nginx를 구성하십시오.

데비안에 대한 Gitlab의 플러그인 개발 안내서 Apr 13, 2025 am 08:24 AM

데비안에서 gitlab 플러그인을 개발하려면 몇 가지 특정 단계와 지식이 필요합니다. 다음은이 과정을 시작하는 데 도움이되는 기본 안내서입니다. Gitlab을 먼저 설치하려면 Debian 시스템에 Gitlab을 설치해야합니다. Gitlab의 공식 설치 매뉴얼을 참조 할 수 있습니다. API 액세스 토큰을 얻으십시오 API 통합을 수행하기 전에 Gitlab의 API 액세스 토큰을 먼저 가져와야합니다. Gitlab 대시 보드를 열고 사용자 설정에서 "AccessTokens"옵션을 찾은 다음 새 액세스 토큰을 생성하십시오. 생성됩니다

Debian OpenSSL에서 HTTPS 서버를 구성하는 방법 Apr 13, 2025 am 11:03 AM

데비안 시스템에서 HTTPS 서버를 구성하려면 필요한 소프트웨어 설치, SSL 인증서 생성 및 SSL 인증서를 사용하기 위해 웹 서버 (예 : Apache 또는 Nginx)를 구성하는 등 여러 단계가 포함됩니다. 다음은 Apacheweb 서버를 사용하고 있다고 가정하는 기본 안내서입니다. 1. 필요한 소프트웨어를 먼저 설치하고 시스템이 최신 상태인지 확인하고 Apache 및 OpenSSL을 설치하십시오 : Sudoaptupdatesudoaptupgradesudoaptinsta

Apache는 어떤 서비스입니까? Apr 13, 2025 pm 12:06 PM

아파치는 인터넷 뒤의 영웅입니다. 웹 서버 일뿐 만 아니라 큰 트래픽을 지원하고 동적 콘텐츠를 제공하는 강력한 플랫폼이기도합니다. 모듈 식 설계를 통해 매우 높은 유연성을 제공하여 필요에 따라 다양한 기능을 확장 할 수 있습니다. 그러나 Modularity는 또한 신중한 관리가 필요한 구성 및 성능 문제를 제시합니다. Apache는 사용자 정의가 필요한 서버 시나리오에 적합하고 복잡한 요구를 충족시킵니다.

See all articles

Python 크롤링 중 배가 고프신가요?

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제