Mobike 크롤러 분석 - API 찾기
경고: 이 글은 학습 및 연구 참고용으로만 작성되었으므로 불법적인 목적으로 사용하지 마시기 바랍니다.
이전 기사 "Mobike 비공식 빅데이터 분석"에서 봄 축제 기간 동안 Mobike에 대한 데이터 분석을 언급한 바 있으며, 다음 기사 시리즈에서 이에 대해 자세히 설명하겠습니다. 이 데이터를 효율적으로?
모바이크 데이터를 크롤링하는 이유
모바이크는 청두에 입성한 최초의 공유자전거입니다. 매일 지하철역에서 내리면 수많은 자전거가 APP으로 보이는데, 걸어가다 보면 도착해서 보니 차가 없었습니다. 일부 차량은 어딘가에 숨겨져 있고, 일부 차량은 GPS 오류로 인해 찾을 수 없으며, 일부 차량은 자전거 이용자가 접근할 수 없도록 벽으로 분리된 주거 지역에 배치됩니다.
그렇다면 이 자전거들의 데이터를 얻어서 이 자전거들이 좀비 자전거가 되었는지 분석할 수 있는 방법이 있을까요? 누군가가 고의로 아무도 접근할 수 없도록 커뮤니티에 넣었나요?
이러한 질문을 계기로 저는 이 데이터를 어떻게 얻을 수 있는지 연구하기 시작했습니다.
데이터를 얻을 수 있는 곳
데이터를 볼 수 있다면 항상 자동으로 데이터를 얻을 수 있는 방법이 있습니다. 단지 데이터를 얻는 방법에 따라 데이터 획득의 효율성이 결정될 뿐입니다. Mobike의 데이터 분석 작업에서는 크롤러가 짧은 시간(보통 10분 정도)에 더 많은 데이터를 얻을 수 있어야 합니다. 그렇다면 데이터는 어디서 오는 걸까요?
가장 직접적인 소스는 Mobike APP입니다. 현대 소프트웨어 설계는 프런트엔드와 백엔드 분리에 중점을 두고 있으며 서버는 APP, 웹 페이지 등을 동시에 서비스합니다. 이러한 추세 속에서 우리는 소프트웨어의 HTTP 요청만 파악하면 됩니다. 일반적으로 다음 도구가 도움이 될 수 있습니다.
직접 패킷 캡처:
프록시를 사용하여 HTTP 요청 패킷을 캡처하고 디버그 :
Fiddler 4
Charles
패킷 캡쳐(안드로이드)
내 폰이 루팅이 안되어 있어서 공유기에서 패킷 캡쳐에 간섭이 너무 심하고 https 사용도 쉽지 않네요. 따라서 Fiddler 또는 Charles를 먼저 사용해 볼 수 있습니다. Fiddler의 프록시를 끊은 다음 휴대폰에서 위치를 계속 이동하여 새로운 요청이 있는지 확인합니다. 그런데 아쉽게도 요청은 모두 에이맵 지도를 얻기 위한 것 뿐이고, 모바이크와 관련된 데이터는 없는 것 같습니다.
무슨 일이에요? 모바일 버전을 사용해 보세요. 패킷 캡처로 전환한 후 실제로 트래픽이 발생했으며 요청에서 가장 우려되는 항목을 발견했습니다:
4372317-de272f8395d2106f.png
이 API 요청은 언뜻 보기에 Postman에서 시도한 후에는 정보를 올바르게 반환할 수 있는 것 같습니다.
너무 이르다
며칠 연속으로 데이터를 올라와서 분석해보니 모바이크의 GPS가 계속 뛰는 것 같더라고요. 때때로 구타는 수 킬로미터의 거리를 초과하며 이는 분명히 정상적인 값이 아닙니다.
인터페이스가 조작되어 잘못된 데이터를 반환하는 것은 아닐까? APP에서도 자전거가 반환하는 데이터가 점프하는 것을 관찰했습니다. 어느 이른 아침부터 다음 날 아침까지, 나는 이것이 정말 사실인지 확인하기 위해 집 근처의 차들을 주기적으로 교체했습니다.
사진 찾을 수 없는데 관찰한 결과, APP에서 반환된 위치에 확실히 뭔가 문제가 있다는 결론을 내렸습니다. 아주 먼 곳에 자동차 한 대가 놓여 있었는데, 잠시 사라졌다가 나중에 다시 찾아왔는데, 제가 캡쳐한 데이터와 일치하더군요. 게다가 이 바운스는 휴대폰, 휴대폰 번호, 심지어 이동통신사와도 아무런 관련이 없습니다. 이는 이 바운스가 Mobike의 인터페이스에 문제가 있음을 보여줍니다. 이는 우리가 가끔 자동차를 보지만 실제로는 자동차가 없는 이유를 또 다른 측면에서 설명할 수도 있습니다. 거기 차.
이전 모먼츠에 올렸던 영상의 스크린샷입니다. 캠핑장 입구 근처에 뾰족한 곳이 보이는데 실제로는 거기에 GPS가 멈췄습니다. 트랙은 짧은 시간 동안 내부 신체가 가까이 이동하고 심지어 멀리 이동한 다음 해당 위치로 돌아오는 것을 보여줍니다.
이러한 데이터는 단순히 데이터 분석에 사용할 수 없어 포기할 뻔했습니다.
전환
위챗 미니 프로그램의 인기에 힘입어 모바이크도 곧바로 미니 프로그램을 출시했다. 나는 그것을 보고 웃었습니다. 예, 시도해 볼 만한 또 다른 데이터 소스를 제공했습니다. Packet Capture로 데이터를 한 번 캡처한 후에는 API를 쉽게 결정할 수 있습니다. 여기서는 구체적인 프로세스를 설명하지 않습니다. 크롤링을 한 후 2~3일간의 데이터를 크롤링해 보니 반전이 있었고, 그 데이터는 일반적인 자전거 궤적과 일치했습니다.
크롤러의 효율성을 높이는 일만 남았습니다.
다른 시도
가끔 API 입구를 찾기 위해 앱의 소스코드를 직접 분석하는 것이 매우 편리할 때가 있는데, 모바이크 안드로이드 앱을 디컴파일했는데 일부 리소스 파일을 제외하면, 유용했습니다. 다른 파일은 Qihoo 360의 obfuscator를 사용하여 압축했습니다. 포격 수행 방법을 분석한 기사가 인터넷에 있지만 공부할 시간이 많지 않으므로 잊어 버리십시오.
API 디자인에 대해서도 이야기하세요
Mobike의 API가 크롤링 및 분석하기 쉬운 이유는 주로 API 디자인이 너무 단순하기 때문입니다:
http 요청만 사용하므로 패킷 캡처 분석이 쉽습니다
이러한 API는 요청을 암호화하지 않으므로 서비스 사용이 쉽습니다.
그리고 위챗 미니프로그램도 유출된 API의 중요한 소스이기 때문에 결국 APP에서의 요청은 네이티브 코드를 통해 암호화된 후 전송될 수 있는 것 같습니다. 미니 프로그램에서는 그런 것이 없습니다.
관심이 있으시면 Xiaolan Bicycle APP의 요청을 살펴보세요. 그들은 https 요청을 사용하고 데이터 요청을 암호화하기가 어렵습니다. 많이 늘어날 것입니다.
물론, Mobike 관계자들이 데이터에 관심이 없다면 이런 API 설계도 괜찮을 것입니다.
위 내용은 Mobike 크롤러 분석 - API 찾기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











PHP 및 ManticoreSearch 개발 가이드: 신속하게 검색 API 만들기 검색은 최신 웹 애플리케이션에 없어서는 안 될 기능 중 하나입니다. 전자상거래 웹사이트, 소셜 미디어 플랫폼, 뉴스 포털 등 사용자가 관심 있는 콘텐츠를 찾을 수 있도록 효율적이고 정확한 검색 기능을 제공해야 합니다. 탁월한 성능을 갖춘 전체 텍스트 검색 엔진인 ManticoreSearch는 우수한 검색 API를 생성할 수 있는 강력한 도구를 제공합니다. 이 기사에서는 다음 방법을 보여줍니다.

PHP 프로젝트에서 API 인터페이스를 호출하여 데이터를 크롤링하고 처리하는 방법은 무엇입니까? 1. 소개 PHP 프로젝트에서는 종종 다른 웹사이트에서 데이터를 크롤링하고 이러한 데이터를 처리해야 합니다. 많은 웹사이트에서는 API 인터페이스를 제공하며, 우리는 이러한 인터페이스를 호출하여 데이터를 얻을 수 있습니다. 이 기사에서는 PHP를 사용하여 API 인터페이스를 호출하여 데이터를 크롤링하고 처리하는 방법을 소개합니다. 2. API 인터페이스의 URL과 매개변수를 얻으십시오. 시작하기 전에 대상 API 인터페이스의 URL과 필수 매개변수를 얻어야 합니다.

ReactAPI 호출 가이드: 백엔드 API와 상호 작용하고 데이터를 전송하는 방법 개요: 최신 웹 개발에서는 백엔드 API와 상호 작용하고 데이터를 전송하는 것이 일반적인 요구 사항입니다. 널리 사용되는 프런트엔드 프레임워크인 React는 이 프로세스를 단순화하는 몇 가지 강력한 도구와 기능을 제공합니다. 이 기사에서는 React를 사용하여 기본 GET 및 POST 요청을 포함하여 백엔드 API를 호출하는 방법을 소개하고 구체적인 코드 예제를 제공합니다. 필요한 종속성을 설치하십시오. 먼저 Axi가 프로젝트에 설치되어 있는지 확인하십시오.

데이터 기반 애플리케이션 및 분석 세계에서 API(애플리케이션 프로그래밍 인터페이스)는 다양한 소스에서 데이터를 검색하는 데 중요한 역할을 합니다. API 데이터로 작업할 때 액세스하고 조작하기 쉬운 형식으로 데이터를 저장해야 하는 경우가 많습니다. 그러한 형식 중 하나는 표 형식의 데이터를 효율적으로 구성하고 저장할 수 있는 CSV(쉼표로 구분된 값)입니다. 이 기사에서는 강력한 프로그래밍 언어인 Python을 사용하여 API 데이터를 CSV 형식으로 저장하는 프로세스를 살펴봅니다. 이 가이드에 설명된 단계를 수행하여 API에서 데이터를 검색하고, 관련 정보를 추출하고, 추가 분석 및 처리를 위해 CSV 파일에 저장하는 방법을 알아봅니다. Python을 사용한 API 데이터 처리의 세계에 대해 알아보고 CSV 형식의 잠재력을 활용해 보겠습니다.

제목: Laravel API 오류 보고 처리 방법, 구체적인 코드 예제가 필요합니다. Laravel을 개발하다 보면 API 오류가 자주 발생합니다. 이러한 오류는 프로그램 코드 논리 오류, 데이터베이스 쿼리 문제, 외부 API 요청 실패 등 다양한 이유로 인해 발생할 수 있습니다. 이러한 오류 보고서를 처리하는 방법은 핵심 문제입니다. 이 문서에서는 Laravel API 오류 보고서를 효과적으로 처리하는 방법을 보여주기 위해 특정 코드 예제를 사용합니다. 1. Laravel의 오류 처리

Oracle은 세계적으로 유명한 데이터베이스 관리 시스템 제공업체이며, Oracle의 API(응용 프로그래밍 인터페이스)는 개발자가 Oracle 데이터베이스와 쉽게 상호 작용하고 통합하는 데 도움이 되는 강력한 도구입니다. 이 기사에서는 Oracle API 사용 가이드를 자세히 살펴보고 독자들에게 개발 프로세스 중에 데이터 인터페이스 기술을 활용하는 방법을 보여주고 구체적인 코드 예제를 제공합니다. 1.오라클

MongoDB를 사용하여 간단한 CRUD API를 개발하는 방법 현대 웹 애플리케이션 개발에서 CRUD(생성, 삭제, 수정, 확인) 작업은 가장 일반적이고 중요한 기능 중 하나입니다. 이 기사에서는 MongoDB 데이터베이스를 사용하여 간단한 CRUD API를 개발하는 방법을 소개하고 구체적인 코드 예제를 제공합니다. MongoDB는 데이터를 문서 형식으로 저장하는 오픈 소스 NoSQL 데이터베이스입니다. 기존 관계형 데이터베이스와 달리 MongoDB에는 사전 정의된 스키마가 없습니다.

Oracle API 통합 전략 분석: 시스템 간의 원활한 통신을 위해서는 특정 코드 예제가 필요합니다. 오늘날 디지털 시대에 내부 기업 시스템은 서로 통신하고 데이터를 공유해야 하며 Oracle API는 원활한 통신을 돕는 중요한 도구 중 하나입니다. 시스템 간 통신. 이 기사에서는 OracleAPI의 기본 개념과 원칙부터 시작하여 API 통합 전략을 살펴보고 마지막으로 독자가 OracleAPI를 더 잘 이해하고 적용할 수 있도록 구체적인 코드 예제를 제공합니다. 1. 기본 오라클 API
