Scrapestack : 스크래핑 사이트를위한 API
모든 사이트에 데이터에 액세스 할 수있는 API가있는 것은 아닙니다. 실제로 대부분은 그렇지 않습니다. 해당 데이터를 가져와야하는 경우 한 가지 방법은 "스크랩"하는 것입니다. 즉, 웹 브라우저 (자동화)에 페이지를로드하고 DOM에서 찾고있는 것을 찾아서 가져갑니다.
비용, 유지 보수 및 기술 부채를 처리하려면 직접 할 수 있습니다. 예를 들어, 이것은 Puppeteer가 헤드리스 크롬을 회전시키고 제어하는 방법과 같은 "헤드리스"브라우저의 큰 사용 사례 중 하나입니다.
또는 스크래핑을 수행 할뿐만 아니라 직접 수행하는 것보다 더 빠르고 더 많은 옵션을 사용하는 스크랩 스타크와 같은 도구를 사용할 수 있습니다.
내 목표는 Meetup.com 페이지에서 최신 Meetup을 가져 오는 것입니다. Meetup.com에는 API가 있지만 비싸고 Oauth와 물건이 필요합니다. 우리에게 필요한 것은 여기에서 과거 모임의 이름과 링크입니다. 따라서 페이지에서 짜서 봅시다.
우리는 DOM에서 필요한 것을 볼 수 있습니다.
플레이를하려면 jQuery와 함께 Scrapestack API 클라이언트 측면으로 긁어 봅시다.
$ .get ( 'https://api.scrapestack.com/scrape', { access_key : 'my_api_key', URL : 'https://www.meetup.com/bendjs/' }, 함수 (WebSiteContent) { // 전체 사이트 HTML이 있습니다! } );
그 콜백 내에서, 나는 이제 jQuery를 사용하여 DOM을 가로 지르고, 내가 원하는 조각을 잡아 당기고, 사이트에서 필요한 것을 구성 할 수 있습니다.
// 우리가 원하는 것을 얻습니다 이벤트 = $ (웹 사이트 컨텐츠) .find ( ". Grouphome-EventsList-pastevents .eventCard") .첫 번째(); EventTitle = 이벤트를하자 .find ( ". eventCard-link") [0] .innerText; EventLink =를하자 `https : // www.meetup.com/` event.find ( ". eventCard-link"). attr ( "href"); // 페이지에서 사용합니다 $ ( "#event"). Append (` $ {EventTitle} `);
실제 사용으로, 우리가 이와 같이 클라이언트면을 수행하고 있다면, 우리는 일부 초보적인 스토리지를 사용하여 모든 페이지로드에서 API를 누르지 않아도됩니다.
작동합니다!
실제로 우리는 스크래핑 서버 측을 할 가능성이 훨씬 높습니다. 우선 API를 직접 클라이언트면에서 사용하는 경우 공개 사이트에서는 실제로는 불가능한 API 키를 보호하는 방법입니다.
나 자신은 아마도 클라우드 기능을 만들었 기 때문에 JavaScript (node.js)에 머물 수 있으며 어딘가에 스토리지에 데이터를 집어 넣을 수있는 기회가 있습니다.
나는 문서를 확인하고 다음에 긁는 일을해야 할 때 이것이 올바른 답이 아닌지 확인하고 싶다. 어쨌든 무료 계획에 10,000 개의 요청을 받고 더 많은 기능을 갖춘 유료 계획에 대해 톤을 올릴 수 있습니다.
직접 링크 →
위 내용은 Scrapestack : 스크래핑 사이트를위한 API의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

이번 주에 플랫폼 뉴스 라운드 업 RONDUP, Chrome은로드에 대한 새로운 속성, 웹 개발자를위한 접근성 사양 및 BBC Move를 소개합니다.

새로운 프로젝트가 시작될 때, Sass 컴파일은 눈을 깜박이게합니다. 특히 BrowserSync와 짝을 이루는 경우 기분이 좋습니다.

이것은 처음으로 HTML 요소를보고 있습니다. 나는 그것을 잠시 동안 알고 있었지만 아직 스핀을 위해 그것을 가져 갔다. 그것은 꽤 시원하고 있습니다

구매 또는 빌드는 기술 분야의 고전적인 논쟁입니다. 신용 카드 청구서에 라인 항목이 없기 때문에 물건을 구축하는 것이 저렴할 수 있지만

한동안 iTunes는 팟 캐스팅에서 큰 개 였으므로 "Podcast 구독"을 링크 한 경우 다음과 같습니다.

CSS 및 JavaScript (및 이미지 및 글꼴 등)와 같은 자산에 멀리 떨어진 캐시 헤더를 설정해야합니다. 브라우저를 알려줍니다

이번 주에 타이포그래피를 검사하기위한 편리한 북마크 인 Roundup, JavaScript 모듈과 Facebook의 Facebook 등을 어떻게 가져 오는지 땜질하기 위해 대기하는 편리한 북마크 인 Roundup과 Facebook의
