首页 web前端 css教程 Scrapestack:用于刮擦网站的API

Scrapestack:用于刮擦网站的API

Apr 14, 2025 am 09:32 AM

Scrapestack:用于刮擦网站的API

并非每个站点都有一个API访问数据。实际上,大多数不是。如果您需要提取这些数据,一种方法是“刮擦”它。也就是说,将页面加载到Web浏览器中(您是自动化的),在DOM中找到您要寻找的内容,然后采用它。

如果您想处理成本,维护和技术债务,则可以自己执行此操作。例如,这是“无头”浏览器的大型用例之一,例如木偶器如何旋转和控制无头铬。

或者,您可以使用诸如Scrapestack之类的工具,该工具不仅可以为您抓取,而且可以做得更好,更快,并且选择更多的选择要比尝试自己做得更好。

假设我的目标是从Meetup.com页面上取出最新的完成聚会。 Metup.com有一个API,但它很昂贵,需要Oauth和其他东西。我们只需要在这里的过去聚会的名称和链接,所以让我们将其从页面上拉开。

我们可以看到我们在DOM中的需求:

要玩游戏,让我们用jquery用scrapestack api客户端来刮擦它:

 $ .get('https://api.scrapestack.com/scrape',
  {
    access_key:'my_api_key',
    URL:'https://www.meetup.com/bendjs/'
  },,
  函数(WebsIteContent){
     //我们在这里有整个网站! 
  }
);
登录后复制

在该回调中,我现在还可以使用jQuery穿越DOM,抓住我想要的部分,并在我们的网站上构造我需要的东西:

 //得到我们想要的
让Event = $(WebsIteContent)
  。
  。第一的();
让EventTitle = event
  .find(“。eventCard-link”)[0] .innertext;
令EventLink = 
  `https:// www.meetup.com/`   
  event.find(“。eventCard-link”)。attr(“ href”);

//在页面上使用它
$(“#event”)。附录(`
  $ {eventTitle}
`);
登录后复制

在实际用法中,如果我们这样做这样的客户端,我们将利用一些基本的存储空间,因此我们不必在每个页面负载上达到API,例如将结果粘贴在LocalStorage中,并在几天之后添加无效。

有用!

实际上,我们更有可能进行刮擦服务器端。一方面,这就是保护您的API键的方法,这是您的责任,如果您直接使用API​​,则在面向公共场所的责任是不可能的。

我自己,我可能会做一个云功能来执行此操作,这样我就可以留在JavaScript(Node.js)中,并有机会将数据塞入存储中。

我会说去查看文档,看看下次您需要进行一些刮擦时,这是否不是正确的答案。无论如何,您都会收到10,000条免费计划的请求,并且可以在任何具有更多功能的付费计划上跳起来。

直接链接→

以上是Scrapestack:用于刮擦网站的API的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1653
14
CakePHP 教程
1413
52
Laravel 教程
1304
25
PHP教程
1251
29
C# 教程
1224
24
带有粘性定位的堆叠卡和一点点的杂物 带有粘性定位的堆叠卡和一点点的杂物 Apr 03, 2025 am 10:30 AM

前几天,我发现了科里·金尼文(Corey Ginnivan)网站上的这一点,当您滚动时,彼此之间的卡片堆放集。

Google字体可变字体 Google字体可变字体 Apr 09, 2025 am 10:42 AM

我看到Google字体推出了新设计(Tweet)。与上一次大型重新设计相比,这感觉更加迭代。我几乎无法分辨出区别

如何使用HTML,CSS和JavaScript创建动画倒计时计时器 如何使用HTML,CSS和JavaScript创建动画倒计时计时器 Apr 11, 2025 am 11:29 AM

您是否曾经在项目上需要一个倒计时计时器?对于这样的东西,可以自然访问插件,但实际上更多

HTML数据属性指南 HTML数据属性指南 Apr 11, 2025 am 11:50 AM

您想了解的有关HTML,CSS和JavaScript中数据属性的所有信息。

为什么Flex布局中的紫色斜线区域会被误认为是'溢出空间”? 为什么Flex布局中的紫色斜线区域会被误认为是'溢出空间”? Apr 05, 2025 pm 05:51 PM

关于Flex布局中紫色斜线区域的疑问在使用Flex布局时,你可能会遇到一些令人困惑的现象,比如在开发者工具(d...

如何通过CSS选择第一个类名为item的子元素? 如何通过CSS选择第一个类名为item的子元素? Apr 05, 2025 pm 11:24 PM

在元素个数不固定的情况下如何通过CSS选择第一个指定类名的子元素在处理HTML结构时,常常会遇到元素个数不�...

使Sass更快的概念证明 使Sass更快的概念证明 Apr 16, 2025 am 10:38 AM

在一个新项目开始时,Sass汇编发生在眼睛的眨眼中。感觉很棒,尤其是当它与browsersync配对时,它重新加载

在前端开发中,如何使用CSS和JavaScript实现类似Windows 10设置界面的探照灯效果? 在前端开发中,如何使用CSS和JavaScript实现类似Windows 10设置界面的探照灯效果? Apr 05, 2025 pm 10:21 PM

在前端开发中如何实现类似Windows...

See all articles