目录
方法一:美汤
方法2:selenium + beautifulsoup
正确答案
首页 后端开发 Python教程 如何用 Python 抓取 javascript 网站?

如何用 Python 抓取 javascript 网站?

Feb 10, 2024 pm 03:40 PM
webdriver

如何用 Python 抓取 javascript 网站?

问题内容

我正在尝试抓取一个网站。我尝试过使用两种方法,但两种方法都没有为我提供我正在寻找的完整网站源代码。我正在尝试从下面提供的网站 url 中抓取新闻标题。

网址:“https://www.todayonline.com/”

这是我尝试过但失败的两种方法。

方法一:美汤

tdy_url = "https://www.todayonline.com/"
page = requests.get(tdy_url).text
soup = beautifulsoup(page)
soup  # returns me a html with javascript text
soup.find_all('h3')

### returns me empty list []
登录后复制

方法2:selenium + beautifulsoup

tdy_url = "https://www.todayonline.com/"

options = Options()
options.headless = True

driver = webdriver.Chrome("chromedriver",options=options)

driver.get(tdy_url)
time.sleep(10)
html = driver.page_source

soup = BeautifulSoup(html)
soup.find_all('h3')

### Returns me only less than 1/4 of the 'h3' tags found in the original page source
登录后复制

请帮忙。我尝试过抓取其他新闻网站,这要容易得多。谢谢。


正确答案


您可以通过 api 访问数据(查看“网络”选项卡):

例如,

import requests
url = "https://www.todayonline.com/api/v3/news_feed/7"
data = requests.get(url).json()
登录后复制

以上是如何用 Python 抓取 javascript 网站?的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌
威尔R.E.P.O.有交叉游戏吗?
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

使用Python和WebDriver实现网页截图并保存为PDF文件 使用Python和WebDriver实现网页截图并保存为PDF文件 Jul 08, 2023 pm 10:55 PM

使用Python和WebDriver实现网页截图并保存为PDF文件摘要:在Web开发和测试过程中,经常需要对网页进行截图以便进行分析、记录和报告。本文将介绍如何使用Python和WebDriver来实现网页截图,并将截图保存为PDF文件,以方便分享和存档。一、安装与配置SeleniumWebDriver:安装Python:访问Python官网(https:

Python和WebDriver扩展:在网页中模拟鼠标滚轮操作 Python和WebDriver扩展:在网页中模拟鼠标滚轮操作 Jul 09, 2023 pm 11:55 PM

Python和WebDriver扩展:在网页中模拟鼠标滚轮操作引言:随着网页交互设计的不断发展,模拟用户操作在自动化测试中变得越来越重要。在一些网页上,鼠标滚轮的使用已经成为了常见的操作之一。然而,对于使用Python编写自动化测试脚本的开发人员来说,如何在WebDriver中模拟鼠标滚轮操作可能会成为一个挑战。本文将介绍一种使用Python和WebDriv

使用Python和WebDriver实现网页自动填写验证码 使用Python和WebDriver实现网页自动填写验证码 Jul 07, 2023 am 10:19 AM

使用Python和WebDriver实现网页自动填写验证码随着网络的发展,越来越多的网站在用户注册、登录等操作中引入了验证码机制,以提高安全性和防止自动化攻击。然而,手动输入验证码不仅麻烦,还增加了用户体验的复杂度。那么,有没有一种方法能够自动填写验证码呢?答案是肯定的。本文将介绍如何使用Python和WebDriver实现网页自动填写验证码的方法。首先,我

使用Python和WebDriver实现网页自动刷新 使用Python和WebDriver实现网页自动刷新 Jul 08, 2023 pm 01:46 PM

使用Python和WebDriver实现网页自动刷新引言:在日常的网页浏览中,我们常常会遇到需要频繁刷新网页的场景,比如监控实时数据、自动刷新动态页面等。手动刷新网页会浪费大量的时间和精力,因此我们可以使用Python和WebDriver来实现自动刷新网页的功能,提高我们的工作效率。一、安装和配置环境在开始之前,我们需要安装和配置相应的环境。安装Python

Python和WebDriver扩展:在网页中模拟鼠标右键点击 Python和WebDriver扩展:在网页中模拟鼠标右键点击 Jul 07, 2023 am 11:22 AM

Python和WebDriver扩展:在网页中模拟鼠标右键点击在使用Python和WebDriver进行网页自动化测试时,我们经常需要模拟用户的鼠标行为,例如点击、拖拽和右键菜单等操作。WebDriver会提供一些基本的鼠标行动函数,如click、drag_and_drop等,但是却没有直接提供模拟鼠标右键点击的函数。本文将介绍如何使用Python和WebD

使用Python和WebDriver实现网页自动填充表格数据 使用Python和WebDriver实现网页自动填充表格数据 Jul 07, 2023 pm 08:37 PM

使用Python和WebDriver实现网页自动填充表格数据自动化测试是软件开发过程中重要的一环,其中之一是网页表单的自动填充。对于开发人员来说,手动填写表单是一个枯燥且容易出错的过程。而使用Python和WebDriver,在自动测试过程中实现自动填充表格数据,能够减少人工重复劳动,提高测试效率。在这篇文章中,我将介绍如何使用Python的Selenium

利用Python和WebDriver扩展自动化处理网页的拖放操作 利用Python和WebDriver扩展自动化处理网页的拖放操作 Jul 10, 2023 pm 07:09 PM

利用Python和WebDriver扩展自动化处理网页的拖放操作在实际的Web应用中,拖放(DragandDrop)是一个常见的交互操作,它可以增强用户的体验和便利性。对于测试人员而言,自动化处理网页的拖放操作是一项重要且常见的任务。本文将介绍如何利用Python和WebDriver扩展自动化处理网页的拖放操作。一、准备工作在开始之前,我们需要安装Pyt

使用Python和WebDriver实现表单自动填写功能 使用Python和WebDriver实现表单自动填写功能 Jul 07, 2023 am 10:25 AM

使用Python和WebDriver实现表单自动填写功能在日常的网站浏览中,我们经常会遇到需要填写表单的情况。当我们需要频繁填写相同或类似的表单时,手动填写显得很繁琐而且耗时。所幸的是,我们可以借助Python和WebDriver来实现自动填写表单的功能,提高我们的工作效率。首先,我们需要安装selenium库。Selenium是一个自动化测试工具,可以模拟

See all articles