python爬虫 - python爬取豆瓣电影,无法抓取到内容
阿神
阿神 2017-04-17 17:05:11
0
2
1068

代码:

# /usr/bin/python
#coding:utf-8
__author__ = 'eyu Fanne'

import requests,re
from bs4 import BeautifulSoup

move_url = 'https://movie.douban.com/'

def Robot():
    res_url = requests.get(move_url)
    print res_url.status_code
    soup = BeautifulSoup(res_url.text,'lxml')
    print soup.title
    soup_a = soup.find_all("a",class_="item")
    for i in soup_a:
        print i
    print soup_a



if __name__=='__main__':
    Robot()

结果:
200
<title>

    豆瓣电影

</title>
[]

抓取

<a class='item' ....>

这个标签内的值,但获取到的空,这是为何。

阿神
阿神

闭关修行中......

全部回覆(2)
大家讲道理

查看一下頁面原始碼,裡面並沒有電影資訊。其實是JS渲染到頁面上的。
可以看下這個連結 https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start=0

Peter_Zhu

豆瓣電影有​​公開API介面。 。為什麼要去爬頁面。 。
http://developers.douban.com/wiki/?title=movie_v2

熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!