首頁 > 後端開發 > Python教學 > 爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)

爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)

發布: 2023-08-10 15:51:29
轉載
1653 人瀏覽過


###

本期为<知乎热榜/微博热搜时序图>系列文章下篇內容,【上篇】為大家介紹如何使用Python定時爬取知乎熱榜/微博熱搜數據,今天給大家介紹如何使用pyecharts製作熱榜數據時間序列圖(動態輪播圖)希望對你有幫助。

先看看效果(不同播放速度):

#
爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)

爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)


###
1. 基礎時序圖

##### ##
names = [&#39;詹姆斯&#39;, &#39;杜兰特&#39;, &#39;库里&#39;, &#39;欧文&#39;, &#39;哈登&#39;]
allinfo = [[[492, 610, 533, 416, 565, 639, 709, 465, 472], [387, 551, 488, 511, 514, 646, 747, 454, 636], [1683, 2036, 2089, 1743, 1920, 1954, 2251, 1505, 1544]], [[533, 527, 640, 598, 178, 589, 513, 464, 497], [214, 231, 374, 445, 110, 361, 300, 366, 457], [2161, 1850, 2280, 2593, 686, 2029, 1555, 1792, 2027]], [[88, 314, 334, 341, 430, 353, 261, 369, 26], [138, 539, 666, 619, 527, 524, 310, 361, 33], [383, 1786, 1873, 1900, 2375, 1999, 1346, 1881, 104]], [[191, 216, 259, 237, 157, 230, 227, 335, 103], [275, 350, 433, 389, 250, 418, 306, 464, 128], [944, 1325, 1478, 1628, 1041, 1816, 1466, 1596, 548]], [[252, 379, 344, 459, 501, 659, 389, 518, 387], [229, 455, 446, 565, 612, 907, 630, 586, 450], [1044, 2023, 1851, 2217, 2376, 2356, 2191, 2818, 2096]]]
登入後複製
#########數據來自之前的一篇文章:#############【######NBA官方球衣銷售排行榜「詹姆士」居首,快看看你的偶像排第幾######】#######

时序图代码:

y1 = []
y2 = []
y3 = []
for i in range(9):
    y_trb_sorce = []
    y_ast_sorce = []
    y_pts_sorce = []
    for j in range(5):
        y_trb_sorce.append(allinfo[j][0][i])
        y_ast_sorce.append(allinfo[j][1][i])
        y_pts_sorce.append(allinfo[j][2][i])
    y1.append(y_pts_sorce)
    y2.append(y_ast_sorce)
    y3.append(y_trb_sorce)

years = [&#39;11-12赛季&#39;, &#39;12-13赛季&#39;, &#39;13-14赛季&#39;, &#39;14-15赛季&#39;, &#39;15-16赛季&#39;, &#39;16-17赛季&#39;, &#39;17-18赛季&#39;, &#39;18-19赛季&#39;, &#39;19-20赛季&#39;]
tl = Timeline()
for i in range(9):
    bar = (
        Bar()
            .add_xaxis(names)
            .add_yaxis(&#39;得分&#39;, y1[i])
            .add_yaxis(&#39;助攻&#39;, y2[i])
            .add_yaxis(&#39;篮板&#39;, y3[i])
            .set_global_opts(title_opts=opts.TitleOpts("{}三项数据".format(years[i])))
    )
    tl.add(bar, "{}".format(years[i]))
tl.render_notebook()
登入後複製
效果:
爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)


2. 微博熱搜時序圖

##2.1 讀取資料 #

weibo_data = pd.read_csv(&#39;weibo_hot_datas.csv&#39;)
weibo_data.head()
登入後複製
结果:
爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)

2.2 排名前15的热点

代码:

tl = Timeline()
count = 50
time_data_counts = int(weibo_data.shape[0]/count)
times = weibo_data[&#39;时间&#39;].values.tolist()
for i in range(time_data_counts):
    bar = (
        Bar()
            .add_xaxis(list(weibo_data[&#39;标题&#39;])[i*count:i*count+15][::-1])
            .add_yaxis(&#39;微博热搜&#39;, list(weibo_data[&#39;热度&#39;])[i*count:i*count+15][::-1])
            .reversal_axis()
            .set_global_opts(title_opts=opts.TitleOpts(&#39;{}&#39;.format(times[i*count])))
    )
    tl.add(bar, "{}".format(times[i*count]))
tl.render_notebook()
登入後複製
效果:

爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)

2.3 调整边距

代码:

# 将图形整体右移
grid = (
    Grid()
    .add(bar, grid_opts=opts.GridOpts(pos_left=&#39;30%&#39;, pos_right=&#39;10%&#39;)) 
)
tl.add(bar, "{}".format(times[i*count]))
tl.add(grid, &#39;&#39;)
登入後複製
效果:

爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)

2.4 定制主题,增加图标,设置播放速度

效果:

爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)

##########
3. 知乎热榜时序图

3.1 读取数据
zhihu_data = pd.read_csv(&#39;zhuhu_hot_datas.csv&#39;)
zhihu_data.head()
登入後複製
结果:

爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)

3.2 #前15的熱點 

爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)

效果:############################3.3 ###########排名後15的熱點############ #############################
爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)

本期主要是給小夥伴們提供一個製作時序圖的思路,程式碼重複比較多,知乎熱榜程式碼就沒貼出來了,如果需要可以在下面連結檢視程式碼(上篇下篇),也可以線上運行:

https://www.heywhale.com/mw/project/60dd1932ee16460017a49d57

##################################################################### ###################

以上是爬蟲+視覺化 | Python知乎熱榜/微博熱搜時序圖(下篇)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:Python当打之年
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板