社群

學習

工具庫

AI工具

休閒

繁体中文

首頁 > 系統教程 > Linux > 使用Python爬取B站全站視訊訊息

使用Python爬取B站全站視訊訊息

王林

發布： 2024-02-19 23:45:35

轉載

795 人瀏覽過

B站我想大家都熟悉吧，其實 B 站的爬蟲網上一搜一大堆。不過紙上得來終覺淺，絕知此事要躬行，我碼故我在。最終爬取到資料總量為 760萬 條。

準備工作

先打開 B 站，隨便在首頁找一個影片點擊進去。常規操作，開啟開發者工具。這次是目標是透過爬取 B 站提供的 api 來獲取視頻信息，不去解析網頁，解析網頁的速度太慢了而且容易被封 ip。

勾選 JS 選項，F5 刷新

使用Python爬取B站全站視訊訊息

#找到了 api 的位址

使用Python爬取B站全站視訊訊息

#複製下來，去掉沒必要的內容，得到https://api.bilibili.com/x/web-interface/archive/stat?aid=15906633 ，用瀏覽器打開，會得到如下的json 資料

使用Python爬取B站全站視訊訊息

#動手寫碼

#好了，到這裡程式碼就可以碼起來了，透過 request 不斷的迭代獲取數據，為了讓爬蟲更有效率，可以利用多線程。

核心程式碼

使用Python爬取B站全站視訊訊息

#迭代爬取

使用Python爬取B站全站視訊訊息

##整個專案的最主要部分的程式碼也就是 20 行左右，挺簡潔的。

運行的效果大概是這樣的，數字是已經已經爬取了多少條鏈接，其實完全可以在一天或者兩天內就把全站信息爬完的。

使用Python爬取B站全站視訊訊息

#至於爬取後要怎麼處理就看自己愛好了，我是先儲存為 csv 文件，然後再匯總插入到資料庫。

資料庫表格

使用Python爬取B站全站視訊訊息

#由於這些內容是我在幾個月前爬取的，所以數據其實有些落後了。

資料總量

使用Python爬取B站全站視訊訊息

##查詢播放量前十名的影片

使用Python爬取B站全站視訊訊息

#查詢回覆量前十名的影片

使用Python爬取B站全站視訊訊息

#

以上是使用Python爬取B站全站視訊訊息的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

linux linux教程紅帽 linux系統 linux指令 linux認證紅帽linux linux視頻

上一篇：Linux中如何正確使用echo指令下一篇：find指令的用法Linux

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

公眾號網頁更新緩存難題：如何避免版本更新後舊緩存影響用戶體驗？

2025-03-04 13:24:15
叉子

2025-02-28 14:39:11
培訓大語言模型：從TRPO到GRPO

2025-02-26 04:41:08
託管開源LLM的經濟學

2025-02-26 03:15:10
當機器提前思考時：戰略AI的興起

2025-02-26 03:06:12
了解chatgpt的演變：第3部分 - Codex和Consendgpt的見解

2025-02-26 02:58:10
LLM中具有稀疏自動編碼器的特徵電路的配方

2025-02-26 01:46:08
封閉式學習背後的數學

2025-02-26 00:03:10
從簡歷到求職信，使用AI和LLM，帶有Python和簡化

2025-02-25 23:59:12
我們需要的一切嗎？

2025-02-25 19:49:12

最新問題

centos7 - git的linux版本沒有centos的？

來自於 1970-01-01 08:00:00

0

0

0

linux-kernel - Ubuntu 15.04 安裝不了 linux-headers-3.16.0-44-generic

來自於 1970-01-01 08:00:00

0

0

0

學習Linux的先行知識

來自於 1970-01-01 08:00:00

0

0

0

Linux下連接資料庫

來自於 1970-01-01 08:00:00

0

0

0

Linux 批次修改檔名

來自於 1970-01-01 08:00:00

0

0

0

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1437102
php入門教程之一週學會PHP

4296891
JAVA 初級入門影片教學

2664926
小甲魚零基礎入門學習Python影片教學

516526
PHP 零基礎入門教學

877290

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板