超簡單的Python爬蟲之網易雲音樂的下載-Python教學-PHP中文網

目標

設定基礎

#分析

首頁

後端開發

Python教學

超簡單的Python爬蟲之網易雲音樂的下載

不言

Aug 29, 2018 am 11:57 AM

python selenium 網路易雲音樂

這篇文章帶給大家的內容是關於超簡單的Python爬蟲之網易雲音樂的下載，有一定的參考價值，有需要的朋友可以參考一下，希望對你有所幫助。

目標

偶然的一次機會聽到了房東的貓的《雲煙成雨》，瞬間迷上了這慵懶的嗓音和學生氣的歌詞，然後一直去循環聽她們的歌。然後還特意去刷了動漫《我是江小白》，好期待第二季...

我多想在見你，哪怕匆匆一眼就別離...

好了，不說廢話了。這次的目標主要是根據網易雲中歌手的ID，下載該歌手的熱門音樂的歌詞和音頻，並保存到本地的資料夾中。

設定基礎

Python
#Selenium(設定方法參考：Selenium設定)
#Chrome瀏覽器(其它的也可以，需要進行相應的修改)

#分析

如果爬取過網易雲的網站的小伙伴都應該知道網易雲是有反爬取機制的，POST時需要對一些資訊的參數進行加密函數的模擬。但這裡為了簡便，小白也能理解。直接使用了Selenium來模擬登錄，然後使用介面來直接下載音樂和歌詞。

實驗步驟：

根據歌手ID取得該歌手的熱門歌曲列表，歌曲名稱和鏈接，並保存到csv檔案中；
讀取csv文件，根據歌曲鏈接，提取歌曲ID，然後利用相應的接口，下載音樂和歌詞；
##將音樂和歌詞保存到本地。

超簡單的Python爬蟲之網易雲音樂的下載

Python實作

該部分將對幾個關鍵的函數進行介紹...

取得歌手資訊

利用Selenium我們就不需要看對網頁的請求了，直接可以從網頁原始碼中提取對應的資訊。查看歌手頁面原始碼可以發現，我們需要的資訊在iframe框架內，所以我們先需要切換到iframe：

browser.switch_to.frame('contentFrame')

登入後複製

繼續往下看，發現我們需要的歌曲名字和連結是在

id ="hotsong-list"的標籤中，然後每一行對應的是一個tr標籤。所以先取得所有的tr內容，然後遍歷單一tr。

data = browser.find_element_by_id("hotsong-list").find_elements_by_tag_name("tr")

登入後複製

注意：前一個是

find_element，後一個是find_elements，後者回傳一個清單。

接下來就是解析單一

tr標籤的內容，取得歌曲名字和鏈接，可以發現兩者在class="txt"標籤中，而且連結是href屬性，名字是title屬性，可以直接透過get_attribute()函數取得。

超簡單的Python爬蟲之網易雲音樂的下載

for i in range(len(data)):
    content = data[i].find_element_by_class_name("txt")
    href = content.find_element_by_tag_name("a").get_attribute("href")
    title = content.find_element_by_tag_name("b").get_attribute("title")
    song_info.append((title, href))

登入後複製

下載歌詞

#網易云有個獲取歌詞的接口，連結為：http://music.163. com/api/song...

連結中的數字就是歌曲的id，所以我們擁有歌曲id後，可以直接從該連結下載歌詞，歌詞檔案是

json格式，所以我們需要用到json套件。

超簡單的Python爬蟲之網易雲音樂的下載

而且直接取得的歌詞中，每行都有時間軸，需要用正規表示式來剔除，完整程式碼如下：

def get_lyric(self):
    url = 'http://music.163.com/api/song/lyric?' + 'id=' + str(self.song_id) + '&lv=1&kv=1&tv=-1'
    r = requests.get(url)
    json_obj = r.text
    j = json.loads(json_obj)
    lyric = j['lrc']['lyric']
    # 利用正则表达式去除时间轴
    regex = re.compile(r'\[.*\]')
    final_lyric = re.sub(regex, '', lyric)
    return final_lyric

登入後複製

下載音訊

網易雲也提供了音訊檔案的接口，連結為：http://music.163.com/song/med...

連結中的數字為歌曲的id，可以直接根據歌曲的id來下載音檔。完整程式碼如下：

def get_mp3(self):
    url = 'http://music.163.com/song/media/outer/url?id=' + str(self.song_id)+'.mp3'
    try:
        print("正在下载：{0}".format(self.song_name))
        urllib.request.urlretrieve(url, '{0}/{1}.mp3'.format(self.path, self.song_name))
        print("Finish...")
    except:
        print("Fail...")

登入後複製

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7548

CakePHP 教程

1382

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

PHP和Python：代碼示例和比較 Apr 15, 2025 am 12:07 AM

PHP和Python各有優劣，選擇取決於項目需求和個人偏好。 1.PHP適合快速開發和維護大型Web應用。 2.Python在數據科學和機器學習領域佔據主導地位。

CentOS上PyTorch的GPU支持情況如何 Apr 14, 2025 pm 06:48 PM

在CentOS系統上啟用PyTorchGPU加速，需要安裝CUDA、cuDNN以及PyTorch的GPU版本。以下步驟將引導您完成這一過程：CUDA和cuDNN安裝確定CUDA版本兼容性:使用nvidia-smi命令查看您的NVIDIA顯卡支持的CUDA版本。例如，您的MX450顯卡可能支持CUDA11.1或更高版本。下載並安裝CUDAToolkit:訪問NVIDIACUDAToolkit官網，根據您顯卡支持的最高CUDA版本下載並安裝相應的版本。安裝cuDNN庫:前

docker原理詳解 Apr 14, 2025 pm 11:57 PM

Docker利用Linux內核特性，提供高效、隔離的應用運行環境。其工作原理如下：1. 鏡像作為只讀模板，包含運行應用所需的一切；2. 聯合文件系統（UnionFS）層疊多個文件系統，只存儲差異部分，節省空間並加快速度；3. 守護進程管理鏡像和容器，客戶端用於交互；4. Namespaces和cgroups實現容器隔離和資源限制；5. 多種網絡模式支持容器互聯。理解這些核心概念，才能更好地利用Docker。

Python vs. JavaScript：社區，圖書館和資源 Apr 15, 2025 am 12:16 AM

Python和JavaScript在社區、庫和資源方面的對比各有優劣。 1)Python社區友好，適合初學者，但前端開發資源不如JavaScript豐富。 2)Python在數據科學和機器學習庫方面強大，JavaScript則在前端開發庫和框架上更勝一籌。 3)兩者的學習資源都豐富，但Python適合從官方文檔開始，JavaScript則以MDNWebDocs為佳。選擇應基於項目需求和個人興趣。

minio安裝centos兼容性 Apr 14, 2025 pm 05:45 PM

MinIO對象存儲：CentOS系統下的高性能部署MinIO是一款基於Go語言開發的高性能、分佈式對象存儲系統，與AmazonS3兼容。它支持多種客戶端語言，包括Java、Python、JavaScript和Go。本文將簡要介紹MinIO在CentOS系統上的安裝和兼容性。 CentOS版本兼容性MinIO已在多個CentOS版本上得到驗證，包括但不限於：CentOS7.9:提供完整的安裝指南，涵蓋集群配置、環境準備、配置文件設置、磁盤分區以及MinI

CentOS上PyTorch的分佈式訓練如何操作 Apr 14, 2025 pm 06:36 PM

在CentOS系統上進行PyTorch分佈式訓練，需要按照以下步驟操作：PyTorch安裝:前提是CentOS系統已安裝Python和pip。根據您的CUDA版本，從PyTorch官網獲取合適的安裝命令。對於僅需CPU的訓練，可以使用以下命令：pipinstalltorchtorchvisiontorchaudio如需GPU支持，請確保已安裝對應版本的CUDA和cuDNN，並使用相應的PyTorch版本進行安裝。分佈式環境配置:分佈式訓練通常需要多台機器或單機多GPU。所

CentOS上PyTorch版本怎麼選 Apr 14, 2025 pm 06:51 PM

在CentOS系統上安裝PyTorch，需要仔細選擇合適的版本，並考慮以下幾個關鍵因素：一、系統環境兼容性:操作系統:建議使用CentOS7或更高版本。 CUDA與cuDNN:PyTorch版本與CUDA版本密切相關。例如，PyTorch1.9.0需要CUDA11.1，而PyTorch2.0.1則需要CUDA11.3。 cuDNN版本也必須與CUDA版本匹配。選擇PyTorch版本前，務必確認已安裝兼容的CUDA和cuDNN版本。 Python版本:PyTorch官方支

centos如何安裝nginx Apr 14, 2025 pm 08:06 PM

CentOS 安裝 Nginx 需要遵循以下步驟：安裝依賴包，如開發工具、pcre-devel 和 openssl-devel。下載 Nginx 源碼包，解壓後編譯安裝，並指定安裝路徑為 /usr/local/nginx。創建 Nginx 用戶和用戶組，並設置權限。修改配置文件 nginx.conf，配置監聽端口和域名/IP 地址。啟動 Nginx 服務。需要注意常見的錯誤，如依賴問題、端口衝突和配置文件錯誤。性能優化需要根據具體情況調整，如開啟緩存和調整 worker 進程數量。

See all articles

超簡單的Python爬蟲之網易雲音樂的下載

目標

設定基礎

#分析

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題