目次
目標
設定の基本
分析
このパートでは、いくつかの重要な関数を紹介します...
Selenium を使用すると、Web ページのリクエストを読み取る必要がなく、Web ページのソース コードから対応する情報を直接抽出できます。歌手ページのソース コードを見ると、必要な情報が iframe 内にあることがわかります。そのため、まず iframe に切り替える必要があります:
ホームページ バックエンド開発 Python チュートリアル NetEase Cloud Music をダウンロードするための非常にシンプルな Python クローラー

NetEase Cloud Music をダウンロードするための非常にシンプルな Python クローラー

Aug 29, 2018 am 11:57 AM
python selenium NetEase クラウド ミュージック

この記事の内容は、非常に簡単な Python クローラーを使用した NetEase Cloud Music のダウンロードに関するものです。一定の参考価値があります。困っている友人は参考にしてください。お役に立てれば幸いです。

目標

偶然、女将さんの猫の「雲と煙が雨に変わる」を聴いて、その気だるい歌声と学生っぽい歌詞に一目惚れし、ずっと聴き続けました。ループの曲です。それからアニメ「私は江小白」を見に行ったのですが、第二期もとても楽しみです…

一目見て帰ってもまた会いたいです…

さて、ナンセンスではありません。今回の目標は、NetEase Cloud 内の歌手の ID に基づいて歌手のポピュラー音楽の歌詞とオーディオをダウンロードし、ローカル フォルダーに保存することです。

設定の基本

  • Python

  • Selenium (設定方法については、「Selenium の設定」を参照してください)

  • Chrome ブラウザ (他のブラウザも利用可能であり、それに応じて変更する必要があります)

分析

NetEase Cloud の Web サイトをクロールした友人の場合NetEase Cloud にはクロール防止メカニズムがあることを知っておく必要があり、POST を実行するときに、いくつかの情報パラメータの暗号化機能をシミュレートする必要があります。しかし、ここでは簡単にするために、初心者でも理解できるようにしています。 Selenium はログインをシミュレートするために直接使用され、インターフェイスは音楽と歌詞を直接ダウンロードするために使用されます。

実験手順:

  1. 歌手 ID に基づいて歌手の人気曲リスト、曲名、リンクを取得し、CSV に保存します。ファイル;

  2. #csv ファイルを読み取り、曲リンクに従って曲 ID を抽出し、対応するインターフェイスを使用して音楽と歌詞をダウンロードします;

  3. 音楽を入れて歌詞をローカルに保存します。

NetEase Cloud Music をダウンロードするための非常にシンプルな Python クローラー#Python の実装

このパートでは、いくつかの重要な関数を紹介します...

歌手情報の取得

Selenium を使用すると、Web ページのリクエストを読み取る必要がなく、Web ページのソース コードから対応する情報を直接抽出できます。歌手ページのソース コードを見ると、必要な情報が iframe 内にあることがわかります。そのため、まず iframe に切り替える必要があります:

browser.switch_to.frame('contentFrame')
ログイン後にコピー

読み続けて、曲名とリンクを見つけます。必要な情報は

id ​​="hotsong-list"

タグ内にあり、各行は tr タグに対応します。したがって、最初にすべての tr コンテンツを取得してから、単一の tr を反復処理します。 <div class="code" style="position:relative; padding:0px; margin:0px;"><pre class="brush:php;toolbar:false">data = browser.find_element_by_id(&quot;hotsong-list&quot;).find_elements_by_tag_name(&quot;tr&quot;)</pre><div class="contentsignin">ログイン後にコピー</div></div>注: 前者は

find_element

、後者は find_elements、後者はリストを返します。 次のステップは、単一の

tr

タグの内容を解析し、曲名とリンクを取得することです。両方とも class="txt"# にあることがわかります。 ## タグ、リンクは href 属性、名前は title 属性で、get_attribute() 関数を通じて直接取得できます。

for i in range(len(data)):
    content = data[i].find_element_by_class_name("txt")
    href = content.find_element_by_tag_name("a").get_attribute("href")
    title = content.find_element_by_tag_name("b").get_attribute("title")
    song_info.append((title, href))
ログイン後にコピー
NetEase Cloud Music をダウンロードするための非常にシンプルな Python クローラー歌詞のダウンロード

NetEase Cloud には歌詞を取得するためのインターフェイスがあります。リンクは http://music.163 です。 .com/api/song...

リンク内の数字は曲 ID なので、曲 ID を取得したら、リンクから歌詞を直接ダウンロードできます。歌詞ファイルは ## にあります。 #json

形式なので、

json

パッケージを使用する必要があります。

そして、直接取得した歌詞のうち、各行にはタイムラインが含まれているため、正規表現を使用して削除する必要があります。完全なコードは次のとおりです。 NetEase Cloud Music をダウンロードするための非常にシンプルな Python クローラー

def get_lyric(self):
    url = 'http://music.163.com/api/song/lyric?' + 'id=' + str(self.song_id) + '&lv=1&kv=1&tv=-1'
    r = requests.get(url)
    json_obj = r.text
    j = json.loads(json_obj)
    lyric = j['lrc']['lyric']
    # 利用正则表达式去除时间轴
    regex = re.compile(r'\[.*\]')
    final_lyric = re.sub(regex, '', lyric)
    return final_lyric
ログイン後にコピー
Download Audio

NetEase Cloud はオーディオ ファイル用のインターフェースも提供します。リンクは http://music.163.com/song/med...

##リンク内の # 数字は曲の ID で、曲の ID に基づいてオーディオ ファイルを直接ダウンロードできます。完全なコードは次のとおりです:

def get_mp3(self):
    url = 'http://music.163.com/song/media/outer/url?id=' + str(self.song_id)+'.mp3'
    try:
        print("正在下载:{0}".format(self.song_name))
        urllib.request.urlretrieve(url, '{0}/{1}.mp3'.format(self.path, self.song_name))
        print("Finish...")
    except:
        print("Fail...")
ログイン後にコピー

関連する推奨事項:

Python を使用して NetEase Cloud Music で人気のあるコメントをクロールする方法

##Python クロール qq 音楽を取得するプロセスの例 #

以上がNetEase Cloud Music をダウンロードするための非常にシンプルな Python クローラーの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

PHPおよびPython:コードの例と比較 PHPおよびPython:コードの例と比較 Apr 15, 2025 am 12:07 AM

PHPとPythonには独自の利点と短所があり、選択はプロジェクトのニーズと個人的な好みに依存します。 1.PHPは、大規模なWebアプリケーションの迅速な開発とメンテナンスに適しています。 2。Pythonは、データサイエンスと機械学習の分野を支配しています。

CentosのPytorchのGPUサポートはどのようにサポートされていますか CentosのPytorchのGPUサポートはどのようにサポートされていますか Apr 14, 2025 pm 06:48 PM

Pytorch GPUアクセラレーションを有効にすることで、CentOSシステムでは、PytorchのCUDA、CUDNN、およびGPUバージョンのインストールが必要です。次の手順では、プロセスをガイドします。CUDAおよびCUDNNのインストールでは、CUDAバージョンの互換性が決定されます。NVIDIA-SMIコマンドを使用して、NVIDIAグラフィックスカードでサポートされているCUDAバージョンを表示します。たとえば、MX450グラフィックカードはCUDA11.1以上をサポートする場合があります。 cudatoolkitのダウンロードとインストール:nvidiacudatoolkitの公式Webサイトにアクセスし、グラフィックカードでサポートされている最高のCUDAバージョンに従って、対応するバージョンをダウンロードしてインストールします。 cudnnライブラリをインストールする:

Dockerの原則の詳細な説明 Dockerの原則の詳細な説明 Apr 14, 2025 pm 11:57 PM

DockerはLinuxカーネル機能を使用して、効率的で孤立したアプリケーションランニング環境を提供します。その作業原則は次のとおりです。1。ミラーは、アプリケーションを実行するために必要なすべてを含む読み取り専用テンプレートとして使用されます。 2。ユニオンファイルシステム(UnionFS)は、違いを保存するだけで、スペースを節約し、高速化する複数のファイルシステムをスタックします。 3.デーモンはミラーとコンテナを管理し、クライアントはそれらをインタラクションに使用します。 4。名前空間とcgroupsは、コンテナの分離とリソースの制限を実装します。 5.複数のネットワークモードは、コンテナの相互接続をサポートします。これらのコア概念を理解することによってのみ、Dockerをよりよく利用できます。

Python vs. JavaScript:コミュニティ、ライブラリ、リソース Python vs. JavaScript:コミュニティ、ライブラリ、リソース Apr 15, 2025 am 12:16 AM

PythonとJavaScriptには、コミュニティ、ライブラリ、リソースの観点から、独自の利点と短所があります。 1)Pythonコミュニティはフレンドリーで初心者に適していますが、フロントエンドの開発リソースはJavaScriptほど豊富ではありません。 2)Pythonはデータサイエンスおよび機械学習ライブラリで強力ですが、JavaScriptはフロントエンド開発ライブラリとフレームワークで優れています。 3)どちらも豊富な学習リソースを持っていますが、Pythonは公式文書から始めるのに適していますが、JavaScriptはMDNWebDocsにより優れています。選択は、プロジェクトのニーズと個人的な関心に基づいている必要があります。

ミニオペンCentosの互換性 ミニオペンCentosの互換性 Apr 14, 2025 pm 05:45 PM

MINIOオブジェクトストレージ:CENTOSシステムの下での高性能展開Minioは、Amazons3と互換性のあるGO言語に基づいて開発された高性能の分散オブジェクトストレージシステムです。 Java、Python、JavaScript、Goなど、さまざまなクライアント言語をサポートしています。この記事では、CentosシステムへのMinioのインストールと互換性を簡単に紹介します。 Centosバージョンの互換性Minioは、Centos7.9を含むがこれらに限定されない複数のCentosバージョンで検証されています。

CentosでPytorchの分散トレーニングを操作する方法 CentosでPytorchの分散トレーニングを操作する方法 Apr 14, 2025 pm 06:36 PM

Pytorchの分散トレーニングでは、Centosシステムでトレーニングには次の手順が必要です。Pytorchのインストール:PythonとPipがCentosシステムにインストールされていることです。 CUDAバージョンに応じて、Pytorchの公式Webサイトから適切なインストールコマンドを入手してください。 CPUのみのトレーニングには、次のコマンドを使用できます。PipinstalltorchtorchtorchvisionTorchaudioGPUサポートが必要な場合は、CUDAとCUDNNの対応するバージョンがインストールされ、インストールに対応するPytorchバージョンを使用してください。分散環境構成:分散トレーニングには、通常、複数のマシンまたは単一マシンの複数GPUが必要です。場所

CentosでPytorchバージョンを選択する方法 CentosでPytorchバージョンを選択する方法 Apr 14, 2025 pm 06:51 PM

PytorchをCentosシステムにインストールする場合、適切なバージョンを慎重に選択し、次の重要な要因を検討する必要があります。1。システム環境互換性:オペレーティングシステム:Centos7以上を使用することをお勧めします。 Cuda and Cudnn:PytorchバージョンとCudaバージョンは密接に関連しています。たとえば、pytorch1.9.0にはcuda11.1が必要ですが、pytorch2.0.1にはcuda11.3が必要です。 CUDNNバージョンは、CUDAバージョンとも一致する必要があります。 Pytorchバージョンを選択する前に、互換性のあるCUDAおよびCUDNNバージョンがインストールされていることを確認してください。 Pythonバージョン:Pytorch公式支店

NginxをCentosにインストールする方法 NginxをCentosにインストールする方法 Apr 14, 2025 pm 08:06 PM

NGINXのインストールをインストールするには、次の手順に従う必要があります。開発ツール、PCRE-Devel、OpenSSL-Develなどの依存関係のインストール。 nginxソースコードパッケージをダウンロードし、それを解凍してコンパイルしてインストールし、/usr/local/nginxとしてインストールパスを指定します。 nginxユーザーとユーザーグループを作成し、アクセス許可を設定します。構成ファイルnginx.confを変更し、リスニングポートとドメイン名/IPアドレスを構成します。 nginxサービスを開始します。依存関係の問題、ポート競合、構成ファイルエラーなど、一般的なエラーに注意する必要があります。パフォーマンスの最適化は、キャッシュをオンにしたり、ワーカープロセスの数を調整するなど、特定の状況に応じて調整する必要があります。

See all articles