# coding=gbk import requests import json c='网易云爬虫实战一' print(c) music_url = 'https://music.163.com/#/song?id=28815250' id = music_url.split('=')[1] # print(id) url = 'https://music.163.com/weapi/v1/resource/comments/R_SO_4_%s?csrf_token=7e19029fe28aa3e09cfe87e89d2e4eeb' %(id) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36', 'Referer': 'https://music.163.com/song?id=%s' %(id), 'Origin': 'https://music.163.com', } formdata = { 'params': 'AoF/ZXuccqvtaCMCPHecFGVPfrbtDj4JFPJsaZ3tYn9J+r0NcnKPhZdVECDz/jM+1CpA+ByvAO2J9d44B/MG97WhjmxWkfo4Tm++AfyBgK11NnSbKsuQ5bxJR6yE0MyFhU8sPq7wb9DiUPFKs2ulw0GxwU/il1NS/eLrq+bbYikK/cyne90S/yGs6ldxpbcNd1yQTuOL176aBZXTJEcGkfbxY+mLKCwScAcCK1s3STo=', 'encSecKey': '365b4c31a9c7e2ddc002e9c42942281d7e450e5048b57992146633181efe83c1e26acbc8d84b988d746370d788b6ae087547bace402565cca3ad59ccccf7566b07d364aa1d5b2bbe8ccf2bc33e0f03182206e29c66ae4ad6c18cb032d23f1793420ceda05e796401f170dbdb825c20356d27f07870598b2798f8d344807ad6f2', } response = requests.post(url, headers = headers, data = formdata) messages = json.loads(response.text) data_list=[] data={} for message in messages['hotComments']: data['nickname']=message['user']['nickname'] data['content']=message['content'] data_list.append(data) data={} #print(data_list) for i in data_list: c = ' '+i['nickname']+':'+i['content'] print('\n\n'+c.replace('\n',''))
https://music.163」です。 .com /#/song?id=", "28815250"
3. リクエスト モジュールによって取得された HTML テキストは、json を使用して Python で読み取り可能な形式に変換する必要があります。それ以外の場合は、エラーが報告されます。 jupyter ノートブックではこのようなことは起こりません。 4. replace() 関数は文字列から要素を削除できます。この例では、改行文字が空に変更されます。 最終的な表示結果は次のとおりです。
##この記事では、NetEase Cloud 音楽レビュー クロールの関連コンテンツを紹介します。 php中国語ウェブサイトに従ってください。
関連する推奨事項:
シンプルな PHP MySQL ページング クラス再帰なしの 2 つのツリー配列コンストラクターHTMLをExcelに変換し、印刷・ダウンロード機能を実現以上がNetEase Cloud の音楽レビューのクロールの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。