Les amis qui ont joué au jeu Honor of Kings savent tous qu'un équipement de héros est très important, associé à des inscriptions, peut vous rendre imparable et. imparable sur le champ de bataille des rois !
Il y a quelques jours, j'ai vu dans le groupe [Minglao] qu'il partageait un robot d'exploration Python pour obtenir les instructions d'équipement du héros Honor of Kings, et utilisait le pool de threads pour télécharger les images d'équipement, puis générait automatiquement une démarque fichiers. Il y a beaucoup de contenu utile, et je vais le partager avec vous ici. Tout le monde est invité à l'essayer.
Notre site Web cible ici est le site officiel de King of Glory, comme le montre l'image ci-dessous.
Cliquez ensuite sur le bouton [Plus] de [Héros/Skins] sur le côté droit de la page d'accueil pour accéder à la page de détails, comme indiqué dans l'image ci-dessous. Cliquez sur [Objets du jeu] pour voir les informations sur l'équipement, qui. comprend l'obtention des informations cibles que nous souhaitons.
En capturant des paquets via le navigateur, vous pouvez obtenir des informations spécifiques et les voir stockées au format json
.
L'image ci-dessous est une capture d'écran des détails des données. Vous pouvez voir qu'il y a des caractères chinois tronqués. Cela ne l'affecte pas. Au moins, les données peuvent être obtenues.
Après avoir trouvé la source de données, l'étape suivante consiste à implémenter le code. Jetons un coup d'œil. Le code [Minglao] est directement appliqué ici et est exécuté dans jupyter notebook
.
import requests import pandas as pd headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ' 'Chrome/88.0.4324.104 Safari/537.36 ' } target = 'https://pvp.qq.com/web201605/js/item.json' item_list = requests.get(target, headers=headers).json() item_df = pd.DataFrame(item_list) item_df.sort_values(["item_type", "price", "item_id"], inplace=True) item_df.fillna("", inplace=True) item_df.des1 = item_df.des1.str.replace("</?p>", "", regex=True) item_df.des2 = item_df.des2.str.replace("</?p>", "", regex=True) item_df
Le résultat est comme indiqué dans la figure ci-dessous :
Ensuite, utilisez la méthode du pool de threads pour télécharger des images. La méthode d'épissage des images est également très simple, cela sera clair en un coup d'œil en regardant l'image ci-dessous.
Voici l'implémentation du code :
import os from concurrent.futures import ThreadPoolExecutor def download_img(item_id): if os.path.exists(f"imgs/{item_id}.jpg"): return imgurl = f"http://game.gtimg.cn/images/yxzj/img201606/itemimg/{item_id}.jpg" res = requests.get(imgurl) with open(f"imgs/{item_id}.jpg", "wb") as f: f.write(res.content) os.makedirs("imgs", exist_ok=True) with ThreadPoolExecutor(max_workers=8) as executor: nums = executor.map(download_img, item_df.item_id)
La vitesse de téléchargement est très rapide, quelques secondes seulement, et le résultat est comme le montre la figure ci-dessous :
Ensuite, nous générerons automatiquement le document Markdown à partir des données, jetons un coup d'œil.
Le code est le suivant La première partie est le prétraitement des données, suivi de l'écriture du fichier :
item_type_dict = {1: '攻击', 2: '法术', 3: '防御', 4: '移动', 5: '打野', 7: '游走'} item_ids = item_df.item_id.values item_df.item_id = item_df.item_id.apply( lambda item_id: f"![{item_id}](imgs/{item_id}.jpg)") item_df.item_type = item_df.item_type.map(item_type_dict) item_df.columns = ["图片", "装备名称", "类型", "售价", "总价", "基础描述", "扩展描述"] item_df
Le code pour écrire le fichier et générer le document Markdown :
with open("王者装备说明.md", "w") as f: for item_type, item_split in item_df.groupby("类型", sort=False): f.write(f"# {item_type}\n") item_split.drop(columns="类型", inplace=True) f.write(item_split.to_markdown(index=False)) f.write("\n\n")
. Le résultat est le suivant :
Ensuite, un document Markdown nommé [King Equipment Description.md] sera généré localement. Double-cliquez sur le fichier pour l'ouvrir. Le contenu est tel qu'indiqué ci-dessous :
Quoi. un gars génial ! Lorsque j'ai implémenté cette étape, j'ai rencontré une erreur, comme indiqué ci-dessous :
Missing optional dependency 'tabulate'. Use pip or conda to install tabulate.
提示却少依赖库,只需要在cmd
下进行安装即可pip install tabulate
,之后就可以正常运行了。
不过Markdown的表格无法任意调整,图片需要点击后才会放大,下面我们考虑生成Excel表格:首先需要整理数据,代码如下:
item_df.图片 = "" item_df.基础描述 = item_df.基础描述.str.replace("<br>", "\n") item_df.扩展描述 = item_df.扩展描述.str.replace("<br>", "\n") item_df
生成结果如下图所示:
之后将结果写入到Excel
中去,代码如下所示:
# 写入Excel表格 from openpyxl.drawing.image import Image from openpyxl.styles import Alignment with pd.ExcelWriter("王者装备说明.xlsx", engine='openpyxl') as writer: item_df.to_excel(writer, sheet_name='装备说明', index=False) worksheet = writer.sheets['装备说明'] worksheet.column_dimensions["A"].width = 11 for item_id, (cell,) in zip(item_ids, worksheet.iter_rows(2, None, 1, 1)): worksheet.row_dimensions[cell.row].height = 67 worksheet.add_image(Image(f"imgs/{item_id}.jpg"), f'A{cell.row}') worksheet.column_dimensions["F"].width = 15 worksheet.column_dimensions["G"].width = 35 writer.save()
打开文件,效果图如下图所示:
当然了,大家也可以根据自己想要的效果生成HTML和Word等等。
大家好,我是Python进阶者。这篇文章主要分享了一个使用Python网络爬虫获取王者荣耀英雄出装说明,并使用线程池的方式下载了出装图片,之后还自动化生成了markdown文件,干货内容很多,欢迎大家积极尝试,如果有遇到问题,请添加我好友,我帮助解决。
最后感谢粉丝【明佬】分享的代码喝王者荣耀出装攻略,真是太强了,上王者指日可待!
最后放上【明佬】的csdn链接:https://xxmdmst.blog.csdn.net/article/details/124035041
,点击阅读原文可以直达噢!
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!