大家好,我是sea_turt1e。
本文将分享我构建机器学习模型预测美国职业篮球联赛(NBA)球员化学反应的过程和结果,我非常热爱这项运动。
对于不熟悉 NBA 的读者,本文部分内容可能难以理解。“化学反应”可以从更直观的角度理解。此外,虽然本文侧重于 NBA,但该方法也可应用于其他体育运动,甚至人际关系化学反应预测。
我们先来看预测结果。稍后我会详细介绍数据集和技术细节。
在化学反应预测中,红色边表示良好的化学反应,黑色边表示中等化学反应,蓝色边表示较差的化学反应。
边上的分数代表化学反应分数,范围从 0 到 1。
以下是明星球员的化学反应预测。该图仅包含从未在同一球队效力的球员对。
观察从未一起打球的明星球员的预测结果,结果可能并不总是符合直觉。
例如,勒布朗·詹姆斯和斯蒂芬·库里在奥运会上表现出极佳的配合,表明化学反应良好。另一方面,令人惊讶的是,预测尼古拉·约基奇与其他球员的化学反应较差。
为了使预测更贴近实际,我测试了 2022-23 赛季实际交易中球员之间的化学反应。
由于 2022-23 赛季的数据未包含在训练数据中,因此与现实印象相符的预测可以表明模型的有效性。
2022-23 赛季发生了几笔重要的交易。
以下是凯文·杜兰特、凯里·欧文和八村塁等关键球员的预测结果。
他们新球队的化学反应预测如下:
考虑到 2022-23 赛季的动态,这些结果似乎相当准确。(尽管太阳队和独行侠队的情况在接下来的赛季发生了变化。)
接下来,我将解释技术方面的内容,包括 GNN 框架和数据集准备。
GNN(图神经网络)是一种旨在处理图结构数据的网络。
在这个模型中,“球员之间的化学反应”表示为图边,学习过程如下:
对于负边,模型优先考虑“助攻次数低的队友”,并弱化“不同球队球员”的影响。
AUC(曲线下面积)是指 ROC 曲线下的面积,用作评估模型性能的指标。
AUC 越接近 1,表示准确性越高。在本研究中,模型的 AUC 约为 0.73——这是一个中等偏上的结果。
以下是训练过程中的学习曲线和 AUC 进程:
主要创新在于数据集的构建。
为了量化化学反应,我假设“助攻次数高”表示化学反应良好。基于此假设,数据集的结构如下:
此外,助攻次数低的队友被明确地视为化学反应较差。
所有代码都可在 GitHub 上找到。
按照 README 中的说明,您应该能够复制训练过程并绘制此处描述的图表。
https://www.php.cn/link/867079fcaff2dfddeb29ca1f27853ef7
仍有改进的空间,我计划实现以下目标:
在本篇文章中,我介绍了我尝试预测 NBA 球员化学反应的尝试。
虽然该模型仍在开发中,但我希望通过进一步改进获得更令人兴奋的结果。
欢迎在评论区留下您的想法和建议!
如果您需要进一步完善,请告诉我!
以上是使用图神经网络预测 NBA 球员的化学反应的详细内容。更多信息请关注PHP中文网其他相关文章!