大家好,我是sea_turt1e。
本文將分享我建立機器學習模型預測美國職業籃球聯賽(NBA)球員化學反應的過程和結果,我非常熱愛這項運動。
對於不熟悉 NBA 的讀者,本文部分內容可能難以理解。 「化學反應」可以從更直觀的角度來理解。此外,雖然本文著重於 NBA,但此方法也可應用於其他運動,甚至人際關係化學反應預測。
我們先來看預測結果。稍後我會詳細介紹資料集和技術細節。
在化學反應預測中,紅色邊表示良好的化學反應,黑色邊表示中等化學反應,藍色邊表示較差的化學反應。
邊上的分數代表化學反應分數,範圍從 0 到 1。
以下是明星球員的化學反應預測。該圖僅包含從未在同一隊效力的球員對。
觀察從未一起打球的明星球員的預測結果,結果可能並不總是符合直覺。
例如,勒布朗·詹姆斯和史蒂芬·庫裡在奧運會上表現出極佳的配合,表明化學反應良好。另一方面,令人驚訝的是,預測尼古拉·約基奇與其他球員的化學反應較差。
為了讓預測更貼近實際,我測試了 2022-23 賽季實際交易中球員之間的化學反應。
由於 2022-23 賽季的數據未包含在訓練數據中,因此與現實印象相符的預測可以表明模型的有效性。
2022-23 賽季發生了幾筆重要的交易。
以下是凱文·杜蘭特、凱裡·歐文和八村塁等關鍵球員的預測結果。
他們新球隊的化學反應預測如下:
考慮到 2022-23 賽季的動態,這些結果似乎相當準確。 (儘管太陽隊和獨行俠隊的情況在接下來的賽季發生了變化。)
接下來,我將解釋技術方面的內容,包括 GNN 框架和資料集準備。
GNN(圖神經網路)是一種旨在處理圖結構資料的網路。
在這個模型中,「球員之間的化學反應」表示為圖邊,學習過程如下:
對於負邊,模型優先考慮“助攻次數低的隊友”,並弱化“不同球隊球員”的影響。
AUC(曲線下面積)是指 ROC 曲線下的面積,用作評估模型效能的指標。
AUC 越接近 1,表示準確度越高。在本研究中,模型的 AUC 約為 0.73——這是一個中等偏上的結果。
以下是訓練過程中的學習曲線和 AUC 進程:
主要創新在於資料集的建構。
為了量化化學反應,我假設「助攻次數高」表示化學反應良好。基於此假設,資料集的結構如下:
此外,助攻次數低的隊友被明確地視為化學反應較差。
所有程式碼都可在 GitHub 上找到。
按照 README 中的說明,您應該能夠複製訓練過程並繪製此處描述的圖表。
https://www.php.cn/link/867079fcaff2dfddeb29ca1f27853ef7
仍有進步的空間,我計畫達成以下目標:
在這篇文章中,我介紹了我嘗試預測 NBA 球員化學反應的嘗試。
雖然該模型仍在開發中,但我希望透過進一步改進獲得更令人興奮的結果。
歡迎在留言區留下您的想法和建議!
如果您需要進一步完善,請告訴我!
以上是使用圖神經網路預測 NBA 球員的化學反應的詳細內容。更多資訊請關注PHP中文網其他相關文章!