解決Apache Spark 中的依賴關係問題
Apache Spark 應用程式在建置和部署過程中通常會遇到與依賴關係相關的問題。這些問題包括java.lang.ClassNotFoundException、object x is not a member of package y 編譯錯誤以及java.lang.NoSuchMethodError.
動態類路徑和依賴管理
動態類路徑和依賴管理
Spark 的類別路徑是動態建置的以適應使用者程式碼,可能會導致這些問題。此外,所使用的特定集群管理器(master)引入了進一步的考慮因素。
元件和類別放置
執行器:在叢集節點上執行 Spark 任務。
每個組件的類別放置如下所示:< ;img src="https://i.sstatic.net/eGByZ.png" alt="如何有效管理依賴關係以避免 Apache Spark 應用程式出現錯誤?">
分發代碼
需要執行的使用者程式碼在執行者上且必須運送到
不同群集管理器中的依賴管理
要求所有驅動程式使用與master 相同的 Spark 版本
Spark 依賴項,包括傳遞依賴項,必須包含在分散式 jars/archive 中。
使用YARN 的建議方法
以上是如何有效管理依賴關係以避免 Apache Spark 應用程式出現錯誤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!