Menyelesaikan Masalah Kebergantungan dalam Apache Spark
Apache Spark membina laluan kelasnya secara dinamik, meningkatkan kerentanannya kepada masalah pergantungan seperti java.lang.ClassNotFoundException , objek x bukan ahli pakej y, dan java.lang.NoSuchMethodError.
Kunci untuk menyelesaikan isu ini terletak pada memahami pelbagai komponen aplikasi Spark:
-
Pemandu: Melaksanakan logik aplikasi dan menguruskan sambungan kluster.
-
Pengurus Kluster: Memperuntukkan sumber (pelaksana) untuk aplikasi.
-
Pelaksana: Laksanakan tugas pemprosesan sebenar.
Setiap komponen memerlukan kelas tertentu, seperti yang digambarkan oleh rajah berikut:
[Imej Gambaran Keseluruhan Penempatan Kelas Diagram]
Kod Spark:
- Mesti ada dalam semua komponen untuk memudahkan komunikasi.
- Gunakan versi Scala dan Spark yang sama merentas semua komponen.
Pemandu Sahaja Kod:
- Pilihan, mengandungi kod tidak diedarkan.
Kod Edaran:
- Mesti dihantar kepada pelaksana untuk diproses.
- Termasuk transformasi pengguna dan mereka tanggungan.
Garis Panduan untuk Penyelesaian Ketergantungan:
-
Kod Spark:
- Gunakan versi Spark dan Scala yang konsisten dalam semua komponen.
- Untuk mod kendiri, pemandu mesti sepadan dengan versi Spark pada induk dan pelaksana.
- Untuk YARN/Mesos, sediakan versi Spark yang betul apabila memulakan SparkSession. Hantar semua kebergantungan Spark kepada pelaksana.
-
Kod Pemandu:
- Pakej sebagai satu atau berbilang balang, memastikan kemasukan daripada semua kebergantungan dan pengguna Spark kod.
-
Kod Diedarkan:
- Pakej sebagai pustaka, termasuk kod pengguna dan kebergantungan.
- Hantar perpustakaan kepada pelaksana menggunakan spark.jars parameter.
Amalan Terbaik:
- Buat perpustakaan dengan kod yang diedarkan, membungkusnya sebagai balang biasa dan berlemak.
- Bina aplikasi pemacu dengan kebergantungan pada perpustakaan ini dan Spark (khusus versi).
- Aplikasi pemacu pakej sebagai balang lemak.
- Tetapkan spark.jars ke lokasi kod yang diedarkan.
- Tetapkan spark.yarn.archive ke lokasi Spark binari.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Menyelesaikan Konflik Kebergantungan dengan Berkesan dalam Aplikasi Apache Spark Saya?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!