Comment ajouter des fichiers JAR à une tâche Spark à l'aide de spark-submit
Arrière-plan :
Spark-submit est un outil de ligne de commande utilisé pour soumettre des applications Spark. Il permet aux utilisateurs de spécifier diverses options, notamment l'ajout de fichiers JAR au chemin de classe de l'application.
Chemin de classe et distribution JAR :
Option Analyse :
1. --jars vs SparkContext.addJar
Ces deux options remplissent la même fonction d'ajout de fichiers JAR au chemin de classe de l'application. Cependant, ils sont utilisés dans différents contextes :
2. SparkContext.addJar vs SparkContext.addFile
3. --driver-class-path vs --conf spark.driver.extraClassPath
4. --driver-library-path vs --conf spark.driver.extraLibraryPath
5. --conf spark.executor.extraClassPath
6. --conf spark.executor.extraLibraryPath
Utilisation simultanée de plusieurs options :
Tant qu'ils ne sont pas en conflit, vous pouvez utiliser plusieurs JAR en toute sécurité. options d'ajout de fichiers en même temps. Cependant, notez que les fichiers JAR ne doivent être inclus dans les options extraClassPath que s'ils doivent figurer sur le chemin de classe.
Exemple :
La commande suivante montre l'ajout de fichiers JAR. en utilisant diverses options :
spark-submit --jars additional1.jar,additional2.jar \ --driver-class-path additional1.jar:additional2.jar \ --conf spark.executor.extraClassPath=additional1.jar:additional2.jar \ --class MyClass main-application.jar
Considérations supplémentaires :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!