So fügen Sie JAR-Dateien zu einem Spark-Job mit spark-submit hinzu
Hintergrund:
Spark-submit ist ein Befehlszeilentool zum Senden von Spark-Anwendungen. Es ermöglicht Benutzern, verschiedene Optionen anzugeben, einschließlich des Hinzufügens von JAR-Dateien zum Klassenpfad der Anwendung.
Klassenpfad und JAR-Verteilung:
Optionsanalyse:
1. --jars vs SparkContext.addJar
Beide Optionen führen die gleiche Funktion des Hinzufügens von JAR-Dateien zum Klassenpfad der Anwendung aus. Sie werden jedoch in unterschiedlichen Kontexten verwendet:
2. SparkContext.addJar vs SparkContext.addFile
3. --driver-class-path vs --conf spark.driver.extraClassPath
4. --driver-library-path vs --conf spark.driver.extraLibraryPath
5. --conf spark.executor.extraClassPath
6. --conf spark.executor.extraLibraryPath
Gleichzeitige Verwendung mehrerer Optionen:
Solange es keine Konflikte gibt, ist es sicher, mehrere zu verwenden Optionen zum Hinzufügen von JAR-Dateien gleichzeitig. Beachten Sie jedoch, dass JAR-Dateien nur dann in die extraClassPath-Optionen aufgenommen werden sollten, wenn sie sich im Klassenpfad befinden müssen.
Beispiel:
Der folgende Befehl demonstriert das Hinzufügen von JAR-Dateien Verwendung verschiedener Optionen:
spark-submit --jars additional1.jar,additional2.jar \ --driver-class-path additional1.jar:additional2.jar \ --conf spark.executor.extraClassPath=additional1.jar:additional2.jar \ --class MyClass main-application.jar
Zusätzliche Überlegungen:
Das obige ist der detaillierte Inhalt vonWie füge ich JAR-Dateien mit Spark-Submit zu einem Spark-Job hinzu?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!