Spark-Submit を使用する場合、Spark ジョブに JAR ファイルを追加するにはいくつかのオプションがあります。クラスパス、ファイル分散、および優先順位に対する独自の影響。
Spark-Submit は、次のオプションを通じてクラスパスに影響します:
ファイルを両方のクラスパスに含めるには、両方 フラグで指定する必要があります。
ファイルの配布は実行モードによって異なります:
Spark-Submit は、ファイル配布用に次の URI プレフィックスをサポートしています:
質問で言及されているオプションは、次のように JAR ファイルの処理に影響します:
SparkConf で直接設定されたプロパティが最も優先され、次に Spark-Submit フラグ、spark-defaults.conf のオプションが続きます。したがって、コードで設定された値は、対応するフラグまたはオプションをオーバーライドします。
クライアント モードでは、3 つの主要なオプションをすべて使用して JAR ファイルを安全に追加できます。
spark-submit --jars additional1.jar,additional2.jar \ --driver-class-path additional1.jar:additional2.jar \ --conf spark.executor.extraClassPath=additional1.jar:additional2.jar \ --class MyClass main-application.jar
ただし、クラスター モードでは、--jars を使用してファイルを追加するだけで、手動でワーカー ノードに配布する必要があります。 JAR ファイルを --driver-library-path に渡すような冗長な引数は避けてください。
以上がSpark-Submit を使用して JAR ファイルを Spark ジョブに追加するにはどうすればよいですか?また、そのためのさまざまなオプションと考慮事項は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。