Spark-Submit을 사용하여 Spark 작업에 JAR 파일 추가
ClassPath 효과
사용 extraClassPath 또는 --driver-class-path는 드라이버 노드에 대한 클래스 경로를 설정하고, Spark.executor.extraClassPath는 작업자 노드에 대해 이를 설정합니다. JAR이 두 가지 모두에 영향을 미치게 하려면 두 구성 모두에서 이를 지정하십시오.
구분 문자
사용되는 구분 기호는 운영 체제에 따라 다릅니다.
파일 배포
클라이언트 모드에서 파일은 다음을 통해 배포됩니다. HTTP 서버. 클러스터 모드에서는 HDFS 또는 기타 공유 저장소를 통해 작업자가 사용할 수 있어야 합니다.
URI 유형
허용되는 URL 구성표는 다음과 같습니다.
영향을 받는 옵션
우선순위
SparkConf에 직접 설정된 값은 플래그 또는 Spark 제출 옵션보다 우선합니다.
단순성을 위해
클라이언트 모드에서는 다음을 사용하여 드라이버와 작업자 모두에 대한 JAR을 추가할 수 있습니다.
spark-submit --jars additional1.jar,additional2.jar \ --driver-class-path additional1.jar:additional2.jar \ --conf spark.executor.extraClassPath=additional1.jar:additional2.jar \ --class MyClass main-application.jar
클러스터 모드에서 그러나 공유 스토리지 시스템을 통해 JAR에 액세스할 수 있는지 확인하세요.
위 내용은 Spark-Submit을 사용하여 Spark 작업에 JAR 파일을 추가하려면 어떻게 해야 하며 클래스 경로는 어떻게 작동합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!