spark-submit을 사용하여 Spark 작업에 JAR 파일을 추가하는 방법
배경:
Spark-submit은 Spark 애플리케이션을 제출하는 데 사용되는 명령줄 도구입니다. 이를 통해 사용자는 애플리케이션의 클래스 경로에 JAR 파일을 추가하는 등 다양한 옵션을 지정할 수 있습니다.
클래스 경로 및 JAR 배포:
옵션 분석:
1. --jars vs SparkContext.addJar
이 두 옵션 모두 애플리케이션의 클래스 경로에 JAR 파일을 추가하는 동일한 기능을 수행합니다. 그러나 이들은 다른 컨텍스트에서 사용됩니다.
2. SparkContext.addJar 대 SparkContext.addFile
3. --driver-class-path 대 --conf Spark.driver.extraClassPath
4. --driver-library-path 대 --conf Spark.driver.extraLibraryPath
5. --conf Spark.executor.extraClassPath
6. --conf Spark.executor.extraLibraryPath
동시에 여러 옵션 사용:
충돌하지 않는 한 여러 JAR 파일 추가 옵션을 동시에 사용해도 안전합니다. 그러나 JAR 파일은 클래스 경로에 있어야 하는 경우에만 extraClassPath 옵션에 포함되어야 합니다.
예:
다음 명령은 JAR 파일 추가를 보여줍니다. 다양한 옵션 사용:
spark-submit --jars additional1.jar,additional2.jar \ --driver-class-path additional1.jar:additional2.jar \ --conf spark.executor.extraClassPath=additional1.jar:additional2.jar \ --class MyClass main-application.jar
추가 고려 사항:
위 내용은 Spark-submit을 사용하여 Spark 작업에 JAR 파일을 추가하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!