SparkSQL은 다양한 버전의 하위 쿼리를 어떻게 처리합니까?-MySQL 튜토리얼-php.cn

SparkSQL은 다양한 버전의 하위 쿼리를 어떻게 처리합니까?

Barbara Streisand

풀어 주다： 2025-01-01 05:00:09

원래의

789명이 탐색했습니다.

How Does SparkSQL Handle Subqueries Across Different Versions?

SparkSQL 하위 쿼리 지원

SparkSQL은 버전 2.0 이상에서 상관 및 비상관 하위 쿼리를 완벽하게 지원합니다. 하지만 2.0 이전 버전에서는 Spark의 하위 쿼리 지원이 제한되었습니다.

FROM 절에 있는 하위 쿼리의 경우 Spark는 Hive와 동일한 방식으로 지원합니다(버전 <= 0.12).

SELECT col FROM (SELECT *  FROM t1 WHERE bar) t2

로그인 후 복사

단, 스파크 2.0 이전 버전에서는 WHERE절 서브쿼리가 지원되지 않았습니다. 이는 성능 문제와 모든 하위 쿼리가 JOIN을 사용하여 표현될 수 있다는 사실 때문이었습니다.

Spark 2.0 이상에서는 상관된 하위 쿼리와 상관되지 않은 하위 쿼리가 모두 지원됩니다. 예는 다음과 같습니다.

SELECT * FROM l WHERE exists (SELECT * FROM r WHERE l.a = r.c)
SELECT * FROM l WHERE l.a in (SELECT c FROM r)

로그인 후 복사

그러나 2.0 이전 버전에서는 DataFrame DSL을 사용하여 하위 쿼리를 표현하는 것이 현재 불가능하다는 점에 유의하는 것이 중요합니다.

위 내용은 SparkSQL은 다양한 버전의 하위 쿼리를 어떻게 처리합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!