PostgreSQL의 GROUP BY를 사용하여 연속 숫자 집계
PostgreSQL은 데이터 집계를 위한 강력한 기능을 제공합니다. 이 가이드에서는 특히 연속 연도와 관련된 시나리오에 초점을 맞춰 GROUP BY
절을 사용하여 연속 숫자 값을 그룹화하는 방법을 보여줍니다.
예시 시나리오: 회사 및 직업별로 연도 그룹화
qualification
, company
및 profession
열이 있는 year
이라는 테이블을 상상해 보세요. 목표는 고유한 회사-직업 조합을 식별하고 연속 연도를 배열로 그룹화하는 것입니다.
단계별 해결 방법:
<code class="language-sql">SELECT company, profession, year, CASE WHEN ROW_NUMBER() OVER (PARTITION BY company, profession ORDER BY year) = 1 OR year - LAG(year, 1, year) OVER (PARTITION BY company, profession ORDER BY year) > 1 THEN 1 ELSE 0 END AS group_cnt FROM qualification;</code>
이 쿼리는 ROW_NUMBER()
을 사용하여 각 회사-직업 그룹 내에서 고유한 순위를 할당하고 LAG()
를 사용하여 올해를 전년도와 비교합니다. group_cnt
은 1
으로 연속되지 않은 연도를 표시합니다.
<code class="language-sql">SELECT company, profession, year, SUM(group_cnt) OVER (ORDER BY company, profession, year) AS group_nr FROM ( -- The query from Step 1 goes here ) t1;</code>
SUM() OVER()
창 함수는 group_cnt
값을 누적 합계하여 그룹 ID(group_nr
) 역할을 하는 누계를 생성합니다.
array_agg()
를 사용하여 각 그룹 내의 연도를 집계합니다.<code class="language-sql">SELECT company, profession, ARRAY_AGG(year) AS years FROM ( -- The query from Step 2 goes here ) t2 GROUP BY company, profession, group_nr ORDER BY company, profession, group_nr;</code>
이 쿼리는 company
, profession
및 group_nr
별로 결과를 그룹화하고 ARRAY_AGG()
을 사용하여 연도를 각 그룹의 배열로 결합합니다.
예상 출력: 최종 출력은 연속 연도를 배열로 그룹화합니다.
<code> company | profession | years ---------+------------+------------------ Google | Programmer | {2000} Google | Sales | {2000,2001,2002} Google | Sales | {2004} Mozilla | Sales | {2002} (4 rows)</code>
이 방법은 연속된 숫자 값의 그룹화를 효율적으로 처리하여 PostgreSQL의 데이터 분석을 위한 명확하고 간결한 솔루션을 제공합니다.
위 내용은 GROUP BY를 사용하여 PostgreSQL에서 연속 숫자 값을 그룹화하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!