PostgreSQL: 분 단위로 실행 중인 행 수 계산
이 문서에서는 PostgreSQL에서 분 단위로 그룹화된 쿼리의 실행 행 수를 얻는 방법을 보여줍니다. 문제는 활동이 없는 경우에도 매분마다 행을 정확하게 계산하는 것입니다.
창 기능 활용
가장 효율적인 솔루션은 PostgreSQL의 강력한 창 기능을 활용하는 것입니다. 이러한 함수는 행 집합에서 작동하므로 여러 행에 걸쳐 계산을 수행할 수 있습니다. 여기서는 분 단위로 분할된 창 내에서 COUNT
기능을 사용합니다.
SELECT DISTINCT
및 ORDER BY
이 쿼리는 SELECT DISTINCT
을 사용하여 고유한 분 항목을 확인하고 COUNT
을 창 함수와 함께 사용하여 실행 횟수를 생성합니다. ORDER BY
각 분 간격에 대한 정확한 누적 합계를 보장합니다.
SELECT DISTINCT date_trunc('minute', "when") AS minute, count(*) OVER (ORDER BY date_trunc('minute', "when")) AS running_ct FROM mytable ORDER BY 1;
창 함수 구문 이해
창 기능을 분석해 보겠습니다.
COUNT(*)
: 각 분 파티션 내의 행 수를 계산합니다.OVER (ORDER BY date_trunc('minute', "when"))
: 창을 분 단위로 정렬된 일련의 행으로 정의하고 처음부터 개수를 누적합니다.활동이 없는 시간 처리
활동이 없는 시간(행 0개)을 포함하려면 generate_series
을 사용하여 일련의 시간을 만든 다음 LEFT JOIN
을 수행하여 테이블에 해당 항목이 없더라도 해당 시간을 포함합니다.
SELECT DISTINCT minute, count(c.minute) OVER (ORDER BY minute) AS running_ct FROM ( SELECT generate_series(date_trunc('minute', min("when")), max("when"), interval '1 min') FROM mytable ) m(minute) LEFT JOIN (SELECT date_trunc('minute', "when") AS minute FROM mytable) c USING (minute) ORDER BY 1;
성능 고려 사항
창 기능은 일반적으로 대규모 데이터세트에 최적이지만, 소규모 데이터세트에는 SUM()
을 사용하는 대안이 더 나은 성능을 제공할 수 있습니다. 이 접근 방식은 먼저 분당 행을 그룹화하고 계산한 다음 SUM()
을 사용하여 누계를 계산합니다.
SELECT minute, sum(minute_ct) OVER (ORDER BY minute) AS running_ct FROM ( SELECT date_trunc('minute', "when") AS minute, count(*) AS minute_ct FROM tbl GROUP BY 1 ) sub ORDER BY 1;
가장 좋은 접근 방식은 데이터 세트 크기와 성능 요구 사항에 따라 다릅니다. 특정 사용 사례에 가장 효율적인 솔루션을 결정하려면 두 가지 방법을 모두 테스트하는 것이 좋습니다.
위 내용은 PostgreSQL에서 실행 중인 행 수를 분 단위로 얻는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!