> 데이터 베이스 > MySQL 튜토리얼 > 내 PostgreSQL `SELECT DISTINCT`가 너무 느린 이유는 무엇이며 어떻게 해결할 수 있습니까?

내 PostgreSQL `SELECT DISTINCT`가 너무 느린 이유는 무엇이며 어떻게 해결할 수 있습니까?

Linda Hamilton
풀어 주다: 2025-01-07 18:39:40
원래의
963명이 탐색했습니다.

Why is My PostgreSQL `SELECT DISTINCT` So Slow, and How Can I Fix It?

PostgreSQL SELECT DISTINCT 성능 병목 현상: 사례 연구

이 기사에서는 약 2백만 개의 레코드가 포함된 PostgreSQL 테이블에서 SELECT DISTINCT 쿼리 시 발생하는 성능 문제를 조사합니다.

컨텍스트

tickers 테이블은 Coinbase Pro의 "티커" 채널에서 가져온 데이터를 저장합니다. 복합 기본 키에는 product_id 열이 포함됩니다.

성능 문제

SELECT DISTINCT product_id FROM tickers의 인덱스로 인해 product_id 쿼리가 좋은 성능을 발휘할 것으로 예상되었습니다. 그러나 실행에는 지속적으로 500~600밀리초가 걸렸습니다.

쿼리 계획 조사

EXPLAIN ANALYZEproduct_id 인덱스를 무시하고 기본적으로 순차 스캔으로 설정된 쿼리 플래너를 보여줍니다. 인덱스를 강제로 사용해도 성능 문제가 해결되지 않았습니다.

인덱스 최적화 시도

product_id에 전용 인덱스를 생성하면 약간의 개선만 이루어졌으며 명시적으로 재정의되지 않는 한 플래너는 여전히 순차 스캔을 선호합니다.

효과적인 솔루션: 인덱스 건너뛰기 스캔 에뮬레이션

구현된 솔루션은 측면 조인이 포함된 재귀 쿼리를 사용하여 인덱스 건너뛰기 스캔을 에뮬레이트합니다. 이 접근 방식은 성능을 크게 향상시켜 225만 행의 데이터 세트에서도 실행 시간을 0.75밀리초로 단축했습니다.

요약

PostgreSQL의 현재 기본 인덱스 건너뛰기 스캔 기능 부족은 이 에뮬레이션 기술로 해결됩니다. 이 방법은 기존 인덱스를 효과적으로 활용하고 SELECT DISTINCT대형 테이블에 대한 쿼리

에 대한 순차 스캔의 성능 저하를 방지합니다.

위 내용은 내 PostgreSQL `SELECT DISTINCT`가 너무 느린 이유는 무엇이며 어떻게 해결할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿