> 데이터 베이스 > MySQL 튜토리얼 > PostgreSQL에서 고유 제약 조건이 있는 대규모 테이블에서 중복 행을 효율적으로 제거하려면 어떻게 해야 합니까?

PostgreSQL에서 고유 제약 조건이 있는 대규모 테이블에서 중복 행을 효율적으로 제거하려면 어떻게 해야 합니까?

Mary-Kate Olsen
풀어 주다: 2025-01-14 07:45:42
원래의
698명이 탐색했습니다.

How Can I Efficiently Remove Duplicate Rows from a Large Table with a Unique Constraint in PostgreSQL?

PostgreSQL에서 고유 제약 조건이 있는 대규모 테이블에서 중복 항목을 효율적으로 제거

중복 항목이 포함된 대규모 테이블(수백만 개의 행)에 고유 제약 조건을 추가하는 것은 표준 SQL DELETE 문의 시간 소모적 특성으로 인해 심각한 문제를 야기합니다. 이 기사에서는 보다 효율적인 솔루션을 살펴봅니다.

PostgreSQL 확장과 USING 절을 활용하는 매우 효과적인 방법입니다. 다음 쿼리를 고려해보세요.

<code class="language-sql">DELETE FROM table USING table AS alias
WHERE table.field1 = alias.field1 AND table.field2 = alias.field2 AND table.max_field < alias.max_field;</code>
로그인 후 복사

이 쿼리는 중복 행을 교묘하게 제거합니다. field1, field2을 기준으로 중복을 식별하고 max_field 값이 가장 높은 행을 유지하고 값이 낮은 행을 삭제합니다.

예를 들어 email 테이블의 user_accounts 열에 고유성을 적용하고 가장 최근에 생성된 계정(가장 높은 id)을 유지하려면 쿼리는 다음과 같습니다.

<code class="language-sql">DELETE FROM user_accounts USING user_accounts AS ua2
WHERE user_accounts.email = ua2.email AND user_accounts.id < ua2.id;</code>
로그인 후 복사

USING 절은 이 PostgreSQL 전용 접근 방식의 효율성을 높이는 핵심입니다. 대규모 데이터 세트를 처리할 때 기존 DELETE 방법에 비해 성능이 크게 향상됩니다.

위 내용은 PostgreSQL에서 고유 제약 조건이 있는 대규모 테이블에서 중복 행을 효율적으로 제거하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿