중복 행 삭제 시 고유 인스턴스 보존
대규모 데이터 세트로 작업할 때 중복 행을 제거해야 하는 경우가 있습니다. 그러나 특정 시나리오에서는 각 중복 행의 단일 복사본을 유지하는 것이 바람직할 수 있습니다. 이러한 경우 선택적 삭제를 수행하려면 타겟 접근 방식이 필요합니다.
문제 이해
PostgreSQL에서 설명된 상황은 세트의 인스턴스 하나만 남기고 모두 삭제하는 것과 관련이 있습니다. 중복 행. 예를 들어, 동일한 값을 가진 레코드가 5개 있다면 그 중 4개를 삭제하고 하나는 그대로 두는 것이 목표입니다.
해결책 찾기
종합적인 설명 이 문제에 대한 내용은 "PostgreSQL 데이터베이스에서 중복 항목 제거" 문서에 나와 있습니다. 저자는 효과적으로 그룹화할 수 없는 방대한 양의 데이터를 처리하는 구체적인 과제를 다룹니다.
간단한 솔루션
이 기사에서는 다음과 같은 간단한 솔루션을 권장합니다.
DELETE FROM foo WHERE id NOT IN (SELECT min(id) --or max(id) FROM foo GROUP BY hash)
이 쿼리에서 "해시"는 중복을 확인하는 데 사용되는 필드 또는 필드 조합을 나타냅니다. 각 중복 그룹에 대해 "id" 필드의 최소값 또는 최대값을 사용하면 하나의 인스턴스가 보존될 수 있습니다.
이 목표 접근 방식을 사용하면 참조용 단일 복사본을 유지하면서 중복 행을 효율적으로 삭제할 수 있습니다. 분석합니다.
위 내용은 단일 인스턴스를 유지하면서 PostgreSQL에서 중복 행을 효율적으로 삭제하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!