오라클 데이터 중복 제거
기업 데이터가 지속적으로 증가함에 따라 중복 데이터는 데이터베이스 관리에서 중요한 문제가 되었습니다. Oracle 데이터베이스에서 중복 데이터는 부정확한 쿼리 결과로 이어지고 저장 공간을 소비하며 데이터베이스 성능에 영향을 미칩니다. 따라서 중복 제거가 필요합니다.
이 기사에서는 Oracle 데이터베이스에서 중복 데이터를 삭제하는 여러 가지 방법을 소개합니다.
방법 1: 하위 쿼리 및 그룹화 사용
중복 데이터를 삭제하기 전에 먼저 중복 데이터가 무엇인지 이해해야 합니다. Oracle 데이터베이스에서는 두 개 이상의 레코드에 모두 동일한 열이 있으면 중복됩니다.
다음은 중복 데이터가 포함된 샘플 테이블입니다.
CREATE TABLE employee( emp_id NUMBER(6), first_name VARCHAR2(50), last_name VARCHAR2(50), dept_id NUMBER(4) ); INSERT INTO employee(emp_id, first_name, last_name, dept_id) VALUES(1, 'John', 'Doe', 101); INSERT INTO employee(emp_id, first_name, last_name, dept_id) VALUES(2, 'Jane', 'Doe', 102); INSERT INTO employee(emp_id, first_name, last_name, dept_id) VALUES(3, 'John', 'Doe', 101); INSERT INTO employee(emp_id, first_name, last_name, dept_id) VALUES(4, 'Bob', 'Smith', 103);
중복 데이터를 제거하고 각 직원에 대해 하나의 레코드만 유지하려면 다음 SQL 쿼리 문을 사용할 수 있습니다.
DELETE FROM employee WHERE emp_id IN (SELECT emp_id FROM (SELECT emp_id, ROW_NUMBER() OVER (PARTITION BY first_name, last_name, dept_id ORDER BY emp_id) rn FROM employee) WHERE rn <> 1);
이 SQL 문은 하위 쿼리를 사용합니다. , 이 하위 쿼리는 ROW_NUMBER 함수를 사용하여 각 직원의 첫 번째 행을 식별합니다. 그런 다음 나머지 행을 모두 삭제합니다.
PARTITION BY 문은 각 부서의 행을 그룹화하는 데 사용되며 ORDER BY 문은 emp_id 순서로 행을 정렬하는 데 사용됩니다. ROW_NUMBER 함수를 실행하면 다음과 같은 결과를 얻습니다.
EMP_ID | FIRST_NAME | LAST_NAME | DEPT_ID | RN -------|------------|-----------|---------|----- 1 | John | Doe | 101 | 1 2 | Jane | Doe | 102 | 1 3 | John | Doe | 101 | 2 4 | Bob | Smith | 103 | 1
여기서 같은 부서에서 John Doe가 1위와 3위에 있는 것을 볼 수 있습니다. 이는 John Doe 레코드가 두 개 있다는 의미입니다. rn이 1이 아닌 모든 행을 제거함으로써 중복 데이터를 제거하고 각 직원에 대해 하나의 행을 유지할 수 있습니다.
방법 2: 임시 테이블 사용
또 다른 방법은 유지해야 하는 데이터를 저장하는 임시 테이블을 사용하는 것입니다. 다음 SQL 쿼리 문을 사용할 수 있습니다.
CREATE TABLE temp_employee AS SELECT DISTINCT emp_id, first_name, last_name, dept_id FROM employee;
이 문은 직원 테이블에서 고유한 emp_id, first_name, last_name 및 dept_id를 선택하여 temp_employee라는 새 테이블에 삽입합니다.
이제 다음 SQL 문을 사용하여 직원 테이블에서 모든 행을 삭제하고 temp_employee 테이블의 행을 다시 직원 테이블로 이동할 수 있습니다.
DELETE FROM employee; INSERT INTO employee(emp_id, first_name, last_name, dept_id) SELECT emp_id, first_name, last_name, dept_id FROM temp_employee;
이렇게 하면 직원 테이블에서 모든 행이 삭제되고 직원 테이블에서 행이 이동됩니다. temp_employee 테이블 직원 테이블에 삽입합니다. 이제 모든 중복 기록을 제거하고 각 직원에 대해 하나의 행을 유지했습니다.
방법 3: CTE 및 ROW_NUMBER 함수 사용
이것은 ROW_NUMBER 함수를 사용하는 또 다른 방법이지만 공통 표현식(CTE)을 사용합니다. 다음 SQL 쿼리 문을 사용하여 중복 데이터를 제거할 수 있습니다.
WITH emp AS( SELECT emp_id, first_name, last_name, dept_id, ROW_NUMBER() OVER(PARTITION BY first_name, last_name, dept_id ORDER BY emp_id) rn FROM employee ) DELETE FROM emp WHERE rn > 1;
이 문은 삭제해야 하는 모든 레코드를 포함하고 각 그룹의 첫 번째 레코드를 식별하는 일반 표현식 emp를 사용합니다. 그런 다음 DELETE 문을 사용하여 모든 그룹의 나머지 행을 삭제합니다.
결론
오라클 데이터베이스에서는 중복된 데이터를 제거하는 것이 매우 중요합니다. 중복된 데이터는 데이터베이스 성능에 영향을 미치고, 저장 공간을 낭비하며, 부정확한 쿼리 결과로 이어집니다. 이 문서에서는 하위 쿼리 및 그룹화 사용, 임시 테이블 사용, CTE 및 ROW_NUMBER 함수 사용 등 중복 데이터를 제거하는 여러 가지 방법을 설명합니다. 어떤 방법을 선택하든 만일의 경우를 대비해 기록을 삭제하기 전에 반드시 데이터를 백업하세요.
위 내용은 오라클 데이터 중복 제거의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











이 기사에서는 행 별 데이터 처리를위한 PL/SQL 커서를 설명합니다. Cursor 선언, 개방, 가져 오기 및 폐쇄, 암시 적, 명시 적 및 참조 커서를 비교합니다. 효율적인 대형 데이터 세트 처리 및 루프 사용 기술

이 기사에서는 Oracle 데이터베이스 세그먼트 유형 (데이터, 인덱스, 롤백, 임시), 성능 영향 및 관리를 검토합니다. 최적의 효율성을위한 워크로드 및 데이터 특성을 기반으로 적절한 세그먼트 유형을 선택하는 것을 강조합니다.

이 기사는 Oracle 데이터베이스 성능 테스트 도구를 살펴 봅니다. 예산, 복잡성 및 모니터링, 진단, 워크로드 시뮬레이션 및보고와 같은 기능을 기반으로 올바른 도구 선택에 대해 논의합니다. 이 기사는 또한 효과적인 BO에 대해 자세히 설명합니다

이 기사는 Oracle 데이터베이스를 다운로드하여 사용자를 안내합니다. 에디션 선택 (Express, Standard, Enterprise), 플랫폼 호환성 및 라이센스 계약 수락을 강조하는 프로세스를 자세히 설명합니다. 시스템 요구 사항 및 에디션 Suitabil

이 기사는 SQL 명령을 사용하여 Oracle에서 사용자 및 역할을 만드는 방법을 설명하고 최소 특권의 원칙 및 정기 감사에 따라 역할 사용을 포함하여 사용자 권한을 관리하는 모범 사례에 대해 설명합니다.

이 기사는 전체 서버 설치없이 Oracle 데이터베이스와 상호 작용하는 데 필수적인 Oracle Database 클라이언트 도구를 살펴 봅니다. SQL*Plus, SQL Developer, Enterprise Manager 및 RMAN과 같은 일반적으로 사용되는 도구에 대해 자세히 설명합니다.

이 기사에서는 Oracle의 기본 테이블 스페이스 (시스템, sysaux, 사용자), 특성, 식별 방법 및 성능 영향을 검토합니다. 그것은 불이행에 의존하는 것에 반대하고, 별도의 테이블 스팩을 만드는 것의 중요성을 강조합니다.

이 기사는 민감한 데이터를 보호하기위한 솔루션 인 Oracle Data Masking 및 Subsetting (DMS)에 대해 자세히 설명합니다. 민감한 데이터 식별, 마스킹 규칙 정의 (셔플 링, 대체, 무작위), 작업 설정, 모니터링 및 배포가 포함됩니다.
