Rumah > pangkalan data > tutorial mysql > Bagaimana untuk Memadam Baris Pendua dari Jadual PostgreSQL Semasa Memelihara Lajur Unik?

Bagaimana untuk Memadam Baris Pendua dari Jadual PostgreSQL Semasa Memelihara Lajur Unik?

Mary-Kate Olsen
Lepaskan: 2025-01-19 02:43:10
asal
113 orang telah melayarinya

How to Delete Duplicate Rows from a PostgreSQL Table While Preserving a Unique Column?

Alih keluar baris pendua daripada jadual kecil dengan lajur unik

Dalam pangkalan data PostgreSQL, menghapuskan baris pendua boleh meningkatkan integriti data dan mengoptimumkan prestasi. Katakan anda mempunyai jadual yang mengandungi baris tanpa kekangan dan data pendua, khususnya dalam lajur tertentu yang dipanggil "kunci". Matlamatnya adalah untuk mengalih keluar pendua dan menyimpan satu contoh bagi setiap nilai "kunci" unik.

Penyelesaian arahan SQL tunggal

Untuk melakukan ini dengan satu arahan SQL, anda boleh menggunakan langkah berikut:

1 Kenal pasti kejadian berulang pertama: Pertama, kita perlu mengenal pasti kejadian pertama setiap baris berulang. Maklumat ini penting untuk mengekalkan satu salinan data.

<code class="language-sql">SELECT MIN(ctid) AS ctid, key
FROM dups
GROUP BY key HAVING COUNT(*) > 1;</code>
Salin selepas log masuk

2. Padamkan kejadian bukan pertama: Setelah kejadian pertama dikenal pasti, kami boleh mengalih keluar semua pendua berikutnya berdasarkan nilai "ctid" mereka. Lajur "ctid" mewakili lokasi fizikal baris dalam jadual.

<code class="language-sql">DELETE FROM dups a USING (
    SELECT MIN(ctid) AS ctid, key
    FROM dups
    GROUP BY key HAVING COUNT(*) > 1
) b
WHERE a.key = b.key
AND a.ctid <> b.ctid;</code>
Salin selepas log masuk

Pertimbangkan susunan talian

Walaupun kaedah ini berkesan mengalih keluar pendua, ia tidak memastikan baris mana yang dikekalkan sekiranya berlaku berbilang kejadian. Jika terdapat kriteria khusus untuk memilih baris untuk disimpan, ia harus dimasukkan ke dalam pertanyaan.

Contoh:

Untuk pemahaman yang lebih baik, pertimbangkan contoh berikut:

<code class="language-sql">CREATE TABLE people (
    name    VARCHAR(50) NOT NULL,
    surname VARCHAR(50) NOT NULL,
    age     INTEGER NOT NULL
);

INSERT INTO people (name, surname, age) VALUES
    ('A.', 'Tom', 30),
    ('A.', 'Tom', 10),
    ('B.', 'Tom', 20),
    ('B', 'Chris', 20);

-- 显示重复项的第一次出现:
SELECT MIN(ctid) AS ctid, name, surname
FROM people
GROUP BY (name, surname) HAVING COUNT(*) > 1;

-- 删除重复项的非第一次出现:
DELETE FROM people a USING (
    SELECT MIN(ctid) AS ctid, name, surname
    FROM people
    GROUP BY (name, surname) HAVING COUNT(*) > 1
) b
WHERE a.name = b.name
AND a.surname = b.surname
AND a.ctid <> b.ctid;

SELECT * FROM people;</code>
Salin selepas log masuk

Jadual contoh ini mengandungi data peribadi yang berpotensi menjadi pendua. Selepas melaksanakan pertanyaan kedua, pendua akan dialih keluar dan hanya nama pertama dan nama keluarga yang unik kekal dalam jadual.

Atas ialah kandungan terperinci Bagaimana untuk Memadam Baris Pendua dari Jadual PostgreSQL Semasa Memelihara Lajur Unik?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan