Alih keluar baris pendua daripada jadual kecil dengan lajur unik
Dalam pangkalan data PostgreSQL, menghapuskan baris pendua boleh meningkatkan integriti data dan mengoptimumkan prestasi. Katakan anda mempunyai jadual yang mengandungi baris tanpa kekangan dan data pendua, khususnya dalam lajur tertentu yang dipanggil "kunci". Matlamatnya adalah untuk mengalih keluar pendua dan menyimpan satu contoh bagi setiap nilai "kunci" unik.
Penyelesaian arahan SQL tunggal
Untuk melakukan ini dengan satu arahan SQL, anda boleh menggunakan langkah berikut:
1 Kenal pasti kejadian berulang pertama: Pertama, kita perlu mengenal pasti kejadian pertama setiap baris berulang. Maklumat ini penting untuk mengekalkan satu salinan data.
<code class="language-sql">SELECT MIN(ctid) AS ctid, key FROM dups GROUP BY key HAVING COUNT(*) > 1;</code>
2. Padamkan kejadian bukan pertama: Setelah kejadian pertama dikenal pasti, kami boleh mengalih keluar semua pendua berikutnya berdasarkan nilai "ctid" mereka. Lajur "ctid" mewakili lokasi fizikal baris dalam jadual.
<code class="language-sql">DELETE FROM dups a USING ( SELECT MIN(ctid) AS ctid, key FROM dups GROUP BY key HAVING COUNT(*) > 1 ) b WHERE a.key = b.key AND a.ctid <> b.ctid;</code>
Pertimbangkan susunan talian
Walaupun kaedah ini berkesan mengalih keluar pendua, ia tidak memastikan baris mana yang dikekalkan sekiranya berlaku berbilang kejadian. Jika terdapat kriteria khusus untuk memilih baris untuk disimpan, ia harus dimasukkan ke dalam pertanyaan.
Contoh:
Untuk pemahaman yang lebih baik, pertimbangkan contoh berikut:
<code class="language-sql">CREATE TABLE people ( name VARCHAR(50) NOT NULL, surname VARCHAR(50) NOT NULL, age INTEGER NOT NULL ); INSERT INTO people (name, surname, age) VALUES ('A.', 'Tom', 30), ('A.', 'Tom', 10), ('B.', 'Tom', 20), ('B', 'Chris', 20); -- 显示重复项的第一次出现: SELECT MIN(ctid) AS ctid, name, surname FROM people GROUP BY (name, surname) HAVING COUNT(*) > 1; -- 删除重复项的非第一次出现: DELETE FROM people a USING ( SELECT MIN(ctid) AS ctid, name, surname FROM people GROUP BY (name, surname) HAVING COUNT(*) > 1 ) b WHERE a.name = b.name AND a.surname = b.surname AND a.ctid <> b.ctid; SELECT * FROM people;</code>
Jadual contoh ini mengandungi data peribadi yang berpotensi menjadi pendua. Selepas melaksanakan pertanyaan kedua, pendua akan dialih keluar dan hanya nama pertama dan nama keluarga yang unik kekal dalam jadual.
Atas ialah kandungan terperinci Bagaimana untuk Memadam Baris Pendua dari Jadual PostgreSQL Semasa Memelihara Lajur Unik?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!