Rumah > pangkalan data > tutorial mysql > [MySQLHelp]答朋友问:5000W记录的Innodb表如何快速的去重复数据_MySQL

[MySQLHelp]答朋友问:5000W记录的Innodb表如何快速的去重复数据_MySQL

WBOY
Lepaskan: 2016-06-01 13:18:56
asal
1433 orang telah melayarinya

bitsCN.com

<strong>朋友问: </strong>
Salin selepas log masuk
5000万数据的一张表,怎么去重快,根据两个字段判断是否重复。
Salin selepas log masuk
<strong>回复之:</strong>
Salin selepas log masuk
把2个字段以及主键id select 出来建立一张临时表t1,
Salin selepas log masuk
t1建立好主键索引以及2个对比的字段联合索引。
Salin selepas log masuk
然后在临时表里面 比对重复的记录,
Salin selepas log masuk
把重复的记录录入第二张临时表t2,t2表结构和t1一模一样。
Salin selepas log masuk
然后根据你的业务来决定如何处理t2表里面的重复记录,用t2关联原来的5000W记录的表来进行处理,
Salin selepas log masuk
大概通常的是group by2个字段,取出主键id较大的值的记录删除掉。
Salin selepas log masuk
bitsCN.com

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan