Mysql批量插入数据之前如何判断重复？

Question

使用MySQL做统计，需要查询大量数据计算后重新组装各种数据入库，考虑到大数据量和性能问题，要批量插入数据库，而且可能会出现重复的情况，如何判断重复呢？ 如果在入库前判断重复，需要每条数据都select一下判...

怪我咯 · Answer

可以试试 replace into 或者 Insert into ..... on duplicate key update

参考：
http://blog.csdn.net/mchdba/article/details/8647560
http://dev.mysql.com/doc/refman/5.7/en/insert-on-duplicate.html

PHP中文网 · Answer

批量入库的时候建议使用mysql导入工具——mysqlimport，可以设置忽略重复数据。
http://www.runoob.com/mysql/mysql-database-import.html

高洛峰 · Answer

我觉得你先插入再删掉的方法不错。
你说的重复是“主键重复”的数据吧？那么你要插入的必定是最新的数据。我会先删旧数据，假设主键是'uid'，先开事务，再'delete ... where uid in (...)'，然后插入新数据，提交关事务。
如果还想优化，用'select ...where uid in ()' 一次查出已经有的数据，然后不插入那些重复数据。

迷茫 · Answer

建个临时表全插入再insert

迷茫 · Answer

@好雨云他说的replace into 或者 Insert into ..... on duplicate key update算是一种解决方案。

不过建议使用Insert into ..... on duplicate key update

当你数据量大的时候，效率是比replace高的，究其原因是因为replace插入数据时候需要额外维护主键索引。

Php8, saya datang juga

Ketahui reka letak tapak web dalam masa 30 minit

Tutorial Video Permulaan Shangguan Oracle kepada Mahir

Baris pertama kod UNI-APP anda

Berkibar dari awal ke pelancaran apl

Tutorial Video Linux Baharu Brother Lian

Tutorial Video AXURE 9 (Sesuai untuk UI Reka Bentuk Produk Interaktif Pengurus Produk)

Tutorial Video PS Kemahiran Asas Sifar

Tutorial video UI 16 hari untuk anda bermula

Tutorial Video Teknik PS dan Teknik Menghiris

Tutorial Video Pembinaan Persekitaran Awan Alibaba dan Pelancaran Projek

Gambaran Keseluruhan Rangkaian Komputer - Pengetahuan Asas yang Perlu Dikuasai Pengaturcara

Tutorial Penting untuk Pengaturcara - Penjelasan Protokol HTTP

Tutorial Video Websocket