ホームページ > データベース > mysql チュートリアル > [MySQLHelp]答朋友问:5000W记录的Innodb表如何快速的去重复数据_MySQL

[MySQLHelp]答朋友问:5000W记录的Innodb表如何快速的去重复数据_MySQL

WBOY
リリース: 2016-06-01 13:18:56
オリジナル
1433 人が閲覧しました

bitsCN.com

<strong>朋友问: </strong>
ログイン後にコピー
5000万数据的一张表,怎么去重快,根据两个字段判断是否重复。
ログイン後にコピー
<strong>回复之:</strong>
ログイン後にコピー
把2个字段以及主键id select 出来建立一张临时表t1,
ログイン後にコピー
t1建立好主键索引以及2个对比的字段联合索引。
ログイン後にコピー
然后在临时表里面 比对重复的记录,
ログイン後にコピー
把重复的记录录入第二张临时表t2,t2表结构和t1一模一样。
ログイン後にコピー
然后根据你的业务来决定如何处理t2表里面的重复记录,用t2关联原来的5000W记录的表来进行处理,
ログイン後にコピー
大概通常的是group by2个字段,取出主键id较大的值的记录删除掉。
ログイン後にコピー
bitsCN.com

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート