数据库中的一个字段已经存在相同的值,想给这个字段建立一个唯一索引,并删除多余的数据,于是建立索引时设置了dropDups 为true,但还是报错重复key,是怎么回事呀?或者有什么方法能快速删除多余的数据呢?
业精于勤,荒于嬉;行成于思,毁于随。
Python スクリプトを通じて重複を削除できます
アイデアは非常にシンプルで、トラバースして辞書に保存し、2回目に見つかったら削除します。 ただし、この方法では、削除されたオブジェクトと保持されたオブジェクトを制御することはできません。シナリオに応じてスクリプトを調整できます
私もこの状況に遭遇しました。解決方法がわかりません。
データが 100,000 個を超える場合、スクリプトを使用して高速に処理できますか?同時実行が多い場合、スクリプトはどのように処理しますか?
mongoDB3.0 は、dropDups パラメータを廃止し、今後これによって重複データを削除できなくなります。
http://blog.chinaunix.net/xmlrpc.php?r=blog/article&id=4865696&uid=15795819
Python スクリプトを通じて重複を削除できます
リーリーアイデアは非常にシンプルで、トラバースして辞書に保存し、2回目に見つかったら削除します。
ただし、この方法では、削除されたオブジェクトと保持されたオブジェクトを制御することはできません。シナリオに応じてスクリプトを調整できます
私もこの状況に遭遇しました。解決方法がわかりません。
データが 100,000 個を超える場合、スクリプトを使用して高速に処理できますか?同時実行が多い場合、スクリプトはどのように処理しますか?
mongoDB3.0 は、dropDups パラメータを廃止し、今後これによって重複データを削除できなくなります。
http://blog.chinaunix.net/xmlrpc.php?r=blog/article&id=4865696&uid=15795819