碰到一个类似这样的问题,请各位朋友帮助一下。
比如我的mysql数据表如下:
id | key1 | value1 | key2 | value2 | key3 | value3 | key4 | value4 |
1 | 冬 | 0.138 | 南 | 0.513 | 西 | 0.961 | 北 | 0.756 |
2 | 南 | 0.962 | 喜 | 0.258 | 北 | 0.625 | 东 | 0.533 |
3 | 西 | 0.628 | 北 | 0.268 | 东 | 0.156 | 难 | 0.697 |
4 | 杯 | 0.628 | 东 | 0.894 | 南 | 0.625 | 西 | 0.268 |
... | ... | ... | ... | ... | ... | ... | ... | ... |
还有一个黑名单list:list = ['冬', '难', '喜', '杯']
通过SQL update更新数据,若表中某一条记录的key*字段的值在黑名单list中,则将其和其对应的value变为Null(注意只是该key和对应的value,不是整个记录)。
比如上述的例子处理后得到:
id | key1 | value1 | key2 | value2 | key3 | value3 | key4 | value4 |
1 | Null | Null | 南 | 0.513 | 西 | 0.961 | 北 | 0.756 |
2 | 南 | 0.962 | Null | Null | 北 | 0.625 | 东 | 0.533 |
3 | 西 | 0.628 | 北 | 0.268 | 东 | 0.156 | Null | Null |
4 | Null | Null | 东 | 0.894 | 南 | 0.625 | 西 | 0.268 |
... | ... | ... | ... | ... | ... | ... | ... | ... |
那么问题来了:
假如
1.有一百万条记录(id:1 ~ 1,000,000)
2.有十个key-value对(key1,value1 ~ key10,value10)
3.黑名单list有十万个词汇
如何可以快速的更新整个数据表?
我的笨方法是:
...
for key in list:
for i in range(1,11):
sql = "UPDATE table_name SET key1=Null, value1=Null WHERE key%d='%s'" % (i, key)
cursor.execute(sql)
...
但是这个速度很慢,想请问如何能更快速的更新整个数据表?
Give you a link to a similar question I asked before, I hope it can help you
https://segmentfault.com/q/10...
The blacklist data is stored in the database table, such as: table name black_list, field name is name, and create an index on name
Divided into ten sql statements for execution:
update t
set key1 = null, value1 = null
where exists (select 1 from black_list where name = key1);
update t
set key2 = null, value2 = null
where exists (select 1 from black_list where name = key2);
Update to key10, value10 fields by analogy.
1.*
create index idx_key_value_table_key on key_value_table(key1,key2,key3,key4);
2.*
3.*
4.*
5.*