sharding - 数据库分库切表后Java后端代码实现以及最佳实践

Question

现在业务中由于一些表越来越大，read的时候压力很大（write的需求比较小），所以在数据库端决定把一些数据量特别大的表切表， 但是在后端代码中有很多代码／query需要做join这些表，请问这样的情况下大家是怎么样...

大家讲道理 · Answer

可以考虑引入数据库中间件
sharding-jdbc client级别
mycat-server server级别

世界只因有你 · Answer

朋友介绍 Spark 不错，支持 SQl 式的查询，1 亿条数据 0.5 秒左右返回结果

ringa_lee · Answer

只针对目前我们项目中的情况：在分表时根据hash算法落到特定表，然后取的时候先根据算法获取数据的分布位置，然后就是正常的select了

漂亮男人 · Answer

不建议连表查询
1.数据库资源比较宝贵，连表查询会占用大量的内存，导致数据库性能下降
2.不支持数据在多个数据库实例，分库情况无法处理，扩展性较差

通用做法是将连表查询，查分成多个单表查询，然后将结果在应用中汇总。
1.能够上述连表查询的问题
2.多次查询也可以在程序中对每一次查询的中间结果做处理，这是一个灵活性。
3.应用也可以随时扩展，更加灵活

如果是离线场景，建议使用MR(mapreduce)框架来处理，例如：hadoop等，相应的，需要将数据写入到hdfs上。

欧阳克 · Answer

http://blog.csdn.net/tianyale...
详解分库分表