Sharding - Implémentation du code backend Java et meilleures pratiques après le partitionnement de la base de données et la découpe des tables

Question

Maintenant dans le métier, certaines tables deviennent de plus en plus grandes, et la pression est très forte lors de la lecture (la demande d'écriture est relativement faible), donc côté base de données, nous avons décidé de découper certaines tables contenant des quantités de données particulièrement importantes en tables Cependant, il y a beaucoup de codes dans le code back-end. /Query doit rejoindre ces tables. Que faites-vous dans cette situation...

大家讲道理 · Answer

Vous pouvez envisager d'introduire un middleware de base de données
au niveau client sharding-jdbc
au niveau du serveur mycat-server

世界只因有你 · Answer

Un ami m'a recommandé Spark, qui prend en charge les requêtes de style SQL et renvoie les résultats en 0,5 seconde environ pour 100 millions de données

ringa_lee · Answer

Uniquement pour la situation actuelle de notre projet : lors de la division des tables, elle tombe sur une table spécifique selon l'algorithme de hachage, puis lors de la récupération, obtenez d'abord la position de distribution des données selon l'algorithme, puis la sélection normale est terminé

漂亮男人 · Answer

La requête de jointure de table n'est pas recommandée
1. Les ressources de la base de données sont relativement précieuses et la requête de jointure de table occupera beaucoup de mémoire, ce qui entraînera une réduction des performances de la base de données
2 Les données ne sont pas prises en charge dans plusieurs instances de base de données et la situation de sous-base de données. la base de données ne peut pas être gérée et l'évolutivité est médiocre

L'approche courante consiste à diviser la requête de jointure de table en plusieurs requêtes de table unique, puis à résumer les résultats dans l'application.
1. Capable de résoudre les problèmes ci-dessus de jointure de requêtes de table
2 Pour les requêtes multiples, les résultats intermédiaires de chaque requête peuvent également être traités dans le programme, ce qui est une flexibilité.
3. L'application peut également être étendue à tout moment, la rendant plus flexible

S'il s'agit d'un scénario hors ligne, il est recommandé d'utiliser le framework MR (mapreduce) pour le gérer, tel que hadoop, etc. En conséquence, les données doivent être écrites sur HDFS.

欧阳克 · Answer

http://blog.csdn.net/tianyale...
Explication détaillée de la sous-base de données et de la table