Lors de la 49e conférence VLDB, la plus grande conférence internationale sur les bases de données, deux articles de Tencent Cloud TDSQL ont été inclus avec succès dans VLDB 2023, prouvant une fois de plus que les technologies innovantes sont reconnues par la plus grande conférence internationale VLDB
Comme l'une des trois meilleures conférences en Dans le domaine des bases de données, chaque conférence VLDB se concentre sur l'affichage des orientations les plus avancées de la recherche actuelle sur les bases de données et des dernières applications industrielles, attirant la participation de nombreuses entreprises technologiques et instituts de recherche de premier plan au monde. Étant donné que la conférence a des exigences extrêmement élevées en matière d'innovation système, d'exhaustivité, de conception expérimentale, etc., le taux d'acceptation des articles de la conférence VLDB est généralement faible (environ 18 %).
Parmi les articles sélectionnés, la solution "Efficient Black-box Checking of Snapshot Isolation in Databases" développée conjointement par Tencent Cloud, l'Université de Nanjing et l'ETH Zurich propose un nouveau vérificateur de boîte noire - PolySI, qui peut vérifier efficacement l'isolation des instantanés (SI ) et fournissez des contre-exemples compréhensibles lorsque des violations sont détectées.
L'isolation Snapshot est un niveau d'isolation faible courant, qui évite la perte de performances causée par la sérialisation et peut prévenir de nombreuses anomalies de données courantes. Cependant, certaines bases de données cloud de production qui prétendent fournir des garanties d’isolation des instantanés généreront toujours des anomalies dans les données SI, ce qui aura un impact énorme, notamment dans le domaine financier. Les outils similaires existants dans l'industrie ne prennent pas en charge les tests de niveau d'isolation des instantanés ou sont moins efficaces. Compte tenu de la complexité des systèmes de bases de données et du fait que les informations internes de la base de données sont souvent inaccessibles, le secteur a un besoin urgent d'un vérificateur d'isolation d'instantanés en boîte noire.
Pour résoudre ce problème, nous avons proposé et conçu l'algorithme et les outils "PolySI". La base théorique de PolySI est le théorème de caractérisation SI basé sur les polygraphes généralisés (GP), qui garantit l'exactitude et l'exhaustivité de PolySI. PolySI adopte un solveur SMT (MonoSAT) et exploite le schéma de codage de contraintes compact des GP ainsi que des optimisations spécifiques au domaine pour accélérer la résolution SMT
Actuellement, grâce à une évaluation approfondie, PolySI reproduit avec succès les anomalies SI connues dans trois productions. De nouvelles anomalies SI sont détectées dans le une base de données cloud et des contre-exemples compréhensibles sont fournis. PolySI surpasse les vérificateurs de boîte noire SI de pointe actuels dans plusieurs classes de charges de travail et est capable de s'adapter à des charges de travail à grande échelle.
Selon notre compréhension, l'article « L'évolution des schémas en ligne est (presque) gratuite pour les bases de données instantanées » rédigé conjointement par Tencent Cloud et l'Université Simon Fraser présente une nouvelle méthode d'évolution de schémas en ligne et transactionnelle appelée « Tesseract », visant à résoudre les défis rencontré dans le processus de modification du schéma de la base de données en ligne
Actuellement, les applications de base de données modernes effectuent souvent des modifications de schéma en fonction de l'évolution des besoins. Le principal avantage de la modification du schéma de la base de données en ligne est qu'il n'est pas nécessaire d'arrêter le service de base de données ou d'interrompre les transactions en cours. . Apportez des modifications structurelles qui permettent à la base de données de répondre aux changements dynamiques sans nécessiter de temps d'arrêt pour la maintenance ou le redémarrage de la base de données.
Dans les systèmes de bases de données existants, bien que l'évolution des schémas en ligne et transactionnels (schéma) soit prise en charge, ils sont également confrontés à certains défis. Le premier est la question de la cohérence des données. Lorsque des modifications structurelles sont apportées, afin de garantir la cohérence des données, des transactions ou d'autres mécanismes doivent être utilisés pour garantir l'intégrité et l'exactitude des données. Deuxièmement, il y a le problème du temps d'exécution long. Certaines modifications structurelles peuvent prendre beaucoup de temps, notamment pour les bases de données volumineuses ou les modifications de structures complexes, ce qui peut avoir un certain impact sur les performances de la base de données. Par conséquent, les modifications doivent être apportées dans un délai approprié pour minimiser l'impact sur l'entreprise.
Dans les solutions précédentes, une approche ad hoc pour « corriger » l'évolution du schéma était souvent appliquée au système existant, ce qui entraînait de nombreux cas Edge. et des fonctionnalités incomplètes. Par conséquent, les applications nécessitent souvent des temps d'arrêt soigneusement planifiés pour apporter des modifications au schéma, sacrifiant ainsi la disponibilité
Pour éviter les inconvénients ci-dessus, Tesseract entre en jeu. Dans les systèmes de bases de données multiversions largement utilisés, l'évolution du schéma peut être modélisée sous forme d'opérations de modification des données sur la table entière, ce que l'on appelle la définition des données en tant que modification (DDaM). De cette façon, Tesseract peut prendre en charge le modèle à un coût presque nul en tirant parti du protocole de contrôle de concurrence
Lors des tests d'application Tesseract, nous avons effectué un simple ajustement au protocole d'isolation d'instantané existant. Sous des charges de travail sur des serveurs à 40 cœurs, Tesseract est capable de réaliser une évolution de schéma transactionnel en ligne sans temps d'arrêt et de maintenir des performances d'application élevées pendant le processus d'évolution.
En participant à la principale conférence sur les bases de données VLDB, Tencent Cloud apporte les dernières nouveautés dans le domaine des bases de données. Les avancées technologiques et les orientations de l'innovation sont partagées simultanément avec les développeurs technologiques mondiaux, ce qui fournit également des cas de référence extrêmement précieux pour le développement technologique et industriel dans le domaine des bases de données. À l'avenir, Tencent Cloud continuera d'améliorer les technologies, les produits et les capacités écologiques liés aux bases de données afin de fournir des services de bases de données pratiques et faciles à utiliser pour tous les horizons.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!