Änderungsdatenerfassung: Überblick, Warum und Best Practices
Heutige Unternehmen, insbesondere solche, die der digitalen Transformation Priorität einräumen, benötigen dringend Echtzeitdaten. Die herkömmliche wöchentliche und monatliche Stapelverarbeitung kann die Nachfrage nicht mehr decken. Es ist jedoch nicht einfach, Echtzeitdaten aus mehreren Quellen zu erhalten und diese zur Automatisierung von Prozessen und zur dynamischen Optimierung von Entscheidungen zu nutzen.
Kürzlich standen wir vor der Herausforderung, das Altsystem eines Kunden neu zu gestalten und die monolithische Architektur in Microservices aufzuteilen. Wir haben begonnen, Änderungen an der Datenbank vorzunehmen und das System modulweise zu modernisieren. In dieser Phase müssen wir sicherstellen, dass beide Datenbanken synchron bleiben, da verschiedene Module möglicherweise dieselben Daten benötigen – mit anderen Worten: Das alte System benötigt Daten, die vom neuen System in der neuen Datenbank generiert wurden, und umgekehrt.
Wir haben die Change Data Capture (CDC)-Technologie untersucht, um festzustellen, ob sie unseren Anforderungen entspricht. Der Artikel beschreibt detailliert die Definition von CDC, die von uns getesteten Tools, ihre Funktionsweise und ihre Vorteile. Gleichzeitig haben wir einige Fälle und Vorschläge geteilt, um anderen Technikern bei der Auswahl der geeigneten CDC-Tools in bestimmten Situationen zu helfen.
Was ist Change Data Capture?
Datenerfassung ist der Prozess der Erkennung und Erfassung von Änderungen im Quellsystem und der anschließenden Übermittlung dieser Änderungen an das Zielsystem nahezu in Echtzeit. Zu diesen Änderungen können Einfüge-, Lösch- und Aktualisierungsvorgänge sowie DDL-Änderungen an der Datenbankstruktur gehören.
Wie Change Data Capture-Tools funktionieren
CDC-Tools implementieren ihre Funktionalität, indem sie Datenänderungen in Quellsystemen überwachen. Sobald eine Änderung entdeckt wird, erfasst das CDC-Tool sie und zeichnet sie an einem bestimmten Ort auf, beispielsweise in einer Datenbank oder einer Protokolldatei. Die verarbeiteten und transformierten Daten werden dann in ein Zielsystem geladen, beispielsweise ein Data Warehouse oder eine Analyseplattform.
Es gibt mehrere Möglichkeiten, Datenbankänderungen zu erfassen. Schauen wir uns einige davon an:
1. Zeitstempel-/abfragebasiert
Bei dieser Methode verwalten wir einige Prüfspalten ähnlich CREATED_AT, LAST_UPDATED oder DATE_MODIFIED in der Quelle und erkennen Änderungen in diesen Spalten, indem wir die Daten in der Quelle abfragen, um etwaige Datenänderungen zu erfassen. Es ist zu beachten, dass diese Methode keine Löschvorgänge aufzeichnet.
2. Auslöserbasiert
Ein Trigger ist eine Funktion in der Datenbank, die eine Aktion basierend auf einem bestimmten Ereignis ausführt. Obwohl es zum Erfassen von Änderungen, einschließlich Löschvorgängen, nützlich ist, verringert es die Datenbankleistung, da jedes Ereignis mehrere Schreibvorgänge erfordert.
3. Protokollbasiert
Die Datenbank enthält Transaktionsprotokolle zur Wiederherstellung im Falle eines Absturzes und speichert alle Ereignisse. Beim protokollbasierten CDC werden neue Datenbanktransaktionen direkt aus dem nativen Protokoll gelesen, was die Erfassung von Änderungen ohne Scannen der Quelltabelle ermöglicht und daher effizienter ist.
Dieser Ansatz ähnelt dem Event Sourcing in der ereignisgesteuerten Architektur. Immer wenn sich der Systemstatus ändert, zeichnen wir dies als Ereignis auf. Die aufgezeichneten Ereignisse können in der gleichen Reihenfolge wiedergegeben werden, um jederzeit den Systemzustand zu rekonstruieren.
Warum CDC verwenden?
CDC ist in vielen Szenarien je nach Situation, Anwendung, Architektur und Geschäftsanforderungen von entscheidender Bedeutung. Hier sind einige Möglichkeiten, wie das CDC beim Engineering-Prozess hilft:
- Datenverfügbarkeit in Echtzeit: CDC-Tools erfassen Änderungen nahezu in Echtzeit und stellen so sicher, dass die neuesten Daten für Analysen, Berichte oder weitere Verarbeitung verfügbar sind.
- Schnellere Entscheidungsfindung: CDC trägt dazu bei, Verzögerungen zwischen Erfassung und Datenverfügbarkeit zu reduzieren und ermöglicht so eine schnellere Analyse und Entscheidungsfindung.
- Effiziente Datenintegration: CDC-Tools helfen dabei, Daten aus mehreren Betriebsquellen zu erfassen und in ein gemeinsames Format in einer einzigen Zieldatenbank oder einem einzigen Datensee zu konvertieren.
- Maßgeschneidertes Design der Zieldatenbank: CDC bietet funktionsübergreifende Vorteile, z. B. die Erstellung schreibgeschützter Such- oder Abfragedatenbanken in CQRS-Systemen, die Erstellung von Prüfdatenbanken oder die Erfassung von Daten in Data Warehouses. Es ermöglicht die Entkopplung nichtfunktionaler und architektonischer Anforderungen vom primären Datenspeicher.
- Vereinfachte Datenmigration: In unserem Fall hilft CDC dabei, die Datenkonsistenz zwischen alten und neuen Datenbanken während der Modernisierungsphase aufrechtzuerhalten. Dies gilt auch für verschiedene andere Datenmigrationsszenarien.
Wie wählt man das richtige CDC-Tool aus?
Es gibt mehrere CDC-Tools auf dem Markt, wie zum Beispiel Oracle Golden Gate, Debezium, IBM Infosphere, Striim, StreamSets und Qlik Replicate. Diese Tools können Open Source oder kostenpflichtig sein. Sie unterstützen typischerweise lokale und Cloud-Umgebungen und können eine Vielzahl von Datenquellen verarbeiten. Berücksichtigen Sie bei der Auswahl Folgendes:
- Kompatibilität mit Datenquellen: Das von Ihnen gewählte Tool muss mindestens mit allen Datenquellen kompatibel sein, an denen Sie Änderungen erfassen möchten.
- Datenerfassung in Echtzeit: Tools sollten Änderungen nahezu in Echtzeit erfassen, damit Sie mit den neuesten Daten arbeiten können.
- Datenkonvertierung und -integration: CDC-Tools sollten in der Lage sein, die Datenkonvertierung von Quell- in Zieldatentypen durchzuführen.
- Preis: CDC-Tools müssen für Ihren Anwendungsfall kostengünstig sein. Es stehen Open-Source-, kostenpflichtige und lizenzierte Produkte zur Verfügung.
- Benutzerfreundlichkeit und Support: Das Tool sollte für Ihr Team einfach zu bedienen sein und angemessenen Support bieten, einschließlich umfassender Dokumentation und technischem Support.
- Weitere Funktionen: Abhängig von Ihren Anforderungen möchten Sie möglicherweise auch andere spezifische Funktionen ausprobieren, z. B. die bidirektionale Synchronisierung zwischen Quelle und Ziel sowie Cloud-Unterstützung.
Da Unternehmen immer technologieorientierter werden, werden historische und aktuelle Daten zu einem entscheidenden Unterscheidungsmerkmal. Die Erzielung einer genauen, zeitnahen, effizienten und kostengünstigen Erfassung von Änderungsdaten wird ein wichtiger Bestandteil jedes Technologietransformationsprogramms sein. Wenn Sie mit dieser Situation konfrontiert sind, hoffe ich, dass dieser Artikel Ihnen helfen kann.
Das obige ist der detaillierte Inhalt vonÄnderungsdatenerfassung: Überblick, Warum und Best Practices. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

DDREASE ist ein Tool zum Wiederherstellen von Daten von Datei- oder Blockgeräten wie Festplatten, SSDs, RAM-Disks, CDs, DVDs und USB-Speichergeräten. Es kopiert Daten von einem Blockgerät auf ein anderes, wobei beschädigte Blöcke zurückbleiben und nur gute Blöcke verschoben werden. ddreasue ist ein leistungsstarkes Wiederherstellungstool, das vollständig automatisiert ist, da es während der Wiederherstellungsvorgänge keine Unterbrechungen erfordert. Darüber hinaus kann es dank der ddasue-Map-Datei jederzeit gestoppt und fortgesetzt werden. Weitere wichtige Funktionen von DDREASE sind: Es überschreibt die wiederhergestellten Daten nicht, füllt aber die Lücken im Falle einer iterativen Wiederherstellung. Es kann jedoch gekürzt werden, wenn das Tool explizit dazu aufgefordert wird. Stellen Sie Daten aus mehreren Dateien oder Blöcken in einer einzigen wieder her

0.Was bewirkt dieser Artikel? Wir schlagen DepthFM vor: ein vielseitiges und schnelles generatives monokulares Tiefenschätzungsmodell auf dem neuesten Stand der Technik. Zusätzlich zu herkömmlichen Tiefenschätzungsaufgaben demonstriert DepthFM auch hochmoderne Fähigkeiten bei nachgelagerten Aufgaben wie dem Tiefen-Inpainting. DepthFM ist effizient und kann Tiefenkarten innerhalb weniger Inferenzschritte synthetisieren. Lassen Sie uns diese Arbeit gemeinsam lesen ~ 1. Titel der Papierinformationen: DepthFM: FastMonocularDepthEstimationwithFlowMatching Autor: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Die von Google geförderte Leistung von JAX hat in jüngsten Benchmark-Tests die von Pytorch und TensorFlow übertroffen und belegt bei 7 Indikatoren den ersten Platz. Und der Test wurde nicht auf der TPU mit der besten JAX-Leistung durchgeführt. Obwohl unter Entwicklern Pytorch immer noch beliebter ist als Tensorflow. Aber in Zukunft werden möglicherweise mehr große Modelle auf Basis der JAX-Plattform trainiert und ausgeführt. Modelle Kürzlich hat das Keras-Team drei Backends (TensorFlow, JAX, PyTorch) mit der nativen PyTorch-Implementierung und Keras2 mit TensorFlow verglichen. Zunächst wählen sie eine Reihe von Mainstream-Inhalten aus

Stehen Sie vor einer Verzögerung oder einer langsamen mobilen Datenverbindung auf dem iPhone? Normalerweise hängt die Stärke des Mobilfunk-Internets auf Ihrem Telefon von mehreren Faktoren ab, wie z. B. der Region, dem Mobilfunknetztyp, dem Roaming-Typ usw. Es gibt einige Dinge, die Sie tun können, um eine schnellere und zuverlässigere Mobilfunk-Internetverbindung zu erhalten. Fix 1 – Neustart des iPhone erzwingen Manchmal werden durch einen erzwungenen Neustart Ihres Geräts viele Dinge zurückgesetzt, einschließlich der Mobilfunkverbindung. Schritt 1 – Drücken Sie einfach einmal die Lauter-Taste und lassen Sie sie los. Drücken Sie anschließend die Leiser-Taste und lassen Sie sie wieder los. Schritt 2 – Der nächste Teil des Prozesses besteht darin, die Taste auf der rechten Seite gedrückt zu halten. Lassen Sie das iPhone den Neustart abschließen. Aktivieren Sie Mobilfunkdaten und überprüfen Sie die Netzwerkgeschwindigkeit. Überprüfen Sie es erneut. Fix 2 – Datenmodus ändern 5G bietet zwar bessere Netzwerkgeschwindigkeiten, funktioniert jedoch besser, wenn das Signal schwächer ist

Ich weine zu Tode. Die Daten im Internet reichen überhaupt nicht aus. Das Trainingsmodell sieht aus wie „Die Tribute von Panem“, und KI-Forscher auf der ganzen Welt machen sich Gedanken darüber, wie sie diese datenhungrigen Esser ernähren sollen. Dieses Problem tritt insbesondere bei multimodalen Aufgaben auf. Zu einer Zeit, als sie ratlos waren, nutzte ein Start-up-Team der Abteilung der Renmin-Universität von China sein eigenes neues Modell, um als erstes in China einen „modellgenerierten Datenfeed selbst“ in die Realität umzusetzen. Darüber hinaus handelt es sich um einen zweigleisigen Ansatz auf der Verständnisseite und der Generierungsseite. Beide Seiten können hochwertige, multimodale neue Daten generieren und Datenrückmeldungen an das Modell selbst liefern. Was ist ein Modell? Awaker 1.0, ein großes multimodales Modell, das gerade im Zhongguancun-Forum erschienen ist. Wer ist das Team? Sophon-Motor. Gegründet von Gao Yizhao, einem Doktoranden an der Hillhouse School of Artificial Intelligence der Renmin University.

Das neueste Video von Teslas Roboter Optimus ist veröffentlicht und er kann bereits in der Fabrik arbeiten. Bei normaler Geschwindigkeit sortiert es Batterien (Teslas 4680-Batterien) so: Der Beamte hat auch veröffentlicht, wie es bei 20-facher Geschwindigkeit aussieht – auf einer kleinen „Workstation“, pflücken und pflücken und pflücken: Dieses Mal wird es freigegeben. Eines der Highlights Der Vorteil des Videos besteht darin, dass Optimus diese Arbeit in der Fabrik völlig autonom und ohne menschliches Eingreifen während des gesamten Prozesses erledigt. Und aus Sicht von Optimus kann es auch die krumme Batterie aufnehmen und platzieren, wobei der Schwerpunkt auf der automatischen Fehlerkorrektur liegt: In Bezug auf die Hand von Optimus gab der NVIDIA-Wissenschaftler Jim Fan eine hohe Bewertung ab: Die Hand von Optimus ist der fünffingrige Roboter der Welt am geschicktesten. Seine Hände sind nicht nur taktil

Diese Woche gab FigureAI, ein Robotikunternehmen, an dem OpenAI, Microsoft, Bezos und Nvidia beteiligt sind, bekannt, dass es fast 700 Millionen US-Dollar an Finanzmitteln erhalten hat und plant, im nächsten Jahr einen humanoiden Roboter zu entwickeln, der selbstständig gehen kann. Und Teslas Optimus Prime hat immer wieder gute Nachrichten erhalten. Niemand zweifelt daran, dass dieses Jahr das Jahr sein wird, in dem humanoide Roboter explodieren. SanctuaryAI, ein in Kanada ansässiges Robotikunternehmen, hat kürzlich einen neuen humanoiden Roboter auf den Markt gebracht: Phoenix. Beamte behaupten, dass es viele Aufgaben autonom und mit der gleichen Geschwindigkeit wie Menschen erledigen kann. Pheonix, der weltweit erste Roboter, der Aufgaben autonom in menschlicher Geschwindigkeit erledigen kann, kann jedes Objekt sanft greifen, bewegen und elegant auf der linken und rechten Seite platzieren. Es kann Objekte autonom identifizieren

Neues SOTA für multimodale Dokumentverständnisfunktionen! Das Alibaba mPLUG-Team hat die neueste Open-Source-Arbeit mPLUG-DocOwl1.5 veröffentlicht, die eine Reihe von Lösungen zur Bewältigung der vier großen Herausforderungen der hochauflösenden Bildtexterkennung, des allgemeinen Verständnisses der Dokumentstruktur, der Befolgung von Anweisungen und der Einführung externen Wissens vorschlägt. Schauen wir uns ohne weitere Umschweife zunächst die Auswirkungen an. Ein-Klick-Erkennung und Konvertierung von Diagrammen mit komplexen Strukturen in das Markdown-Format: Es stehen Diagramme verschiedener Stile zur Verfügung: Auch eine detailliertere Texterkennung und -positionierung ist einfach zu handhaben: Auch ausführliche Erläuterungen zum Dokumentverständnis können gegeben werden: Sie wissen schon, „Document Understanding“. " ist derzeit ein wichtiges Szenario für die Implementierung großer Sprachmodelle. Es gibt viele Produkte auf dem Markt, die das Lesen von Dokumenten unterstützen. Einige von ihnen verwenden hauptsächlich OCR-Systeme zur Texterkennung und arbeiten mit LLM zur Textverarbeitung zusammen.
