Durch die Verwendung einer Datenbank können Daten effizient und übersichtlich gespeichert werden, sodass Benutzer Daten schneller und bequemer verwalten können. Die Datenbank weist die folgenden Merkmale auf:
1. Sie kann eine große Menge an Dateninformationen strukturiert speichern, um den effektiven Abruf und Zugriff durch Benutzer zu erleichtern.
2. Es kann die Konsistenz und Integrität von Dateninformationen effektiv aufrechterhalten und Datenredundanz reduzieren.
3. Kann die Freigabe- und Sicherheitsanforderungen von Anwendungen erfüllen.
Grundkonzepte der Datenbank:
1. Daten: Symboldatensätze, die Dinge beschreiben, werden zu Daten (Daten), einschließlich Zahlen, Text, Grafiken, Bildern, Tönen, Dateidatensätzen usw., die sind alle Daten. Daten werden in einem einheitlichen Format in Form von „Datensätzen“ gespeichert.
2. Datenbank und Datenbanktabellen: Tabellen werden zum Speichern spezifischer Daten verwendet, und Datenbanken sind Sammlungen von Tabellen. Es handelt sich um eine Sammlung gemeinsamer Daten, die auf bestimmte organisatorische Weise gespeichert werden. Beispielsweise besteht eine relationale Datenbanktabelle aus Datensätzen, Datensätze bestehen aus Feldern und Felder bestehen aus Zeichen oder Zahlen. Es kann von verschiedenen Benutzern mit minimaler Redundanz und hoher Datenunabhängigkeit gemeinsam genutzt werden. Es handelt sich um eine Sammlung zusammengehöriger Daten, die einheitlich verwaltet werden.
Database Management System (DBMS) ist eine Systemsoftware, die eine effektive Organisation, Verwaltung und den Zugriff auf Datenbankressourcen implementiert. Mit der Unterstützung des Betriebssystems unterstützt es verschiedene Vorgänge der Benutzer in der Datenbank. DBMS umfasst hauptsächlich:
1. Datenbankeinrichtungs- und Wartungsfunktion
2. Datendefinitionsfunktion
3. Datenbetriebsfunktion
4. Datenbankfunktion Betrieb Verwaltungsfunktion
5. Kommunikationsfunktion
Datenbanksystem DBS ist ein Mensch-Maschine-System, das im Allgemeinen aus Hardware, Betriebssystem, Datenbank, DBMS und Anwendungen besteht Software- und Datenbankbenutzer (einschließlich Datenbankadministratoren). Benutzer können die Datenbank über DBMS oder über Anwendungen betreiben.
Eine Anwendung ist eine geordnete Sammlung von Befehlen, die mithilfe eines DBMS kompiliert werden, um eine bestimmte Verwaltungs- oder Datenverarbeitungsaufgabe zu lösen. Wenn die Anwendung relativ vollständig ist, eine benutzerfreundliche Mensch-Maschine-Schnittstelle bereitstellen kann und zur Verteilung in eine ausführbare Datei kompiliert wird, sodass normale Benutzer in kurzer Zeit lernen können, sie zu verwenden, ohne über professionelle Computerkenntnisse verfügen zu müssen, dann ist dies der Fall sogenannte Datenbankanwendungssoftware.
Datenbankadministrator DBA ist für Datenbankaktualisierungen und -sicherungen, Datenbanksystemwartung und Benutzerverwaltung usw. verantwortlich, um den normalen Betrieb des Datenbanksystems sicherzustellen. DBA wird im Allgemeinen von Mitarbeitern mit höherem beruflichen Niveau und höherem Dienstalter ausgeübt.
Geschichte der Datenbankentwicklung
Entsprechend der Entwicklung des Datenmodells kann es in drei Phasen unterteilt werden: die erste Generation vernetzter und hierarchischer Datenbanksysteme; Beziehungsdatenbanksystem der zweiten Generation; das Datenbanksystem der dritten Generation mit objektorientiertem Modell als Hauptmerkmal.
In den 1960er Jahren wurden hierarchische Modell- und Netzwerkmodell-Datenbanksysteme durch das 1969 von IBM entwickelte hierarchische Modell-Datenbankverwaltungssystem - IMS (Imformation Management System) und das von der Database Task Group (DBTG) vorgeschlagene Netzwerkmodell repräsentiert ) unter der American Association for Data Systems Languages (CODASYL) in den 1970er Jahren.
In den frühen 1970er Jahren begann die zweite Generation datenbankbasierter relationaler Datenbanken auf den Markt zu kommen. Allmählich zur dominierenden Datenbank und zum Mainstream der Branche werden. Relationale Datensysteme verwenden die Structured Query Language (SQL) als Data Definition Language (DDL) und Data Manipulation Language (DML). Sie ist seit ihrer Entstehung zur Standardsprache relationaler Datenbanken geworden.
Seit den 1980er Jahren sind verschiedene neue Datenbanksysteme entstanden, die sich an verschiedene Bereiche anpassen, wie z. B. technische Datenbanken, Multimediadatenbanken, Graphdatenbanken, intelligente Datenbanken, verteilte Datenbanken und objektorientierte Datenbanken.
Klassisches Datenmodell
Daten sind die Abstraktion der „Menge“ in der realen Welt, während das Datenmodell (Datenmodell) die Abstraktion von Datenmerkmalen ist. In einem Datenbanksystem ist das Datenmodell der Kern und die Grundlage. Das Datenmodell repräsentiert die Struktur der Daten, die darauf definierten Operationen und Einschränkungen. Es beschreibt die statischen Eigenschaften, dynamischen Eigenschaften und Einschränkungen des Systems auf konzeptioneller Ebene und bietet einen abstrakten Rahmen für die Informationsdarstellung und den Betrieb des Datenbanksystems.
Im Entwicklungsprozess von DBMS sind drei klassische Datenmodelle entstanden: Netzwerkmodell, hierarchisches Modell und relationales Modell.
Der vom Datenmodell beschriebene Inhalt umfasst drei Aspekte: Datenstruktur, Datenoperationen und Datenbeschränkungen.
Mesh-Modell
Datensätze werden in Diagrammen organisiert und „Datenstrukturdiagramme“ werden zur abstrakten Analyse und Darstellung verwendet. Das Netzwerkmodell eignet sich zur Darstellung komplexer Datenzusammenhänge und kann zudem die Datenredundanz auf ein Minimum reduzieren. Sein Datenstrukturmodell kann die Beziehung zwischen Daten in der Realität intuitiv widerspiegeln.
Datenoperation
Die Datenoperation des Netzwerkmodells ist eine Navigationsoperation, die auf der Beziehungskette basiert. Das Netzwerkmodell basiert auf Diagrammen und
Datenbeschränkungen
Die Datenbeschränkungen des Netzwerkmodells sind verstreut und isoliert oder in verschiedenen Knoten verstreut oder in einer Beziehungskette konzentriert, was leicht möglich ist zu Inkonsistenzen oder verringerter Effizienz führen. Normalerweise implementiert das Netzwerkmodell keine spezifischen Dateneinschränkungen, sondern die Anwendung selbst implementiert Dateneinschränkungen.
Hierarchisches Modell
Im hierarchischen Modell werden Datensätze mithilfe eines „Baumstrukturdiagramms“ in Form eines Baums organisiert.
Datenoperationen
Datenoperationen im hierarchischen Modell weisen zwangsläufig die Merkmale des Netzwerkmodells auf – Navigation. Eine solche Struktur trägt zur Verbesserung der Datenabfrageeffizienz bei, es bestehen jedoch weiterhin Anforderungen an die Navigation beim Datenzugriff. Daher sind Datenoperationen in hierarchischen Modelldatenbanken immer noch relativ komplex.
Datenbeschränkungen
Die Datenbeschränkungen des hierarchischen Modells ähneln aufgrund der Vereinfachung der Struktur, der Viele-zu-Viele- und Viele-zu-Eins-Beziehungen Die Daten des hierarchischen Modells können vom System entsprechend implementiert werden, oder sie müssen von der Anwendung selbst implementiert werden.
Die Implementierungstechnologie des hierarchischen Modells ist dem relationalen Modell überlegen und einfacher als das Netzwerkmodell und war daher schon immer führend. Sein Vertreter ist das IMS-System von IBM. Dieses System war einst eine der frühesten und am weitesten verbreiteten Datenbanken und eine der größten Datenbanken in der Geschichte, da seine Entwickler die ersten waren, die sich mit Problemen wie Parallelität, Wiederherstellung, Integrität und effizienten Abfragen befassten und Ideen werden natürlich auf DB2 angewendet, was die Wurzel des langanhaltenden Wohlstands von DB2 ist.
Relationales Modell
Datenstruktur. Das relationale Modell basiert auf der Theorie der relationalen Algebra. Die Datenstruktur wird direkt durch einfache und leicht verständliche zweidimensionale Datentabellen und „Entity-Relationship“-Diagramme (E-R-Diagramme) dargestellt ), Beziehungen und Attribute.
Entität: Wird auch als Instanz bezeichnet und entspricht einem „Ereignis“ oder „Ding“, das von anderen Objekten in der realen Welt unterschieden werden kann.
Entitätssatz: Eine Sammlung von Entitäten desselben Typs und mit denselben Eigenschaften.
Attribut: Ein bestimmtes Merkmal einer Entität. Eine Entität kann mehrere Attribute haben.
Kontakt: Die Korrespondenz zwischen Entitätsmengen wird zu einem Kontakt, auch Beziehung genannt.
Datenoperationen. Für Datenbankbenutzer arbeitet das relationale Modell mit einer von der relationalen Algebra abstrahierten Database Manipulation Language (DML). Eine der wichtigsten ist die Structured Query Language (SQL). Seine Besonderheit besteht darin, dass es direkt auf Ergebnisse ausgerichtet ist und die Arbeitsschritte vereinfacht, wodurch das Design von Datenbankanwendungen sehr einfach und leicht verständlich wird.
Was die physische Struktur der Datenbank betrifft, verfügt das relationale Datenbanksystem über eine einfache Datenstruktur, starke Funktionen, eine hohe Datenunabhängigkeit und eine solide theoretische Grundlage. Streng relationale Datenbanken verwenden zweidimensionale Datenbanktabellen als grundlegende Datenstruktur und verwenden einfache oder komplexe Indizierungstechnologien zur Implementierung von Abfragealgorithmen. Sie sind relativ einfach zu implementieren und erleichtern die Vorkompilierungstechnologie, um die SQL-Sprache direkt in effektive Datenabrufalgorithmen umzuwandeln.
Datenbeschränkungen. Die Dateneinschränkungen des relationalen Modells können auf Entitäten, Entitätsattribute oder Beziehungen abzielen und können bei der Definition von Entitäten, Entitätsattributen und Beziehungen vollständig implementiert werden. Die vom relationalen Modell verwendete Datendefinitionssprache (DDL) und die theoretischen Anforderungen an die Kernimplementierung der relationalen Datenbank machen die Implementierung von Datenbeschränkungen einfach, ihre Effizienz ist jedoch nicht hoch.
Im Allgemeinen verfügt das relationale Modell über eine solidere und vollständigere theoretische Grundlage als das Netzwerkmodell und das hierarchische Modell. Im Vergleich zum hierarchischen Modell und dem Netzwerkmodell ist das relationale Modell näher am Benutzer, während das Netzwerkmodell und das hierarchische Modell enger in die zugrunde liegende Implementierung integriert sind. Solche Funktionen machen es auch einfacher, das relationale Modell zur Wahl einer kommerziellen Datenbank zu machen.
Einführung in die gängigen Datenbanken von heute
SQL Server ist ein Datenbankprodukt von Microsoft. Hinsichtlich des Designs nutzt Microsoft SQL Server weitgehend die zugrunde liegende Struktur des Microsoft Windows-Betriebssystems und richtet sich direkt an Benutzer von Microsoft Windows, insbesondere an Serverbetriebssysteme der Windows-Serie.
Oracle wurde 1977 gegründet. Im Juni 2013 wurde Oracle 12C offiziell veröffentlicht, was Unternehmen die schnelle Implementierung privater Clouds ermöglicht. Die Oracle-Datenbank hat sich zu einem der am weitesten verbreiteten Datenbanksysteme der Welt entwickelt. Oracle nimmt im Datenbankbereich seit jeher eine führende Position ein. Nicht nur ist der Datenbankkern hervorragend, auch die zugehörigen Supportprodukte sind recht vollständig und umfassend. Oracle kann sich an mehr als 70 Betriebssysteme anpassen.
DB2, 1970, schlug Degas Court das Konzept des „relationalen Modells“ vor. Er wird als „Vater der relationalen Datenbank“ bezeichnet und unterstützt alles von PC bis UNIX, von kleinen und mittelgroßen Maschinen bis hin zu Großrechnern. von IBM bis hin zu Nicht-IBM (HP- und Sun-UNIX-Systeme usw.) verschiedene Betriebssystemplattformen. Die beste Betriebsumgebung für den DB2-Server ist IBMs eigene Betriebssystemplattform OS/400.
Der DB2-Datenbankkern, auch bekannt als DB2 Universal Server, kann auf einer Vielzahl von Betriebssystemen ausgeführt werden. Er wurde entsprechend der entsprechenden Plattformumgebung angepasst und optimiert, um eine bessere Leistung zu erzielen.
MySQL ist ebenfalls ein relationales Datenbankverwaltungssystem und wurde von Oracle übernommen. MySQL läuft auf dem Linux-Betriebssystem, mit Apache und Nginx als Webserver, MySQL als Backend-Datenbank und PHP/Perl/Python als Skriptinterpreter. Alle vier Softwareprogramme sind kostenlos oder Open Source. In der Branche als „LAMP“-Portfolio bekannt.
Grundkonzepte relationaler Datenbanken
Ein relationales Datenbanksystem ist ein Datenbanksystem, das auf dem relationalen Modell basiert. Es handelt sich um eine Instanziierung des relationalen Modells, das auf das Datenbankfeld angewendet wird. Seine Grundkonzepte stammen aus dem relationalen Modell.
Die von relationalen Datenbanken verwendete Speicherstruktur besteht aus mehreren zweidimensionalen Tabellen, und die Datenbeschreibungen, die Dinge und ihre Beziehungen widerspiegeln, werden in Form flacher Tabellen verkörpert.
Eine relationale Datenbank besteht aus Assoziationen zwischen Datentabellen, darunter:
Eine Datentabelle ist normalerweise eine zweidimensionale Tabelle, die aus Zeilen und Spalten besteht. Jede Datentabelle beschreibt die Daten in Datenbank. Ein bestimmter Aspekt oder Teil eines Objekts und seiner Eigenschaften.
Eine Zeile in einer Datentabelle wird normalerweise als Datensatz oder Tupel bezeichnet, der eines von vielen Objekten mit denselben Attributen darstellt.
Spalten in Datentabellen werden normalerweise als Felder oder Attribute bezeichnet, die allgemeine Attribute darstellen, die in der entsprechenden Datenbank gespeichert sind.
Primärschlüssel und Fremdschlüssel
Jede Datensatzzeile in der Datentabelle muss eindeutig sein und es dürfen keine identischen Datensätze angezeigt werden. Durch Definieren eines Primärschlüssels (Primärschlüssels) wird die Eindeutigkeit sichergestellt von Datensätzen (Entitäten).
Der Schlüssel, also das Schlüsselwort, ist ein sehr wichtiges Element im relationalen Modell.
Der Primärschlüssel identifiziert die Zeilendaten in der Tabelle eindeutig und ein Primärschlüsselwert entspricht einer Datenzeile. Der Primärschlüssel besteht aus einem oder mehreren Feldern, deren Wert eindeutig ist und keine Nullwerte (NULL) zulässt. Eine Tabelle kann nur einen Primärschlüssel haben.
Wenn ein Attributsatz eine Zeile der Tabelle ohne mehr als ein Attribut eindeutig darstellen kann, wird dieser Attributsatz als Kandidatenschlüssel bezeichnet. Eine Tabelle kann mehrere Kandidatenschlüssel enthalten, es kann jedoch nur ein Kandidatenschlüssel als Primärschlüssel der Tabelle ausgewählt werden. Die anderen Kandidatenschlüssel werden als Alternativschlüssel bezeichnet.
Fremdschlüssel
Eine relationale Datenbank enthält normalerweise mehrere Tabellen, und diese Tabellen können über Fremdschlüssel (ForeignKey) verknüpft werden.
Ein Fremdschlüssel ist eine oder mehrere Spalten, die zum Herstellen und Stärken einer Verknüpfung zwischen Daten in zwei Tabellen verwendet werden. Sie erstellen eine Verknüpfung zwischen zwei Tabellen, indem Sie eine oder mehrere Spalten mit Primärschlüsselwerten von einer Tabelle zu einer anderen Tabelle hinzufügen. Diese Spalte wird als Fremdschlüssel für die zweite Tabelle bezeichnet.
„Master-Tabelle“ und „Slave-Tabelle“ erscheinen immer paarweise und sind durch „Fremdschlüssel“ miteinander verbunden.
Datenintegritätsregeln
Daten- und Aktualisierungsvorgänge in relationalen Datenbanken müssen vier Arten von Integritätsregeln entsprechen:
1. Entitätsintegritätsregeln
Entitätsintegrität Die Geschlechtsregel erfordert, dass die Tupel in der Beziehung keine Nullwerte in den Primärschlüsselattributen haben dürfen. Wenn ein Nullwert auftritt, kann der Primärschlüsselwert das Tupel nicht eindeutig identifizieren.
2. Domänenintegritätsregeln
Domänenintegrität wird auch Spaltenintegrität genannt, die angibt, ob ein Datensatz für eine bestimmte Spalte gültig ist oder ob Nullwerte zulässig sind.
3. Referenzielle Integritätsregeln
Wenn zwei Tabellen miteinander in Beziehung stehen, erfordern die referenziellen Integritätsregeln, dass Verweise auf nicht vorhandene Tupel nicht zulässig sind.
4. Benutzerdefinierte Integritätsregeln
Benutzerdefinierte Integritätsregeln sind Einschränkungen für bestimmte Daten und werden von der Anwendungsumgebung bestimmt. Es spiegelt die semantischen Anforderungen wider, die die in einer bestimmten Anwendung beteiligten Daten erfüllen müssen. Das System bietet Mechanismen zum Definieren und Überprüfen dieser Art von Integrität, sodass sie in einem einheitlichen Systemansatz gehandhabt werden kann, ohne dass diese Arbeit der Anwendung überlassen wird.
Entitätsintegritätsregeln und Domänenintegritätsregeln müssen nach relationalen Datenbankstandards auf der Kernebene des Datenbanksystems implementiert werden.