Big Data bezieht sich auf eine Sammlung von Daten, die mit herkömmlichen Softwaretools nicht innerhalb eines bestimmten Zeitraums erfasst, verwaltet und verarbeitet werden können. Es erfordert neue Verarbeitungsmodelle, um eine stärkere Entscheidungskraft, Erkenntnisgewinnung und Prozessoptimierung zu ermöglichen , hohe Wachstumsraten und vielfältige Informationsressourcen.
In „The Age of Big Data“ von Victor Meyer-Schonberg und Kenneth Cukier bezieht sich Big Data auf die Verwendung zufälliger Analysemethoden (Stichprobenerhebungen) wie z Verknüpfung und nutzen Sie alle Daten zur Analyse und Verarbeitung. Die 5V-Merkmale von Big Data (vorgeschlagen von IBM): Volumen, Geschwindigkeit, Vielfalt, Wert und Veracity.
Empfohlener Kurs: Python-Tutorial.
Definition
Die Beziehung zwischen Big Data und Cloud Computing
Für „Big Data“ (Big Data) gab die Forschungsorganisation Gartner diese Definition. „Big Data“ erfordert neue Verarbeitungsmodelle mit stärkerer Entscheidungskraft, Erkenntnissen und Möglichkeiten zur Prozessoptimierung, um sich an die massiven, hohen Wachstumsraten und diversifizierten Informationsbestände anzupassen.
Die Definition des McKinsey Global Institute lautet: Eine Datensammlung, die so groß ist, dass ihre Erfassung, Speicherung, Verwaltung und Analyse die Fähigkeiten herkömmlicher Datenbanksoftwaretools bei weitem übersteigt. Sie verfügt über einen enormen Datenumfang und eine schnelle Verarbeitung weist vier Hauptmerkmale auf: Datenfluss, vielfältige Datentypen und geringe Wertedichte.
Die strategische Bedeutung der Big-Data-Technologie liegt nicht in der Beherrschung riesiger Datenmengen, sondern in der professionellen Verarbeitung dieser bedeutungsvollen Daten. Mit anderen Worten: Vergleicht man Big Data mit einer Branche, dann liegt der Schlüssel zur Rentabilität dieser Branche in der Verbesserung der „Verarbeitungsfähigkeiten“ von Daten und der Erzielung des „Mehrwerts“ von Daten durch „Verarbeitung“.
Technisch gesehen ist die Beziehung zwischen Big Data und Cloud Computing so untrennbar wie die beiden Seiten derselben Medaille. Big Data kann nicht von einem einzelnen Computer verarbeitet werden und muss eine verteilte Architektur verwenden. Sein Merkmal liegt im verteilten Data Mining großer Datenmengen. Es muss jedoch auf verteilter Verarbeitung, verteilter Datenbank und Cloud-Speicher sowie der Virtualisierungstechnologie des Cloud Computing basieren.
Mit dem Aufkommen des Cloud-Zeitalters hat auch Big Data (Big Data) immer mehr Aufmerksamkeit auf sich gezogen. Das Analystenteam ist der Ansicht, dass Big Data im Allgemeinen zur Beschreibung der großen Mengen unstrukturierter und halbstrukturierter Daten verwendet wird, die von einem Unternehmen erstellt werden und deren Herunterladen in eine relationale Datenbank zur Analyse zu viel Zeit und Geld kosten würde. Big-Data-Analysen werden häufig mit Cloud Computing in Verbindung gebracht, da für die Echtzeitanalyse großer Datenmengen Frameworks wie MapReduce erforderlich sind, um die Arbeit auf Dutzende, Hunderte oder sogar Tausende von Computern zu verteilen.
Big Data erfordert spezielle Techniken, um große Datenmengen über einen erträglichen Zeitraum hinweg effizient zu verarbeiten. Zu den auf Big Data anwendbaren Technologien gehören MPP-Datenbanken (Massively Parallel Processing), Data Mining, verteilte Dateisysteme, verteilte Datenbanken, Cloud-Computing-Plattformen, das Internet und skalierbare Speichersysteme.
Die kleinste Grundeinheit ist Bit, alle Einheiten werden in der Reihenfolge angegeben: Bit, Byte, KB, MB, GB, TB, PB, EB, ZB, YB, BB, NB, DB.
Sie werden nach der Rate von 1024 (2 zur zehnten Potenz) berechnet:
1 Byte =8 Bit
1 KB = 1.024 Bytes = 8192 Bit
1 MB = 1.024 KB = 1.048.576 Bytes
1 GB = 1.024 MB = 1.048.576 KB
1 TB = 1.024 GB = 1.048.576 MB
1 PB = 1.024 TB = 1.048.576 GB 1.024 ZB = 1.048.576 EB
1 BB = 1.024 YB = 1.048.576 ZB
1 NB = 1.024 BB = 1.048.576 YB
1 DB = 1.024 NB = 1.048.576 BB
Das obige ist der detaillierte Inhalt vonBig-Data-Definitionen und -Konzepte. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!