Heim Betrieb und Instandhaltung Apache Was ist Apache Hadoop?

Was ist Apache Hadoop?

Jun 11, 2019 pm 03:02 PM
apache hadoop

Apache Hadoop ist ein Framework zum Ausführen von Anwendungen auf großen Clustern, die auf Allzweck-Hardware basieren. Es implementiert das Map/Reduce-Programmierparadigma, bei dem Rechenaufgaben in kleine Blöcke (mehrmals) aufgeteilt und auf verschiedenen Knoten ausgeführt werden.

Was ist Apache Hadoop?

Darüber hinaus stellt es auch ein verteiltes Dateisystem (HDFS) bereit, in dem Daten auf Rechenknoten gespeichert werden, um eine extrem hohe rechenzentrumsübergreifende Gesamtbandbreite bereitzustellen.

Framework-Rolle

Eine neue Wahl für den Besitz von Apache Hadoop Big Data

Physisches DAS ist immer noch der beste Speicher für Apache Hadoop Media, weil die relevanten hochrangigen Fach- und Geschäftsunternehmen die Speichermedien durch Forschung und Praxis bestimmt haben. Allerdings gibt es große Probleme mit der Apache Hadoop-Datenspeicherung auf Basis von HDFS.

Zuerst besteht die Standardlösung darin, dass alle Apache Hadoop-Daten kopiert, verschoben und dann gesichert werden. HDFS basiert auf der E/A-Optimierung großer Apache Hadoop-Datenblöcke, wodurch Zeit für die Apache Hadoop-Dateninteraktion eingespart wird. Eine spätere Nutzung bedeutet in der Regel das Herauskopieren der Apache Hadoop-Daten. Obwohl es lokale Snapshots gibt, sind diese zu diesem Zeitpunkt nicht vollständig konsistent oder vollständig wiederherstellbar.

Aus diesen und anderen Gründen sind Anbieter von Unternehmensspeichern schlau genug, Änderungen an HDFS vorzunehmen, und einige Big-Data-Experten vom Typ Geek lassen Apache Hadoop-Berechnungen auf externen Speicher zurückgreifen. Aber für viele Unternehmen bietet Apache Hadoop einen guten Kompromiss: Es ist kein wartungsintensiver Speicher oder die Anpassung neuer Methoden zur Speicherverwaltung erforderlich, was mit Kosten verbunden ist.

Viele Apache Hadoop-Anbieter bieten Remote-HDFS-Schnittstellen zu Apache Hadoop-Clustern und sind die erste Wahl für Apache Hadoop-Unternehmen mit großem Geschäftsvolumen. Da sie sich in Isilon befinden, werden alle anderen Apache Hadoop-Daten verarbeitet, um große Datenmengen zu schützen, einschließlich der Sicherheit von Apache Hadoop und anderen Problemen. Ein weiterer Vorteil besteht darin, dass auf extern gespeicherte Daten oft von anderen Apache Hadoop-Protokollspeichern aus zugegriffen werden kann, was Arbeitsabläufe unterstützt und die Übertragung von Daten und Datenkopien nach Bedarf innerhalb des Unternehmens einschränkt. Auch Apache Hadoop verarbeitet Big Data nach diesem Prinzip, einer Big-Data-Referenzarchitektur, kombiniert mit einer kombinierten Speicherlösung, direkt im Apache Hadoop-Cluster.

Erwähnenswert ist auch die virtualisierte Big-Data-Analyse von Apache Hadoop. Theoretisch können alle Rechen- und Speicherknoten virtualisiert werden. VMware und RedHat/OpenStack bieten Virtualisierungslösungen für Hadoop. Allerdings können fast alle Apache Hadoop-Hostknoten die Speicherprobleme von Unternehmen nicht lösen. Es emuliert die Rechenaspekte von Apache Hadoop und ermöglicht es Unternehmen, vorhandene Datensätze (SAN/NAS) zu beschleunigen und mit Apache Hadoop auf ihr HDFS-Overlay zu übertragen. Auf diese Weise kann Apache Hadoop Big Data Analytics alle Änderungen an den Daten in einem Rechenzentrum ohne Änderungen durchführen und dabei die neue Apache Hadoop-Speicherarchitektur und neue Datenflüsse oder Datenverwaltung nutzen.

Die meisten Apache Hadoop-Distributionen basieren auf dem Open-Source-HDFS (aktueller softwaredefinierter Speicher für Big Data) in der Nähe von Apache Hadoop. Der Unterschied besteht darin, dass Apache Hadoop einen anderen Ansatz verfolgt. Dies ist im Grunde der Speicher, den Apache Hadoop für Unternehmen benötigt, um eine eigene kompatible Speicherschicht auf Apache Hadoop HDFS aufzubauen. Die MAPR-Version beherrscht die I/O-Unterstützung für die Snapshot-Replikation vollständig und Apache Hadoop ist auch mit anderen nativ unterstützten Protokollen wie NFS kompatibel. Apache Hadoop ist außerdem sehr effektiv und hilft vor allem bei der Bereitstellung von Business-Intelligence-Anwendungen für Unternehmen, die Entscheidungsunterstützungslösungen ausführen, die auf Big Data für historische und Echtzeitinformationen basieren. Ähnlich der Idee hat IBM die High Performance Computing System Storage API für die Apache Hadoop-Distribution als Alternative zu HDFS veröffentlicht

Eine weitere interessante Lösung für Apache Hadoop, die bei der Lösung von Datenproblemen helfen kann. Eine davon ist dataguise, ein Datensicherheits-Startup, das einige eindeutige IP-Adressen der großen Datenmengen von Apache Hadoop effektiv schützen kann. Apache Hadoop kann vertrauliche Informationen in einem großen Datencluster automatisch identifizieren und global abdecken oder verschlüsseln. Horizontale Datenwissenschaft ist eine aufstrebende Technologie in diesem Bereich. Wenn Sie Ihre Datendateien mit Apache Hadoop verbinden, speichert Apache Hadoop sie automatisch, egal wo sich die Daten befinden, sogar HDFS. Die von Apache Hadoop Big Data bereitgestellte Ausgabe hilft bei der schnellen Erstellung von Geschäftsanwendungen, indem die Quelle und der Speicherort der Daten verwendet werden, um die vom Unternehmen benötigten Informationen zu sammeln.

Wenn Sie sich schon immer für Apache Hadoop-Management oder Enterprise Data Center Storage interessiert haben, ist dies ein guter Zeitpunkt, Ihr Wissen über Apache Hadoop Big Data zu aktualisieren und wenn Sie mit Apache Hadoop Big Data auf dem Laufenden bleiben möchten. Wenn Sie in die Fußstapfen treten, sollten Sie den Einsatz neuer Technologien von Apache Hadoop nicht ablehnen.

Weitere technische Artikel zu Apache finden Sie in der Spalte Apache-Tutorial, um mehr darüber zu erfahren!

Das obige ist der detaillierte Inhalt vonWas ist Apache Hadoop?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Chat -Befehle und wie man sie benutzt
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Wie konfiguriere ich Apache für die Arbeit mit node.js mit mod_proxy? Wie konfiguriere ich Apache für die Arbeit mit node.js mit mod_proxy? Mar 17, 2025 pm 05:18 PM

In Artikel werden Apache mit node.js mit mod_proxy, gemeinsamen Problemen, Lastausgleich und Sicherheitsmaßnahmen konfiguriert. Das Hauptaugenmerk liegt auf Setup und Optimierung (159 Zeichen)

Wie konfiguriere ich Apache für das Streaming von Videos mit mod_flvx und mod_h264_streaming? Wie konfiguriere ich Apache für das Streaming von Videos mit mod_flvx und mod_h264_streaming? Mar 17, 2025 pm 05:19 PM

In Artikel werden das Konfigurieren von Apache für das Video -Streaming mithilfe von Mod_flvx und mod_h264_streaming, Detaillierung von Installation, Konfiguration, Optimierung und gemeinsamen Problemauflösung erläutert.

Wie konfiguriere ich Apache für serverseitige Include (SSI) mit mod_include? Wie konfiguriere ich Apache für serverseitige Include (SSI) mit mod_include? Mar 17, 2025 pm 05:19 PM

In dem Artikel wird das Konfigurieren von Apache für serverseitig beschrieben (SSI) mit mod_include, detaillierte Schritte zum Aktivieren und Konfigurieren von SSI sowie zur Bekämpfung von Vorteilen und zur Fehlerbehebung gemeinsame Probleme.Character Count: 159

Apache -Fehlerbehebung: Diagnose und Lösung gemeinsamer Fehler Apache -Fehlerbehebung: Diagnose und Lösung gemeinsamer Fehler Apr 03, 2025 am 12:07 AM

Apache -Fehler können durch Anzeigen von Protokolldateien diagnostiziert und behoben werden. 1) Zeigen Sie den Fehler an. Log -Datei, 2) Verwenden Sie den Befehl GREP, um Fehler in bestimmten Domänennamen zu filtern, 3) die Protokolldateien regelmäßig reinigen und die Konfiguration optimieren. Durch diese Schritte können Apache -Fehler effektiv diagnostiziert und gelöst werden.

Wie implementiere ich HTTP/2 mit Apache? Wie implementiere ich HTTP/2 mit Apache? Mar 17, 2025 pm 05:13 PM

In Artikel wird die Implementierung von HTTP/2 mit Apache, seinen Leistungsvorteilen und der Fehlerbehebung erläutert. Das Hauptproblem ist die korrekte Konfiguration und Überprüfung von HTTP/2.

Was sind die besten Tools zur Überwachung von Apache? Was sind die besten Tools zur Überwachung von Apache? Mar 17, 2025 pm 05:22 PM

In dem Artikel werden Top-Tools zur Überwachung von Apache-Servern erörtert und sich auf ihre Funktionen, Echtzeitfunktionen und Kosteneffizienz konzentriert. Es wird auch erläutert, wie diese Tools verwendet werden, um die Apache -Leistung zu optimieren.

Apache Performance Tuning: Optimierung von Geschwindigkeit und Effizienz Apache Performance Tuning: Optimierung von Geschwindigkeit und Effizienz Apr 04, 2025 am 12:11 AM

Zu den Methoden zur Verbesserung der Apache-Leistung gehören: 1. Keepalive-Einstellungen einstellen, 2. Optimieren Sie Multi-Process-/Thread-Parameter, 3.. Verwenden Sie mod_deflate zur Komprimierung, 4. Cache implementieren und laden, 5. Durch diese Strategien können die Reaktionsgeschwindigkeit und die gleichzeitigen Verarbeitungsfähigkeiten von Apache -Servern erheblich verbessert werden.

Wie konfiguriere ich das Browser -Caching in Apache mit mod_expires? Wie konfiguriere ich das Browser -Caching in Apache mit mod_expires? Mar 17, 2025 pm 05:12 PM

In Artikel werden das Konfigurieren von Browser -Caching in Apache mithilfe von mod_expires erläutert. Hauptproblem ist die Optimierung der Webleistung durch Caching -Einstellungen. Character Count: 159

See all articles