Heim Schlagzeilen 4 Schritte für Hochleistungsrechnen für die Verarbeitung großer Datenmengen

4 Schritte für Hochleistungsrechnen für die Verarbeitung großer Datenmengen

Mar 10, 2018 am 09:48 AM
数据处理 Gebraucht 高性能

Wenn ein Unternehmen für die Verarbeitung seiner großen Datenmengen Hochleistungsrechnen benötigt, funktioniert es möglicherweise am besten, vor Ort zu arbeiten. Hier erfahren Sie, was Unternehmen wissen müssen, einschließlich der Unterschiede zwischen High-Performance Computing und Hadoop.

Im Bereich Big Data benötigt nicht jedes Unternehmen Hochleistungsrechnen (HPC), aber fast alle Unternehmen, die Big Data nutzen, haben analytisches Computing im Hadoop-Stil eingeführt.

4 Schritte für Hochleistungsrechnen für die Verarbeitung großer Datenmengen

Der Unterschied zwischen HPC und Hadoop ist schwer zu unterscheiden, da Hadoop-Analysejobs auf High-Performance-Computing-Geräten (HPC) ausgeführt werden können, umgekehrt jedoch nicht. Sowohl HPC- als auch Hadoop-Analysen verwenden parallele Datenverarbeitung, aber in Hadoop- und Analyseumgebungen werden Daten auf Hardware gespeichert und über mehrere Knoten dieser Hardware verteilt. Beim Hochleistungsrechnen (HPC) sind die Datendateigrößen viel größer und die Daten werden zentral gespeichert. High Performance Computing (HPC) erfordert aufgrund der großen Dateigrößen und der Notwendigkeit teurerer Netzwerkkommunikation wie InfiniBand einen hohen Durchsatz und eine geringe Latenz.

Der Zweck von Unternehmens-CIOs ist klar: Wenn ein Unternehmen HPC vermeiden und Hadoop nur für Analysen verwenden kann, kann es dies tun. Dieser Ansatz ist kostengünstiger, für Mitarbeiter einfacher zu bedienen und kann sogar in der Cloud ausgeführt werden, wo andere Unternehmen (z. B. Drittanbieter) ihn ausführen können.

Leider ist es für alle Unternehmen und Institutionen in den Bereichen Biowissenschaften, Meteorologie, Pharmazie, Bergbau, Medizin, Regierung und Wissenschaft, die Hochleistungsrechnen (HPC) für die Verarbeitung benötigen, unmöglich, Hadoop einzuführen. Aufgrund der großen Dateigröße und der extrem strengen Verarbeitungsanforderungen ist die Nutzung eines Rechenzentrums oder Cloud Computing keine gute Lösung.

Kurz gesagt ist High Performance Computing (HPC) ein perfektes Beispiel für eine Big-Data-Plattform, die im Rechenzentrum läuft. Aus diesem Grund wird es für Unternehmen zu einer Herausforderung, sicherzustellen, dass die Hardware, in die sie viel investieren, die Aufgabe erfüllt, die sie erfüllen muss.

Alex Lesser, Chief Strategy Officer bei Big Data Hadoop und HPC-Plattformanbieter PSCC Labs, sagte: „Dies ist eine Herausforderung für viele Unternehmen, die HPC zur Verarbeitung ihrer Big Data verwenden müssen. Die meisten dieser Unternehmen verfügen über die.“ Wenn sie die traditionelle IT-Infrastruktur unterstützen, verfolgen sie natürlich diesen Ansatz und bauen die analytische Computerumgebung Hadoop selbst auf, da diese Standardhardware verwendet, mit der sie bereits vertraut sind. Beim Hochleistungsrechnen (HPC) besteht die Antwort jedoch normalerweise darin, dies dem Anbieter zu überlassen it "

Unternehmen, die die Einführung von High-Performance Computing (HPC) erwägen, müssen die folgenden vier Schritte unternehmen:

1. Sicherstellen, dass High-Performance-Computing (HPC) auf höchster Ebene unterstützt wird

Die Top-Management- und Vorstandsmitglieder des Unternehmens müssen nicht unbedingt Experten auf dem Gebiet des Hochleistungsrechnens sein, aber sie dürfen nicht ohne deren Verständnis und Unterstützung sein. Diese Manager sollten alle über ausreichende Kenntnisse des Hochleistungsrechnens (HPC) verfügen und die umfangreichen Hardware-, Software- und Schulungsinvestitionen, die für das Unternehmen getätigt werden können, eindeutig unterstützen. Das bedeutet, dass sie über zwei Aspekte aufgeklärt werden müssen: (1) Was HPC ist und warum es sich von gewöhnlicher Analyse unterscheidet und spezielle Hardware und Software erfordert. (2) Warum Unternehmen HPC anstelle von Legacy-Analysen verwenden müssen, um ihre Geschäftsziele zu erreichen. Für beide Aufklärungsbemühungen sollte der Chief Information Officer (CIO) oder Chief Development Officer (CDO) verantwortlich sein.

Lesser sagte: „Die Unternehmen, die HPC am aggressivsten einführen, sind diejenigen, die glauben, sie seien echte Technologieunternehmen. Sie beziehen sich auf den Cloud-Service Amazon AWS, der ursprünglich nur ein Einzelhandelsgeschäft für Amazon war.“ .com Inc. und hat sich mittlerweile zu einem großen Gewinnbringer entwickelt.“

2. Erwägen Sie eine vorkonfigurierte Hardwareplattform, die angepasst werden kann

Unternehmen wie PSSC Labs bieten vorgefertigte Lösungen an und vorkonfigurierte HPC-Hardware. „Wir haben ein Basispaket, das auf HPC-Best Practices basiert, und arbeiten mit Kunden zusammen, um dieses Basispaket an die Rechenanforderungen des Kunden anzupassen“, sagte Lesser und wies darauf hin, dass fast jedes Rechenzentrum einige Anpassungen vornehmen muss.

3. Verstehen Sie die Rendite

Wie bei jeder IT-Investition muss HPC kosteneffektiv sein und das Unternehmen sollte in der Lage sein, einen Return on Investment (ROI) zu erzielen, der bereits vorhanden ist Meinungen von Management und Vorstand klären. „Ein gutes Beispiel ist der Flugzeugbau“, sagte Lesser. „High Performance Computing (HPC) ist eine enorme Investition, die sich jedoch schnell amortisiert, wenn ein Unternehmen entdeckt, dass es HPC zur Simulation von Designs verwenden und fünf Neunen an Genauigkeit erzielen kann und nicht mehr in die Anmietung eines physischen Windkanals investieren muss.“ 🎜>

4. Schulen Sie Ihr eigenes IT-Personal

HPC-Computing ist für das IT-Personal eines Unternehmens kein einfacher Übergang, aber wenn das Unternehmen den Betrieb vor Ort durchführen möchte, sollte das Team für sich selbst aufgestellt sein -Suffizienz.

Zunächst müssen Unternehmen möglicherweise externe Berater beauftragen, um loszulegen. Das Ziel eines Beratungsauftrags sollte jedoch immer zwei sein: (1) die HPC-Anwendung am Laufen zu halten und (2) Wissen an die Mitarbeiter weiterzugeben, damit diese den Betrieb übernehmen können. Damit sollten sich Unternehmen nicht zufrieden geben.

Im Mittelpunkt des HPC-Teams steht der Bedarf an einem Datenwissenschaftler, der die hochkomplexen Algorithmen entwickeln kann, die für Hochleistungsrechnen erforderlich sind, um die Fragen des Unternehmens zu beantworten. Es erfordert außerdem einen Programmierer mit ausgeprägten C+- oder Fortran-Kenntnissen und der Fähigkeit, in einer Parallelverarbeitungsumgebung auf leistungsstarken Systemen zu arbeiten, oder einen Experten für Netzwerkkommunikation.

„Die Quintessenz ist, dass ein Unternehmen, wenn es ein- oder zweimal alle zwei Wochen Jobs ausführt, in die Cloud gehen sollte, um seinen HPC zu hosten: „Aber wenn das Unternehmen HPC-Ressourcen nutzt und Jobs ausführt, B. Pharmaunternehmen oder ein Biologieunternehmen, das es mehrmals am Tag betreibt, wäre es eine Geldverschwendung, es in der Cloud zu betreiben, und man sollte in Betracht ziehen, einen eigenen internen Betrieb zu betreiben.“

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Pandas liest problemlos Daten aus der SQL-Datenbank Pandas liest problemlos Daten aus der SQL-Datenbank Jan 09, 2024 pm 10:45 PM

Datenverarbeitungstool: Pandas liest Daten in SQL-Datenbanken und erfordert spezifische Codebeispiele. Da die Datenmenge weiter wächst und ihre Komplexität zunimmt, ist die Datenverarbeitung zu einem wichtigen Bestandteil der modernen Gesellschaft geworden. Im Datenverarbeitungsprozess ist Pandas für viele Datenanalysten und Wissenschaftler zu einem der bevorzugten Tools geworden. In diesem Artikel wird die Verwendung der Pandas-Bibliothek zum Lesen von Daten aus einer SQL-Datenbank vorgestellt und einige spezifische Codebeispiele bereitgestellt. Pandas ist ein leistungsstarkes Datenverarbeitungs- und Analysetool auf Basis von Python

PHP und WebSocket: Erstellen leistungsstarker Echtzeitanwendungen PHP und WebSocket: Erstellen leistungsstarker Echtzeitanwendungen Dec 17, 2023 pm 12:58 PM

PHP und WebSocket: Erstellen leistungsstarker Echtzeitanwendungen Mit der Weiterentwicklung des Internets und steigenden Benutzeranforderungen werden Echtzeitanwendungen immer häufiger eingesetzt. Das herkömmliche HTTP-Protokoll weist einige Einschränkungen bei der Verarbeitung von Echtzeitdaten auf, z. B. die Notwendigkeit häufiger oder langer Abfragen, um die neuesten Daten zu erhalten. Um dieses Problem zu lösen, wurde WebSocket ins Leben gerufen. WebSocket ist ein fortschrittliches Kommunikationsprotokoll, das bidirektionale Kommunikationsfunktionen bietet und das Senden und Empfangen in Echtzeit zwischen dem Browser und dem Server ermöglicht.

Welchen Computer sollten Absolventen der Geoinformatik wählen? Welchen Computer sollten Absolventen der Geoinformatik wählen? Jan 13, 2024 am 08:00 AM

Empfohlene Computer für Studierende mit Schwerpunkt Geoinformationswissenschaft 1. Empfehlung 2. Studierende mit Schwerpunkt Geoinformationswissenschaft müssen große Mengen geografischer Daten verarbeiten und komplexe Geoinformationsanalysen durchführen und benötigen daher einen Computer mit hoher Leistung. Ein Computer mit hoher Konfiguration kann eine schnellere Verarbeitungsgeschwindigkeit und mehr Speicherplatz bieten und professionelle Anforderungen besser erfüllen. 3. Es wird empfohlen, einen Computer zu wählen, der mit einem Hochleistungsprozessor und einem Speicher mit großer Kapazität ausgestattet ist, der die Effizienz der Datenverarbeitung und -analyse verbessern kann. Darüber hinaus können geografische Daten und Ergebnisse besser angezeigt werden, wenn Sie sich für einen Computer mit größerem Speicherplatz und einem hochauflösenden Display entscheiden. Da Studierende im Hauptfach Geoinformatik möglicherweise Software für geografische Informationssysteme (GIS) entwickeln und programmieren müssen, sollten Sie sich außerdem für einen Computer mit besserer Grafikverarbeitungsunterstützung entscheiden.

Tipps zur leistungsstarken C++-Programmierung: Optimierung des Codes für die Verarbeitung großer Datenmengen Tipps zur leistungsstarken C++-Programmierung: Optimierung des Codes für die Verarbeitung großer Datenmengen Nov 27, 2023 am 08:29 AM

C++ ist eine leistungsstarke Programmiersprache, die Entwicklern Flexibilität und Skalierbarkeit bietet. Insbesondere in großen Datenverarbeitungsszenarien sind die Effizienz und die schnelle Rechengeschwindigkeit von C++ sehr wichtig. In diesem Artikel werden einige Techniken zur Optimierung von C++-Code vorgestellt, um umfangreiche Datenverarbeitungsanforderungen zu bewältigen. Verwenden von STL-Containern anstelle herkömmlicher Arrays In der C++-Programmierung sind Arrays eine der am häufigsten verwendeten Datenstrukturen. Bei der Datenverarbeitung in großem Maßstab kann die Verwendung von STL-Containern wie Vektor, Deque, Liste und Set usw. jedoch mehr sein

Wie verbessert Golang die Effizienz der Datenverarbeitung? Wie verbessert Golang die Effizienz der Datenverarbeitung? May 08, 2024 pm 06:03 PM

Golang verbessert die Effizienz der Datenverarbeitung durch Parallelität, effiziente Speicherverwaltung, native Datenstrukturen und umfangreiche Bibliotheken von Drittanbietern. Zu den spezifischen Vorteilen gehören: Parallelverarbeitung: Coroutinen unterstützen die Ausführung mehrerer Aufgaben gleichzeitig. Effiziente Speicherverwaltung: Der Garbage-Collection-Mechanismus verwaltet den Speicher automatisch. Effiziente Datenstrukturen: Datenstrukturen wie Slices, Karten und Kanäle greifen schnell auf Daten zu und verarbeiten sie. Bibliotheken von Drittanbietern: Abdeckung verschiedener Datenverarbeitungsbibliotheken wie fasthttp und x/text.

Verwenden Sie Redis, um die Datenverarbeitungseffizienz von Laravel-Anwendungen zu verbessern Verwenden Sie Redis, um die Datenverarbeitungseffizienz von Laravel-Anwendungen zu verbessern Mar 06, 2024 pm 03:45 PM

Verwenden Sie Redis, um die Datenverarbeitungseffizienz von Laravel-Anwendungen zu verbessern. Mit der kontinuierlichen Entwicklung von Internetanwendungen ist die Datenverarbeitungseffizienz zu einem Schwerpunkt der Entwickler geworden. Bei der Entwicklung von Anwendungen, die auf dem Laravel-Framework basieren, können wir Redis verwenden, um die Effizienz der Datenverarbeitung zu verbessern und einen schnellen Zugriff und ein schnelles Zwischenspeichern von Daten zu erreichen. In diesem Artikel wird die Verwendung von Redis für die Datenverarbeitung in Laravel-Anwendungen vorgestellt und spezifische Codebeispiele bereitgestellt. 1. Einführung in Redis Redis ist ein Hochleistungsspeicher für Daten

Wie vergleichen sich die Datenverarbeitungsfunktionen in Laravel und CodeIgniter? Wie vergleichen sich die Datenverarbeitungsfunktionen in Laravel und CodeIgniter? Jun 01, 2024 pm 01:34 PM

Vergleichen Sie die Datenverarbeitungsfunktionen von Laravel und CodeIgniter: ORM: Laravel verwendet EloquentORM, das eine relationale Klassen-Objekt-Zuordnung bereitstellt, während CodeIgniter ActiveRecord verwendet, um das Datenbankmodell als Unterklasse von PHP-Klassen darzustellen. Abfrage-Builder: Laravel verfügt über eine flexible verkettete Abfrage-API, während der Abfrage-Builder von CodeIgniter einfacher und Array-basiert ist. Datenvalidierung: Laravel bietet eine Validator-Klasse, die benutzerdefinierte Validierungsregeln unterstützt, während CodeIgniter über weniger integrierte Validierungsfunktionen verfügt und eine manuelle Codierung benutzerdefinierter Regeln erfordert. Praxisfall: Beispiel einer Benutzerregistrierung zeigt Lar

Vergleich von Golang- und Python-Crawlern: Analyse der Unterschiede in Anti-Crawling, Datenverarbeitung und Framework-Auswahl Vergleich von Golang- und Python-Crawlern: Analyse der Unterschiede in Anti-Crawling, Datenverarbeitung und Framework-Auswahl Jan 20, 2024 am 09:45 AM

Eingehende Untersuchung der Ähnlichkeiten und Unterschiede zwischen Golang-Crawlern und Python-Crawlern: Anti-Crawling-Reaktion, Datenverarbeitung und Framework-Auswahl Einführung: In den letzten Jahren hat sich mit der rasanten Entwicklung des Internets die Datenmenge im Netzwerk explosionsartig gezeigt Wachstum. Als technisches Mittel zum Abrufen von Internetdaten haben Crawler die Aufmerksamkeit von Entwicklern auf sich gezogen. Die beiden Mainstream-Sprachen Golang und Python haben jeweils ihre eigenen Vorteile und Eigenschaften. In diesem Artikel werden die Gemeinsamkeiten und Unterschiede zwischen Golang-Crawlern und Python-Crawlern untersucht, einschließlich Anti-Crawling-Antworten und Datenverarbeitung.