Apache SystemML ist eine optimierte Big-Data-Plattform für maschinelles Lernen, die von IBM entwickelt und als Open-Source-Lösung bereitgestellt wird und den besten Arbeitsplatz für maschinelles Lernen unter Verwendung von Big Data bietet. Es läuft auf Apache Spark und skaliert die Daten automatisch, indem es Zeile für Zeile bestimmt, ob der Code auf dem Treiber oder dem Apache Spark-Cluster ausgeführt werden soll. (Empfohlenes Lernen: phpstorm)
SystemML ist deklaratives maschinelles Lernen (DML), das lineare Algebra-Primitive, statistische Funktionen und ML-Spezifikationsstrukturen umfasst und es einfacher und nativer macht, Ausdruck zu erzeugen ML-Algorithmen.
Algorithmen werden durch R-Typ- oder Python-Typ-Syntax ausgedrückt. DML steigert die Produktivität der Datenwissenschaft erheblich, indem es flexible Ausdrucksmöglichkeiten für benutzerdefinierte Analysen und Daten bereitstellt, unabhängig vom zugrunde liegenden Eingabeformat und der physischen Datendarstellung.
Zweitens bietet SystemML automatische Optimierungsfunktionen, um Effizienz und Skalierbarkeit durch Daten- und Clusterfunktionen sicherzustellen. SystemML kann in MapReduce- oder Spark-Umgebungen ausgeführt werden.
Was SystemML auszeichnet, ist:
(1) Anpassbare Algorithmen
(2) Mehrere Ausführungsmodi, einschließlich Single, Hadoop-Batch und Spark-Batch ,
(3) automatische Optimierung
SystemML Advanced Machine Learning basiert hauptsächlich auf zwei Aspekten:
SystemML-Sprache, deklaratives maschinelles Lernen (DML) . SystemML enthält lineare Algebra-Primitive, statistische Funktionen und ML-spezifische Strukturen, die es einfacher und nativer machen, ML-Algorithmen auszudrücken. Algorithmen werden durch eine R-Typ- oder Python-Typ-Syntax ausgedrückt.
DML steigert die Produktivität der Datenwissenschaft erheblich, indem es flexible Ausdrucksmöglichkeiten für benutzerdefinierte Analysen und Daten bereitstellt, unabhängig vom zugrunde liegenden Eingabeformat und der physischen Datendarstellung.
Zweitens bietet SystemML automatische Optimierungsfunktionen, um Effizienz und Skalierbarkeit durch Daten- und Clusterfunktionen sicherzustellen. SystemML kann in MapReduce- oder Spark-Umgebungen ausgeführt werden.
Das obige ist der detaillierte Inhalt vonsystemml-Architektur. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!