Durch das Verständnis der Fähigkeiten von Algorithmen für maschinelles Lernen können Ingenieure effektive Soft-Sensoren für ihre Anwendungen entwickeln.
Soft Sensor, auch virtueller Sensor genannt, ist eine Software, die Hunderte von Messdaten umfassend verarbeiten kann. Fabrikmanager, die Soft-Sensoren hinzufügen möchten, sind möglicherweise verwirrt über den Umfang des maschinellen Lernens, das mit Soft-Sensoren funktioniert. Ein tieferer Einblick in das Thema zeigt jedoch, dass den meisten Soft-Sensor-Designs mehrere Kernalgorithmen zugrunde liegen.
Die Auswahl, Schulung und Implementierung dieser Modelle ist oft die Aufgabe von Datenwissenschaftlern, aber auch Werksleiter und andere Betriebsexperten möchten sich mit ihren Fähigkeiten vertraut machen.
Soft-Sensoren werden in einer Softwareumgebung erstellt, können aber die gleichen Vorteile bieten wie ihre realen Gegenstücke. In manchen Fällen sind Soft-Sensoren echten Sensoren vorzuziehen.
Es gibt viele Gründe, warum Betriebsexperten und Datenwissenschaftler bei der Entwicklung von Sensoren zusammenarbeiten sollten. Ein Grund ist der Wunsch nach einer Echtzeit- oder nahezu Echtzeitmessung wichtiger Parameter, die für bestimmte Ergebnisse erforderlich sind. Diese Messungen sind entscheidend für die Verbesserung der Gesamtleistung.
Weitere Anwendungsfälle für Softsensoren sind:
In der Praxis des maschinellen Lernens wird häufig einem zyklischen Muster gefolgt. Zunächst werden die Daten aufbereitet und bereinigt. Als Nächstes wählt der Datenwissenschaftler einen Algorithmus aus, auf dem das Modell basieren soll. Anschließend beginnt der Datenwissenschaftler mit dem Training des Modells mithilfe unverarbeiteter oder vorverarbeiteter Zeitreihen und Kontextdaten. Abschließend wird das Modell getestet und bereitgestellt. Führen Sie dann einen erneuten Zyklus durch, um das Modell zu verbessern.
Im Allgemeinen stehen zwei Haupttypen von Modellen zur Auswahl:
Unter diesen Modellen sind überwachte Modelle die bessere Wahl für die Entwicklung von Softsensoren oder die Erstellung prädiktiver Etiketten. Obwohl es Hunderte von Modellen für überwachtes maschinelles Lernen gibt, sind nur wenige – aus einer Klasse namens Regressionsalgorithmen – für die Erstellung von Soft-Sensoren nützlich. Hier ist eine Beschreibung jedes Modells:
Dies ist eine der nützlichsten und einfachsten Möglichkeiten, Soft-Sensoren zu erstellen. Allerdings sind einige Verfahren, wie beispielsweise die Messung der Viskosität eines Polymers, zu komplex für eine lineare Regression. Dieser Algorithmus generiert eine Funktion, die den Wert der Zielvariablen vorhersagt. Es handelt sich um eine Funktion, die eine lineare Kombination einer Menge einer oder mehrerer Variablen ist. Wenn eine Variable verwendet wird, spricht man von einer univariaten linearen Regression. Mehrere Variablen geben ihm den Namen multiple lineare Regression. Der Vorteil dieses Modells liegt in seiner Klarheit. Es lässt sich leicht ermitteln, welche Variablen den größten Einfluss auf Ihre Ziele haben. Dies wird als Merkmalswichtigkeit bezeichnet.
Theoretisch können Entscheidungsbäume so viele Regeln und Zweige haben, wie sie zur Anpassung an die Daten benötigen. Sie verwenden diese Regeln aus unabhängigen Variablen, die als Merkmalssatz bezeichnet werden. Das Ergebnis ist eine stückweise konstante Schätzung des Zielwerts. Da sie viele Regeln und Zweige haben können, können sie sehr flexibel sein.
Andererseits besteht auch die Gefahr einer Überanpassung der Daten. Überanpassung tritt auf, wenn ein Modell zu lange trainiert wird. Dadurch kann sich das Modell an das Rauschen im Datensatz anpassen und es normal behandeln. Es kann auch zu einer Unteranpassung der Daten kommen. In diesem Fall wurde der Algorithmus nicht lange genug trainiert und verfügte daher nicht über genügend Daten, um zu bestimmen, wie sich die unabhängigen Variablen auf die Zielvariable auswirken könnten oder welche Auswirkungen sie auf die Zielvariable haben könnten.
Sowohl eine Überanpassung als auch eine Unteranpassung der Daten führen zum Scheitern des Modells. Das Modell kann keine neuen Daten mehr verarbeiten und ist auch nicht mit Softsensoren nutzbar. Das Konzept der Über- und Unteranpassung von Daten gibt es nicht nur bei Entscheidungsbaummodellen.
Dies ist im Wesentlichen eine Kombination mehrerer Entscheidungsbaummodelle in einem Modell. Es bietet mehr Flexibilität, ermöglicht mehr Funktionen und bietet eine größere Vorhersagekraft. Es besteht jedoch auch ein hohes Risiko einer Überanpassung der Daten.
Beim maschinellen Lernen wird Gradient Boosting oft als Ensemble-Modell bezeichnet. Wie Random Forest kombiniert Gradient Boosting mehrere Entscheidungsbäume. Der Unterschied besteht jedoch darin, dass jeder Baum optimiert wird, um die zuletzt berechnete Verlustfunktion zu minimieren. Diese Modelle können sehr effektiv sein, aber mit der Zeit werden sie immer schwieriger zu interpretieren.
Das sogenannte Deep Learning ist das Konzept eines neuronalen Netzwerk-Regressionsmodells. Dieses Modell akzeptiert Eingabevariablen und erzeugt bei Anwendung auf ein Regressionsproblem einen Wert für die Zielvariable. Das grundlegendste neuronale Netzwerk ist das mehrschichtige Perzeptron. In diesen Modellen wird nur eine einzige Anordnung von Neuronen verwendet. Üblicherweise verfügt ein neuronales Netzwerk über eine Eingabeschicht, eine oder mehrere verborgene Schichten (jede mit vielen Neuronen) und eine Ausgabeschicht zum Erhalten von Werten.
Die gewichteten Eingabewerte innerhalb jedes Neurons in der verborgenen Schicht werden summiert und durch eine Aktivierungsfunktion (z. B. die Sigmoid-Funktion) geleitet. Diese Funktion macht das Modell nichtlinear. Sobald die Funktion das Modell durchläuft, erreicht sie die Ausgabeschicht, die ein einzelnes Neuron enthält. Bestimmen Sie beim Training eines Modells die Gewichtungen und Verzerrungen, die am besten zu den Funktionen und Zielwerten passen.
Für diejenigen, die neu im Design sind, besteht ein weit verbreitetes Missverständnis darin, dass es ein richtiges Modell gibt, das alle spezifischen Anforderungen erfüllt. Aber tatsächlich ist es das nicht. Die Wahl eines Modells gegenüber einem anderen ist eine komplexe Entscheidung, die zum Teil auf der Erfahrung des Datenwissenschaftlers basiert.
Außerdem liefern diese überwachten Regressionsmodelle nicht jedes Mal die gleichen Ergebnisse. Daher gibt es kein „bestes“ Modell, aber einige Modelle können für bestimmte Situationen besser geeignet sein.
Die Zusammenarbeit zwischen Datenwissenschaftlern und Betriebsexperten bei jeder maschinellen Lernübung beginnt mit einem gegenseitigen Verständnis der beteiligten Parameter, Zielnutzung, Entwicklungs- und Bereitstellungsmethoden.
Das obige ist der detaillierte Inhalt vonWie entwirft man Softsensoren mithilfe von Algorithmen für maschinelles Lernen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!