Frank Hutter, Leiter des Labors für maschinelles Lernen an der Universität Freiburg in Deutschland, sagte, dass das Ergebnis all dieser menschlichen Entscheidungen darin besteht, dass komplexe Modelle letztendlich „intuitiv“ und nicht systematisch entworfen werden.
Ein wachsendes Feld namens automatisches maschinelles Lernen (autoML) zielt darauf ab, dieses Rätselraten zu beseitigen. Die Idee besteht darin, Algorithmen die Entscheidungen zu überlassen, die Forscher derzeit beim Entwurf von Modellen treffen müssen. Letztendlich könnten diese Technologien maschinelles Lernen zugänglicher machen.
Obwohl es automatisches maschinelles Lernen schon seit fast einem Jahrzehnt gibt, arbeiten Forscher immer noch daran, es zu verbessern. Auf einer neuen Konferenz, die heute in Baltimore stattfindet, werden Bemühungen zur Verbesserung der Genauigkeit und Rationalisierung der Leistung von autoML vorgestellt.
Es besteht großes Interesse am Potenzial von autoML, maschinelles Lernen zu vereinfachen. Unternehmen wie Amazon und Google bieten bereits Low-Code-Tools für maschinelles Lernen an, die die AutoML-Technologie nutzen. Wenn diese Techniken effektiver werden, könnte dies die Forschung beschleunigen und maschinelles Lernen mehr Menschen zugänglich machen.
Die Idee besteht darin, den Menschen die Möglichkeit zu geben, die Frage auszuwählen, die sie stellen möchten, das AutoML-Tool darauf zu richten und die gewünschten Ergebnisse zu erzielen.
Diese Vision ist der „heilige Gral der Informatik“, sagte Lars Kotthoff, Assistenzprofessor für Informatik an der University of Wyoming und Konferenzorganisator: „Sie geben das Problem vor, der Computer weiß, wie er es lösen kann, und das ist alles Sie.“ tun müssen.“ Aber zuerst müssen Forscher herausfinden, wie sie diese Techniken zeit- und energieeffizienter machen können.
Auf den ersten Blick mag das Konzept von AutoML überflüssig erscheinen – schließlich geht es beim maschinellen Lernen bereits darum, den Prozess der Gewinnung von Erkenntnissen aus Daten zu automatisieren. Da AutoML-Algorithmen jedoch auf einer Abstraktionsebene oberhalb der zugrunde liegenden Modelle für maschinelles Lernen arbeiten und sich ausschließlich auf die Ausgabe dieser Modelle als Orientierungshilfe verlassen, sparen sie Zeit und Rechenaufwand.
Forscher können die AutoML-Technologie auf vorab trainierte Modelle anwenden, um neue Erkenntnisse zu gewinnen, ohne Rechenleistung zu verschwenden und bestehende Forschungsergebnisse zu duplizieren.
Zum Beispiel präsentierten Mehdi Bahrami, ein Forschungswissenschaftler am Fujitsu Research Institute in den Vereinigten Staaten, und seine Co-Autoren aktuelle Arbeiten darüber, wie der BERT-Sortieralgorithmus mit verschiedenen vorab trainierten Modellen verwendet werden kann, um ihn an neue Zwecke anzupassen.
BERT-sort ist ein Algorithmus, der beim Training an einem Datensatz die sogenannte „semantische Reihenfolge“ findet. Anhand der Daten zu Filmkritiken weiß es beispielsweise, dass „großartige“ Filme höher eingestuft werden als „gute“ und „schlechte“ Filme.
Mit der AutoML-Technologie kann die erlernte semantische Reihenfolge auch verallgemeinert werden, um Krebsdiagnosen und sogar fremdsprachigen Text zu klassifizieren, wodurch Zeit und Berechnungen reduziert werden.
„BERT erfordert monatelange Berechnungen und ist sehr teuer, etwa 1 Million US-Dollar, um das Modell zu erstellen und den Prozess zu wiederholen.“ Bahrami sagte: „Wenn also jeder das Gleiche tun möchte, ist es teuer – es ist nicht energieeffizient und schlecht.“ für die Nachhaltigkeit der Welt.“
Trotz der vielversprechenden Ergebnisse auf diesem Gebiet suchen Forscher immer noch nach Möglichkeiten, die AutoML-Technologie recheneffizienter zu machen. Beispielsweise kann bei Methoden wie Neural Architecture Search (NAS), bei denen viele verschiedene Modelle erstellt und getestet werden, um die beste Lösung zu finden, der Energieaufwand für die Durchführung all dieser Iterationen erheblich sein.
Automatisiertes maschinelles Lernen kann auch auf Algorithmen für maschinelles Lernen angewendet werden, die keine neuronalen Netze umfassen, z. B. die Erstellung von Zufallsentscheidungswäldern oder Support-Vektor-Maschinen zur Klassifizierung von Daten. Die Forschung in diesen Bereichen ist im Gange und es stehen bereits zahlreiche Codierungsbibliotheken für Personen zur Verfügung, die die AutoML-Technologie in ihre Projekte integrieren möchten.
Hutter sagte, der nächste Schritt bestehe darin, AutoML zu verwenden, um die Unsicherheit zu quantifizieren und Glaubwürdigkeits- und Fairnessprobleme im Algorithmus anzugehen. In dieser Vision würden die Kriterien für Vertrauenswürdigkeit und Fairness allen anderen Einschränkungen des maschinellen Lernens ähneln, beispielsweise der Genauigkeit. AutoML kann in diesen Algorithmen gefundene Verzerrungen erfassen und automatisch korrigieren, bevor sie veröffentlicht werden.
Aber für Anwendungen wie Deep Learning hat AutoML noch einen langen Weg vor sich. Die zum Trainieren von Deep-Learning-Modellen verwendeten Daten, etwa Bilder, Dokumente und aufgezeichnete Sprache, sind oft dicht und komplex. Für die Verarbeitung ist eine enorme Rechenleistung erforderlich. Die Kosten und der Zeitaufwand für das Trainieren dieser Modelle können für jeden unerschwinglich sein, außer für Forscher, die in großen Unternehmen mit großen finanziellen Mitteln arbeiten.
Eine der Wettbewerbsanforderungen auf der Konferenz besteht darin, dass die Teilnehmer energieeffiziente alternative Algorithmen für die Suche nach neuronalen Architekturen entwickeln. Dies ist eine ziemliche Herausforderung, da diese Technologie für ihren Rechenaufwand bekannt ist. Es durchläuft automatisch unzählige Deep-Learning-Modelle, um Forschern bei der Auswahl des richtigen Modells für ihre Anwendung zu helfen. Der Prozess kann jedoch Monate dauern und mehr als eine Million Dollar kosten.
Das Ziel dieser alternativen Algorithmen, sogenannte Zero-Cost-Suchagenten für neuronale Architekturen, besteht darin, die Suche in neuronalen Architekturen zugänglicher und umweltfreundlicher zu machen, indem der Rechenaufwand gesenkt wird. Es dauert Sekunden, bis die Ergebnisse vorliegen, nicht Monate. Derzeit befinden sich diese Techniken noch in einem frühen Entwicklungsstadium und sind oft unzuverlässig, aber Forscher des maschinellen Lernens gehen davon aus, dass sie das Potenzial haben, den Modellauswahlprozess effizienter zu gestalten.
Das obige ist der detaillierte Inhalt vonEntwickeln Sie KI einfacher mit der AutoML-Technologie. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!