


Self-Service-Maschinelles Lernen basierend auf intelligenten Datenbanken
Übersetzer |. Zhang Yi
Rezensent |. Liang Ce Sun Shujuan
1. Wie wird man ein IDO?
IDO (erkenntnisgesteuerte Organisation) bezieht sich auf eine erkenntnisgesteuerte (informationsorientierte) Organisation. Um ein IDO zu werden, benötigen Sie erstens Daten und die Tools zum Betreiben und Analysieren der Daten; zweitens einen Datenanalysten oder Datenwissenschaftler mit entsprechender Erfahrung und schließlich müssen Sie eine Technologie oder Methode finden, um eine erkenntnisbasierte Entscheidungsfindung umzusetzen; Prozesse im gesamten Unternehmen.
Maschinelles Lernen ist eine Technologie, die die Vorteile von Daten maximieren kann. Der ML-Prozess verwendet zunächst Daten, um ein Vorhersagemodell zu trainieren, und löst dann datenbezogene Probleme, nachdem das Training erfolgreich war. Unter ihnen sind künstliche neuronale Netze die effektivste Technologie, und ihr Design basiert auf unserem aktuellen Verständnis der Funktionsweise des menschlichen Gehirns. Angesichts der enormen Rechenressourcen, über die die Menschen derzeit verfügen, können unglaubliche Modelle erstellt werden, die auf riesigen Datenmengen trainiert werden.
Unternehmen können verschiedene Self-Service-Software und -Skripte verwenden, um verschiedene Aufgaben zu erledigen und so menschliches Versagen zu vermeiden. Ebenso können Sie Entscheidungen auf der Grundlage von Daten treffen, um menschliches Versagen zu vermeiden.
2. Warum setzen Unternehmen künstliche Intelligenz nur langsam ein?
Nur eine Minderheit der Unternehmen nutzt künstliche Intelligenz oder maschinelles Lernen, um Daten zu verarbeiten. Das US Census Bureau gab an, dass im Jahr 2020 weniger als 10 % der US-Unternehmen maschinelles Lernen eingeführt hatten (hauptsächlich große Unternehmen).
Zu den Hindernissen für die Einführung von ML gehören:
- KI muss noch viel Arbeit leisten, bevor sie den Menschen ersetzen kann. Erstens mangelt es vielen Unternehmen an Fachkräften und sie können sich diese auch nicht leisten. Datenwissenschaftler genießen in diesem Bereich ein hohes Ansehen, ihre Einstellung ist jedoch auch am teuersten.
- Mangel an verfügbaren Daten, Datensicherheit und zeitaufwändige Implementierung des ML-Algorithmus.
- Für Unternehmen ist es schwierig, ein Umfeld zu schaffen, in dem Daten und ihre Vorteile voll genutzt werden können. Dieses Umfeld erfordert entsprechende Tools, Prozesse und Strategien.
3. Nur automatische ML-Tools (AutoML) reichen für die Förderung des maschinellen Lernens nicht aus.
Obwohl die automatische ML-Plattform eine rosige Zukunft hat, ist ihre Abdeckung noch recht begrenzt ML kann Datenwissenschaftler bald ersetzen. Auch über die Aussage gibt es Kontroversen.
Wenn Sie Self-Service Machine Learning erfolgreich in Ihrem Unternehmen einsetzen wollen, sind AutoML-Tools zwar entscheidend, aber auch der Prozess, die Methoden und Strategien müssen beachtet werden. AutoML-Plattformen sind nur Werkzeuge, und die meisten ML-Experten glauben, dass dies nicht ausreicht.
4. Den maschinellen Lernprozess aufschlüsseln
Jeder ML-Prozess beginnt mit Daten. Es ist allgemein anerkannt, dass die Datenvorbereitung der wichtigste Teil des ML-Prozesses ist und der Modellierungsteil nur einen Teil der gesamten Datenpipeline darstellt, während er durch AutoML-Tools vereinfacht wird. Der gesamte Arbeitsablauf erfordert noch viel Arbeit, um die Daten zu transformieren und dem Modell zuzuführen. Datenvorbereitung und Datentransformation können zu den zeitaufwändigsten und unangenehmsten Teilen der Arbeit gehören.
Darüber hinaus werden auch die Geschäftsdaten, die zum Training von ML-Modellen verwendet werden, regelmäßig aktualisiert. Daher müssen Unternehmen komplexe ETL-Pipelines aufbauen, die komplexe Tools und Prozesse beherrschen. Daher ist die Sicherstellung der Kontinuität und Echtzeitfähigkeit des ML-Prozesses ebenfalls eine anspruchsvolle Aufgabe.
5. ML mit Anwendungen integrieren
Gehen wir nun davon aus, dass wir das ML-Modell erstellt haben und es dann bereitstellen müssen. Der klassische Bereitstellungsansatz behandelt es als Komponente der Anwendungsschicht, wie unten gezeigt:
Seine Eingabe sind die Daten und die Ausgabe ist die Vorhersage, die wir erhalten. Nutzen Sie die Ausgabe von ML-Modellen, indem Sie die APIs dieser Anwendungen integrieren. Aus Entwicklersicht scheint das alles einfach zu sein, nicht jedoch, wenn man über den Prozess nachdenkt. In einer großen Organisation kann die Integration und Wartung von Geschäftsanwendungen recht umständlich sein. Auch wenn das Unternehmen technisch versiert ist, muss jede Anfrage nach Codeänderungen einen spezifischen Überprüfungs- und Testprozess über mehrere Abteilungsebenen hinweg durchlaufen. Dies wirkt sich negativ auf die Flexibilität aus und erhöht die Komplexität des gesamten Arbeitsablaufs.
Wenn beim Testen verschiedener Konzepte und Ideen genügend Flexibilität vorhanden ist, wird die ML-basierte Entscheidungsfindung viel einfacher sein und daher werden die Menschen Produkte mit Selbstbedienungsfunktionen bevorzugen.
6. Self-Service-Maschinelles Lernen/intelligente Datenbank?
Wie wir oben gesehen haben, sind Daten der Kern des ML-Prozesses, bestehende ML-Tools nehmen die Daten auf und geben Vorhersagen zurück, und diese Vorhersagen liegen ebenfalls in Form von Daten vor.
Jetzt stellt sich die Frage:
- Warum sollten wir ML als eigenständige Anwendung behandeln und eine komplexe Integration zwischen ML-Modellen, -Anwendungen und -Datenbanken implementieren?
- Warum ML nicht zu einer Kernfunktion der Datenbank machen?
- Warum nicht ML-Modelle über Standard-Datenbanksyntax wie SQL verfügbar?
Lassen Sie uns die oben genannten Probleme und ihre Herausforderungen analysieren, um ML-Lösungen zu finden.
Herausforderung Nr. 1: Komplexe Datenintegration und ETL-Pipelines
Die Aufrechterhaltung komplexer Datenintegration und ETL-Pipelines zwischen ML-Modellen und Datenbanken ist eine der größten Herausforderungen für ML-Prozesse.
SQL ist ein hervorragendes Datenmanipulationstool, daher können wir dieses Problem lösen, indem wir ML-Modelle in die Datenschicht einführen. Mit anderen Worten: Das ML-Modell lernt in der Datenbank und gibt Vorhersagen zurück.
Herausforderung Nr. 2: Integration von ML-Modellen mit Anwendungen
Die Integration von ML-Modellen mit Geschäftsanwendungen über APIs ist eine weitere Herausforderung.
Geschäftsanwendungen und BI-Tools sind eng mit Datenbanken gekoppelt. Wenn das AutoML-Tool Teil der Datenbank wird, können wir daher die Standard-SQL-Syntax verwenden, um Vorhersagen zu treffen. Darüber hinaus ist eine API-Integration zwischen ML-Modellen und Geschäftsanwendungen nicht mehr erforderlich, da sich die Modelle in der Datenbank befinden.
Lösung: Einbetten von AutoML in die Datenbank
Das Einbetten von AutoML-Tools in die Datenbank bringt viele Vorteile mit sich, wie zum Beispiel:
- Jeder, der mit Daten arbeitet und SQL versteht (Datenanalyst oder Datenwissenschaftler), kann die Vorteile des maschinellen Lernens nutzen.
- Softwareentwickler können ML effizienter in Geschäftstools und -anwendungen einbetten.
- Keine komplexe Integration zwischen Daten und Modellen sowie zwischen Modellen und Geschäftsanwendungen erforderlich.
Auf diese Weise ändert sich das obige relativ komplexe Integrationsdiagramm wie folgt:
Es sieht einfacher aus und macht den ML-Prozess reibungsloser und effizienter.
7. So implementieren Sie Self-Service-ML mithilfe von Modellen als virtuelle Datenbanktabellen
Der nächste Schritt bei der Lösungsfindung ist die Implementierung.
Dafür verwenden wir eine Struktur namens AI Tables. Es bringt maschinelles Lernen in Form virtueller Tabellen auf die Datenplattform. Sie kann wie jede andere Datenbanktabelle erstellt und dann für Anwendungen, BI-Tools und DB-Clients verfügbar gemacht werden. Wir treffen Vorhersagen, indem wir einfach die Daten abfragen.
AI Tables wurde ursprünglich von MindsDB entwickelt und ist als Open Source oder Managed Cloud Service verfügbar. Sie integrieren traditionelle SQL- und NoSQL-Datenbanken wie Kafka und Redis.
8. Verwendung von AI Tables
Das Konzept von AI Tables ermöglicht es uns, den ML-Prozess in der Datenbank durchzuführen, sodass alle Schritte des ML-Prozesses (d. h. Datenvorbereitung, Modelltraining und Vorhersage) über die Datenbank durchgeführt werden können.
- KI-Tabellen trainieren
Zuerst müssen Benutzer eine KI-Tabelle entsprechend ihren eigenen Anforderungen erstellen, die einem maschinellen Lernmodell ähnelt und Funktionen enthält, die den Spalten der Quelltabelle entsprechen die AutoML-Engine selbst Modellierungsaufgaben. Beispiele werden später gegeben.
- Treffen Sie Vorhersagen
Sobald die KI-Tabelle erstellt ist, ist sie ohne weitere Bereitstellung einsatzbereit. Um Vorhersagen zu treffen, führen Sie einfach eine Standard-SQL-Abfrage für die AI-Tabelle aus.
Sie können Vorhersagen einzeln oder stapelweise treffen. AI Tables kann viele komplexe maschinelle Lernaufgaben bewältigen, wie zum Beispiel multivariate Zeitreihen, Anomalieerkennung usw.
9.Arbeitsbeispiel für KI-Tabellen
Für Einzelhändler ist es eine komplexe Aufgabe, sicherzustellen, dass Produkte zum richtigen Zeitpunkt auf Lager sind. Wenn die Nachfrage steigt, steigt das Angebot. Basierend auf diesen Daten und maschinellem Lernen können wir vorhersagen, wie viel Lagerbestand ein bestimmtes Produkt an einem bestimmten Tag haben sollte, was zu mehr Umsatz für Einzelhändler führt.
Zuerst müssen Sie die folgenden Informationen verfolgen und eine KI-Tabelle erstellen:
- Verkaufsdatum des Produkts (Verkaufsdatum)
- Geschäft des verkauften Produkts (Shop)
- Spezifisches verkauftes Produkt (Produktcode)
- Verkaufte Produktmenge (Menge)
Wie in der Abbildung unten gezeigt:
(1) KI-Tabellen trainieren
Um KI-Tabellen zu erstellen und zu trainieren, müssen Sie MindsDB zunächst den Zugriff auf die Daten erlauben. Detaillierte Anweisungen finden Sie in der MindsDB-Dokumentation.
AI-Tabellen sind wie ML-Modelle und erfordern historische Daten, um sie zu trainieren.
Im Folgenden wird ein einfacher SQL-Befehl verwendet, um eine AITable zu trainieren:
Lassen Sie uns diese Abfrage analysieren:
- Verwenden Sie die CREATE PREDICTOR-Anweisung in MindsDB.
- Definieren Sie die Quelldatenbank basierend auf historischen Daten.
- Trainieren Sie die KI-Tabelle basierend auf der historischen Datentabelle (historical_table), und die ausgewählten Spalten (Spalte_1 und Spalte_2) sind Funktionen, die für die Vorhersage verwendet werden.
- AutoML erledigt die verbleibenden Modellierungsaufgaben automatisch.
- MindsDB identifiziert den Datentyp jeder Spalte, normalisiert und codiert ihn und erstellt und trainiert das ML-Modell.
Gleichzeitig können Sie die allgemeine Genauigkeit und Zuverlässigkeit jeder Vorhersage sehen und abschätzen, welche Spalten (Merkmale) für das Ergebnis wichtiger sind.
In Datenbanken müssen wir häufig Aufgaben verarbeiten, die multivariate Zeitreihendaten mit hoher Kardinalität beinhalten. Mit herkömmlichen Methoden ist ein erheblicher Aufwand erforderlich, um solche ML-Modelle zu erstellen. Wir müssen die Daten gruppieren und basierend auf einem bestimmten Zeit-, Datums- oder Zeitstempel-Datenfeld sortieren.
Zum Beispiel prognostizieren wir die Anzahl der verkauften Hämmer in einem Baumarkt. Nun, die Daten werden nach Filiale und Produkt gruppiert und es werden Vorhersagen für jede unterschiedliche Filiale und Produktkombination erstellt. Dies bringt uns zu dem Problem, für jede Gruppe ein Zeitreihenmodell zu erstellen.
Das klingt nach einem riesigen Projekt, aber MindsDB bietet eine Methode zum Erstellen eines einzelnen ML-Modells mithilfe der GROUP BY-Anweisung, um multivariate Zeitreihendaten auf einmal zu trainieren. Sehen wir uns an, wie es mit nur einem SQL-Befehl gemacht wird:
Der stock_forecaster-Prädiktor wird erstellt, um vorherzusagen, wie viele Artikel ein bestimmtes Geschäft in Zukunft verkaufen wird . Die Daten werden nach Verkaufsdatum sortiert und nach Filiale gruppiert. So können wir den Umsatz für jedes Geschäft vorhersagen. (2) Batch-Vorhersage Erhalten Sie Stapelvorhersagen für viele Datensätze gleichzeitig.
Weitere Informationen zum Analysieren und Visualisieren von Vorhersagen in BI-Tools finden Sie in diesem Artikel. (3) Praktische Anwendung
Der traditionelle Ansatz behandelt ML-Modelle als unabhängige Anwendungen, die die Wartung von ETL-Pipelines zur Datenbank und die API-Integration in Geschäftsanwendungen erfordern. Obwohl AutoML-Tools den Modellierungsteil einfach und unkompliziert machen, erfordert die Verwaltung des gesamten ML-Workflows immer noch erfahrene Experten. Tatsächlich ist die Datenbank bereits das bevorzugte Werkzeug für die Datenaufbereitung, daher ist es sinnvoller, ML in die Datenbank einzuführen, als Daten in ML einzuführen. Da sich AutoML-Tools in der Datenbank befinden, bietet das AI-Tables-Konstrukt von MindsDB Datenanwendern Self-Service-AutoML und optimiert Arbeitsabläufe für maschinelles Lernen.
Originallink: https://dzone.com/articles/self-service-machine-learning-with-intelligent-datEinführung des Übersetzers Zhang Yi, 51CTO-Community-Redakteur, Ingenieur mittlerer Ebene. Erforscht hauptsächlich die Implementierung von Algorithmen und Szenarioanwendungen für künstliche Intelligenz, verfügt über ein Verständnis und eine Beherrschung von Algorithmen für maschinelles Lernen und automatische Steuerungsalgorithmen und wird weiterhin auf die Entwicklungstrends der Technologie für künstliche Intelligenz im In- und Ausland achten, insbesondere auf die Anwendung künstlicher Intelligenz Intelligenztechnologie in intelligenten vernetzten Autos und Smart Homes. Spezifische Implementierung und Anwendungen in anderen Bereichen.
Das obige ist der detaillierte Inhalt vonSelf-Service-Maschinelles Lernen basierend auf intelligenten Datenbanken. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Zu den häufigsten Herausforderungen, mit denen Algorithmen für maschinelles Lernen in C++ konfrontiert sind, gehören Speicherverwaltung, Multithreading, Leistungsoptimierung und Wartbarkeit. Zu den Lösungen gehören die Verwendung intelligenter Zeiger, moderner Threading-Bibliotheken, SIMD-Anweisungen und Bibliotheken von Drittanbietern sowie die Einhaltung von Codierungsstilrichtlinien und die Verwendung von Automatisierungstools. Praktische Fälle zeigen, wie man die Eigen-Bibliothek nutzt, um lineare Regressionsalgorithmen zu implementieren, den Speicher effektiv zu verwalten und leistungsstarke Matrixoperationen zu nutzen.

Maschinelles Lernen ist ein wichtiger Zweig der künstlichen Intelligenz, der Computern die Möglichkeit gibt, aus Daten zu lernen und ihre Fähigkeiten zu verbessern, ohne explizit programmiert zu werden. Maschinelles Lernen hat ein breites Anwendungsspektrum in verschiedenen Bereichen, von der Bilderkennung und der Verarbeitung natürlicher Sprache bis hin zu Empfehlungssystemen und Betrugserkennung, und es verändert unsere Lebensweise. Im Bereich des maschinellen Lernens gibt es viele verschiedene Methoden und Theorien, von denen die fünf einflussreichsten Methoden als „Fünf Schulen des maschinellen Lernens“ bezeichnet werden. Die fünf Hauptschulen sind die symbolische Schule, die konnektionistische Schule, die evolutionäre Schule, die Bayes'sche Schule und die Analogieschule. 1. Der Symbolismus, auch Symbolismus genannt, betont die Verwendung von Symbolen zum logischen Denken und zum Ausdruck von Wissen. Diese Denkrichtung glaubt, dass Lernen ein Prozess der umgekehrten Schlussfolgerung durch das Vorhandene ist

Übersetzer |. Rezensiert von Li Rui |. Chonglou Modelle für künstliche Intelligenz (KI) und maschinelles Lernen (ML) werden heutzutage immer komplexer, und die von diesen Modellen erzeugten Ergebnisse sind eine Blackbox, die den Stakeholdern nicht erklärt werden kann. Explainable AI (XAI) zielt darauf ab, dieses Problem zu lösen, indem es Stakeholdern ermöglicht, die Funktionsweise dieser Modelle zu verstehen, sicherzustellen, dass sie verstehen, wie diese Modelle tatsächlich Entscheidungen treffen, und Transparenz in KI-Systemen, Vertrauen und Verantwortlichkeit zur Lösung dieses Problems gewährleistet. In diesem Artikel werden verschiedene Techniken der erklärbaren künstlichen Intelligenz (XAI) untersucht, um ihre zugrunde liegenden Prinzipien zu veranschaulichen. Mehrere Gründe, warum erklärbare KI von entscheidender Bedeutung ist. Vertrauen und Transparenz: Damit KI-Systeme allgemein akzeptiert und vertrauenswürdig sind, müssen Benutzer verstehen, wie Entscheidungen getroffen werden

In C++ umfasst die Implementierung von Algorithmen für maschinelles Lernen: Lineare Regression: Wird zur Vorhersage kontinuierlicher Variablen verwendet. Zu den Schritten gehören das Laden von Daten, das Berechnen von Gewichtungen und Verzerrungen, das Aktualisieren von Parametern und die Vorhersage. Logistische Regression: Wird zur Vorhersage diskreter Variablen verwendet. Der Prozess ähnelt der linearen Regression, verwendet jedoch die Sigmoidfunktion zur Vorhersage. Support Vector Machine: Ein leistungsstarker Klassifizierungs- und Regressionsalgorithmus, der die Berechnung von Support-Vektoren und die Vorhersage von Beschriftungen umfasst.

Apples neueste Versionen der iOS18-, iPadOS18- und macOS Sequoia-Systeme haben der Fotoanwendung eine wichtige Funktion hinzugefügt, die Benutzern dabei helfen soll, aus verschiedenen Gründen verlorene oder beschädigte Fotos und Videos einfach wiederherzustellen. Mit der neuen Funktion wird im Abschnitt „Extras“ der Fotos-App ein Album mit dem Namen „Wiederhergestellt“ eingeführt, das automatisch angezeigt wird, wenn ein Benutzer Bilder oder Videos auf seinem Gerät hat, die nicht Teil seiner Fotobibliothek sind. Das Aufkommen des Albums „Wiederhergestellt“ bietet eine Lösung für Fotos und Videos, die aufgrund einer Datenbankbeschädigung verloren gehen, die Kameraanwendung nicht korrekt in der Fotobibliothek speichert oder eine Drittanbieteranwendung die Fotobibliothek verwaltet. Benutzer benötigen nur wenige einfache Schritte

So verwenden Sie MySQLi zum Herstellen einer Datenbankverbindung in PHP: MySQLi-Erweiterung einbinden (require_once) Verbindungsfunktion erstellen (functionconnect_to_db) Verbindungsfunktion aufrufen ($conn=connect_to_db()) Abfrage ausführen ($result=$conn->query()) Schließen Verbindung ( $conn->close())

Um Datenbankverbindungsfehler in PHP zu behandeln, können Sie die folgenden Schritte ausführen: Verwenden Sie mysqli_connect_errno(), um den Fehlercode abzurufen. Verwenden Sie mysqli_connect_error(), um die Fehlermeldung abzurufen. Durch die Erfassung und Protokollierung dieser Fehlermeldungen können Datenbankverbindungsprobleme leicht identifiziert und behoben werden, wodurch der reibungslose Betrieb Ihrer Anwendung gewährleistet wird.

Nutzen Sie maschinelles Lernen in Golang, um intelligente Algorithmen und datengesteuerte Lösungen zu entwickeln: Installieren Sie die Gonum-Bibliothek für Algorithmen und Dienstprogramme für maschinelles Lernen. Lineare Regression mit dem LinearRegression-Modell von Gonum, einem überwachten Lernalgorithmus. Trainieren Sie das Modell mithilfe von Trainingsdaten, die Eingabevariablen und Zielvariablen enthalten. Prognostizieren Sie Immobilienpreise auf der Grundlage neuer Merkmale, aus denen das Modell eine lineare Beziehung ermittelt.
