Es ist seit langem ein zentraler Schwerpunkt der Datenbranche.
Data Governance umfasst alle Maßnahmen, um sicherzustellen, dass Daten sicher, privat, genau, verfügbar und zuverlässig sind, einschließlich der Entwicklung interner Standards und Datenrichtlinien zur Regulierung der Erhebung, Speicherung, Verarbeitung und Entsorgung von Daten. Dieser Prozess ist für den Schutz der Privatsphäre der Benutzer und die Wahrung der Datenintegrität von entscheidender Bedeutung.
Wie diese Definition betont, geht es bei Data Governance um die Verwaltung von Daten – genauer gesagt, der Engine, die KI-Modelle antreibt.
Während der Zusammenhang zwischen Data Governance und KI zunächst offensichtlich ist, stellt die Verknüpfung mit KI-Müdigkeit durch die Hervorhebung der Ursachen von Müdigkeit sicher, dass der Begriff im gesamten Artikel konsistent verwendet wird.
KI-Müdigkeit kann aufgrund von Rückschlägen und Herausforderungen auftreten, denen ein Unternehmen, ein Entwickler oder ein Team gegenübersteht, was zu einer behinderten Implementierung oder Wertschöpfung von KI-Systemen führt.
Der Hauptgrund für die Überbewertung der KI sind unrealistische Erwartungen an ihre Fähigkeiten. Stakeholder müssen sich über die Fähigkeiten, Möglichkeiten, Grenzen und Risiken der KI im Klaren sein, um ihren Wert und ihre Anwendungen richtig einschätzen zu können.
Wenn es um Risiken geht, wird Ethik oft als zweitrangig betrachtet, was dazu führt, dass nicht konforme KI-Initiativen aufgegeben werden.
Sie fragen sich bestimmt, welche Rolle die Datenverwaltung bei der Entstehung von KI-Müdigkeit spielt – das ist die Prämisse dieses Artikels.
Hierhin gehen wir als nächstes.
KI-Müdigkeit kann grob in die Phasen vor und nach der Bereitstellung unterteilt werden. Konzentrieren wir uns zunächst auf die Arbeit vor der Bereitstellung.
Es gibt viele Faktoren, die bei der Aktualisierung eines Proof of Concept (PoC) auf die Bereitstellung eine Rolle spielen, wie zum Beispiel:
Unternehmen können von einem Geschäftsproblem zum nächsten wechseln, was zu Müdigkeit führt. Wenn die zugrunde liegenden Daten jedoch kein reichhaltiges Signal enthalten, kann kein KI-Algorithmus darauf aufgebaut werden, und das Modell muss statistische Zusammenhänge aus den Trainingsdaten lernen, um auf unsichtbare Daten zu verallgemeinern.
Nach der Bereitstellung
Obwohl das trainierte Modell vielversprechende Ergebnisse im Validierungssatz zeigt, kann es dennoch vorkommen, dass das Modell in der Produktionsumgebung auf der Grundlage qualifizierter Geschäftskriterien, wie z. B. 70 % Genauigkeitsmüdigkeit, nicht die richtige Leistung erbringt.
Unzählige Gründe können zu Leistungseinbußen führen, und schlechte Datenqualität ist das häufigste Problem des Modells, das die Fähigkeit des Modells einschränkt, Zielreaktionen ohne Schlüsselattribute genau vorherzusagen.
Bedenken Sie, dass eines der wesentlichen Merkmale, das nur in 10 % der Trainingsdaten fehlte, in den Produktionsdaten nun in 50 % der Fälle zu Null wird, was zu falschen Vorhersagen und Bemühungen führt, sicherzustellen, dass das Modell konsistent funktioniert Dies führt dazu, dass Datenwissenschaftler und Geschäftsteams erschöpft sind, was das Vertrauen in die Datenpipeline untergräbt und Projektinvestitionen gefährdet.
Data Governance ist der Schlüssel
Robuste Data Governance-Maßnahmen sind entscheidend, um beiden Arten der KI-Müdigkeit entgegenzuwirken. Da Daten den Kern von ML-Modellen bilden, sind signalreiche, fehlerfreie und qualitativ hochwertige Daten für den Erfolg von ML-Projekten erforderlich. Die Bekämpfung der KI-Müdigkeit erfordert einen starken Fokus auf Daten-Governance. Deshalb müssen wir rigoros daran arbeiten, die richtige Datenqualität sicherzustellen und so den Grundstein für den Aufbau hochmoderner Modelle und die Bereitstellung vertrauenswürdiger Geschäftserkenntnisse zu legen.
Datenqualität ist der Schlüssel zu einer erfolgreichen Datenverwaltung und ein entscheidender Faktor für den Erfolg von Algorithmen für maschinelles Lernen. Unternehmen müssen in die Datenqualität investieren, beispielsweise durch die Veröffentlichung von Berichten für Datenkonsumenten. Denken Sie bei datenwissenschaftlichen Projekten darüber nach, was passiert, wenn Daten von schlechter Qualität in das Modell eingehen, was zu einer schlechten Leistung führen kann.
Natürlich ist es nicht nur der Aufwand, der dahintersteckt, sondern es geht auch viel Zeit verloren, bis mit der Eingabe der richtigen Daten begonnen wird.
Daher wird immer empfohlen, Datenprobleme an der Quelle zu beheben, um solche zeitaufwändigen Iterationen zu verhindern. Letztlich implizieren veröffentlichte Datenqualitätsberichte, dass das Data-Science-Team (oder alle anderen nachgeschalteten Benutzer und Datenkonsumenten) die akzeptable Qualität der eingehenden Daten versteht.
Ohne Datenqualitäts- und Governance-Maßnahmen werden Datenwissenschaftler mit Datenproblemen überhäuft, was zu erfolglosen Modellen führt, die zu KI-Müdigkeit führen.
Dieser Artikel beleuchtet die beiden Phasen des Beginns der KI-Müdigkeit und beschreibt, wie Data-Governance-Maßnahmen wie Datenqualitätsberichte die Erstellung vertrauenswürdiger und robuster Modelle vorantreiben können.
Durch die Schaffung einer soliden Grundlage durch Data Governance können Unternehmen einen Fahrplan für eine erfolgreiche und nahtlose KI-Entwicklung und -Einführung erstellen und so Begeisterung wecken.
Um sicherzustellen, dass dieser Artikel einen umfassenden Überblick über die verschiedenen Möglichkeiten zum Umgang mit KI-Müdigkeit bietet, betone ich auch die Rolle der Organisationskultur, die in Kombination mit anderen Best Practices wie Data Governance es Data-Science-Teams ermöglichen wird, schneller und effizienter zu arbeiten Erstellen Sie schnell sinnvolle KI-Beiträge.
Das obige ist der detaillierte Inhalt vonKann KI-Müdigkeit durch Data Governance gelöst werden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!