Haben Sie bei KI-Projekten schon einmal diese fatalen Fehler gemacht?

WBOY
Freigeben: 2023-04-20 08:10:06
nach vorne
820 Leute haben es durchsucht

​Übersetzer |. Bugatti

Rezensent |.Da Daten der Kern der künstlichen Intelligenz (KI) sind, ist es nicht verwunderlich, dass KI- und maschinelle Lernsysteme (ML) zum Lernen genügend hochwertige Daten benötigen. Um ein KI- oder ML-System richtig zu trainieren, sind insbesondere bei überwachten Lernmethoden in der Regel große Mengen hochwertiger Daten erforderlich. Wie viele Daten erforderlich sind, hängt vom implementierten KI-Modell, den verwendeten Algorithmen und anderen Faktoren wie internen Daten und Daten Dritter ab. Beispielsweise erfordern neuronale Netze große Datenmengen zum Trainieren, während Entscheidungsbäume oder Bayes'sche Klassifikatoren nicht so viele Daten benötigen, um qualitativ hochwertige Ergebnisse zu erhalten.

Man denkt also vielleicht, je mehr Daten, desto besser, oder? Bitte denken Sie noch einmal darüber nach. Organisationen mit großen Datenmengen (sogar Exabytes) erkennen, dass mehr Daten das Problem nicht wie erwartet lösen. Tatsächlich bringen mehr Daten auch mehr Fragen mit sich. Je mehr Daten Sie haben, desto mehr Daten müssen Sie bereinigen und vorbereiten, je mehr Daten Sie kennzeichnen und verwalten müssen, desto mehr Daten müssen Sie sichern, schützen, Voreingenommenheit reduzieren und andere Maßnahmen ergreifen. Wenn man anfängt, die Datenmenge zu erhöhen, können aus kleinen Projekten schnell große Projekte werden. Tatsächlich führen große Datenmengen oft zum Scheitern von Projekten.

Der fehlende Schritt zwischen der Identifizierung eines Geschäftsproblems und der Organisation von Daten zur Lösung dieses Problems besteht eindeutig darin, zu bestimmen, welche Daten benötigt werden und wie viele davon tatsächlich benötigt werden. Sie benötigen genügend Daten, haben aber nicht zu viele: nicht mehr und nicht weniger, genau richtig. Leider stürzen sich Unternehmen oft in KI-Projekte, ohne die Daten zu verstehen. Organisationen müssen viele Fragen beantworten, darunter herauszufinden, wo sich die Daten befinden, wie viele Daten sie bereits haben, in welchem ​​Zustand sie sich befinden, welche Merkmale der Daten am wichtigsten sind, interne und externe Verwendungen der Daten, Herausforderungen beim Datenzugriff und Anforderungen zur Verbesserung bestehender Daten sowie anderer Schlüsselfaktoren und Fragen. Ohne die Beantwortung dieser Fragen können KI-Projekte scheitern oder sogar in einem Datenmeer untergehen.

1. Die Daten besser verstehen

Um zu verstehen, wie viele Daten Sie benötigen, müssen Sie zunächst verstehen, wo sich die Daten in der Struktur des KI-Projekts befinden. Eine visuelle Möglichkeit, den zunehmenden Wert, den wir aus Daten ziehen, zu verstehen, ist die „DIKUW-Pyramide“ (manchmal auch „DIKW-Pyramide“ genannt), die zeigt, wie die Datengrundlage durch Informationen, Wissen, Verständnis und Weisheit transformiert werden kann größeren Wert.

Mit einer soliden Datengrundlage können Sie auf der nächsten Informationsebene tiefere Einblicke gewinnen, die Ihnen bei der Beantwortung grundlegender Fragen zu diesen Daten helfen können. Sobald Sie grundlegende Verbindungen zwischen Daten hergestellt haben, um Erkenntnisse zu gewinnen, können Sie Muster in diesen Informationen finden und verstehen, wie die Informationsteile miteinander verbunden sind, um tiefere Erkenntnisse zu gewinnen. Organisationen können einen größeren Mehrwert erzielen, indem sie auf der Wissensebene aufbauen und verstehen, warum diese Muster auftreten, und so dabei helfen, die zugrunde liegenden Muster zu verstehen. Schließlich können Sie den größtmöglichen Nutzen aus Informationen auf der Intelligenzebene ziehen, indem Sie die Ursache und Wirkung von Informationsentscheidungen genau verstehen.

Die jüngste KI-Welle konzentriert sich vor allem auf die Wissensschicht, da maschinelles Lernen Erkenntnisse liefert, um Muster auf der Informationsschicht zu erkennen. Leider stößt maschinelles Lernen auf der Verständnisebene auf einen Engpass, da das Finden von Mustern nicht ausreicht, um Rückschlüsse zu ziehen. Wir verfügen über maschinelles Lernen, aber nicht über maschinelles Denken, um zu verstehen, warum Muster auftreten. Sie sehen diese Einschränkung jedes Mal, wenn Sie mit einem Chatbot interagieren. Während die auf maschinellem Lernen basierende Verarbeitung natürlicher Sprache (NLP) sehr gut darin ist, menschliche Sprache zu verstehen und Absichten abzuleiten, stößt sie beim Versuch, sie zu verstehen und zu begründen, an Grenzen. Wenn Sie beispielsweise einen Sprachassistenten fragen, ob Sie morgen einen Regenmantel tragen möchten, versteht dieser nicht, dass Sie nach dem Wetter fragen. Es liegt an den Menschen, den Maschinen diese Erkenntnisse zu vermitteln, denn der Sprachassistent hat keine Ahnung, was Regen eigentlich ist.

2. Bleiben Sie datenbewusst, um Fehler zu vermeiden

Big Data hat uns gelehrt, mit großen Datenmengen umzugehen. Nicht nur, wie die Daten gespeichert werden, sondern auch, wie all diese Daten verarbeitet, manipuliert und analysiert werden. Maschinelles Lernen bietet noch mehr Mehrwert, indem es die verschiedenen Arten unstrukturierter, halbstrukturierter oder strukturierter Daten verarbeitet, die Unternehmen sammeln. Tatsächlich handelt es sich bei dieser jüngsten KI-Welle um eine Welle von Big-Data-gesteuerten Analysen.

Aber genau aus diesem Grund müssen einige Organisationen einen großen Rückschlag in Sachen KI hinnehmen. Anstatt KI-Projekte aus einer datenzentrierten Perspektive durchzuführen, konzentrieren sie sich auf die funktionalen Aspekte. Um KI-Projekte zu steuern und fatale Fehler zu vermeiden, müssen Unternehmen nicht nur KI und maschinelles Lernen, sondern auch die verschiedenen „Vs“ von Big Data besser verstehen. Es geht nicht nur um die Menge der Daten, sondern auch um die Art der Daten. Zu den Vs von Big Data gehören:

  • Menge: Die absolute Menge an Big Data im Besitz.
  • Geschwindigkeit: Die Geschwindigkeit, mit der sich Big Data verändert. Der erfolgreiche Einsatz von KI bedeutet, KI auf Hochgeschwindigkeitsdaten anzuwenden.
  • Vielfalt: Daten können in vielen verschiedenen Formaten vorliegen, darunter strukturierte Daten wie Datenbanken, halbstrukturierte Daten wie Rechnungen und unstrukturierte Daten wie E-Mails, Bilder und Videodateien. Erfolgreiche KI-Systeme können mit dieser Vielfalt umgehen.
  • Authentizität: Dies bezieht sich auf die Qualität und Genauigkeit der Daten und darauf, wie sehr Sie diesen Daten vertrauen. Müll rein, Müll raus, insbesondere in datengesteuerten KI-Systemen. Daher müssen erfolgreiche KI-Systeme in der Lage sein, mit stark unterschiedlichen Datenqualitäten umzugehen.

Mit jahrzehntelanger Erfahrung im Management von Big-Data-Projekten haben Organisationen, die im Bereich KI erfolgreich sind, vor allem im Bereich Big Data Erfolg gehabt. Organisationen, die das Scheitern von KI-Projekten erlebt haben, gehen KI-Probleme oft mit einer anwendungsentwicklungsorientierten Denkweise an.

3. Übermäßige falsche Daten und unzureichende korrekte Daten töten KI-Projekte.

Obwohl KI-Projekte korrekt gestartet werden, scheitern der Mangel an notwendigen Daten, mangelndes Verständnis und ungelöste praktische Probleme. Unternehmen schreiten immer weiter voran, ohne ein wirkliches Verständnis der erforderlichen Daten und Datenqualität zu haben, was zu echten Herausforderungen führt.

Einer der Gründe, warum Unternehmen diesen Datenfehler machen, ist, dass sie bei der Arbeit an KI-Projekten über keine echte Methodik verfügen, außer der Verwendung agiler oder Anwendungsentwicklungsmethoden. Doch erfolgreiche Unternehmen haben erkannt, dass die Verwendung eines datenzentrierten Ansatzes das Datenverständnis als erste Phase eines Projektansatzes einschließt. Der CRISP-DM-Ansatz, den es seit mehr als 20 Jahren gibt, spezifiziert das Datenverständnis als nächsten Schritt nach der Identifizierung der Geschäftsanforderungen. Basierend auf CRISP-DM und kombiniert mit agilen Methoden erfordert der Cognitive Project Management with AI (CPMAI)-Ansatz in der zweiten Phase Datenverständnis. Andere erfolgreiche Ansätze erfordern auch ein frühes Verständnis der Daten im Projekt, denn schließlich sind KI-Projekte Datenprojekte. Wie baut man ein erfolgreiches Programm auf Daten auf, wenn man es angeht, ohne die Daten zu verstehen? Dies ist definitiv ein fataler Fehler, den Sie vermeiden möchten.

Originallink: https://www.forbes.com/sites/cognitiveworld/2022/08/20/are-you-making-these-deadly-mistakes-with-your-ai-projects/?sh= 352955946b54

Das obige ist der detaillierte Inhalt vonHaben Sie bei KI-Projekten schon einmal diese fatalen Fehler gemacht?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:51cto.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage