Inhaltsverzeichnis
Um zu verstehen, wie viele Daten Sie benötigen, müssen Sie zunächst verstehen, wo sich die Daten in der Struktur des KI-Projekts befinden. Eine visuelle Möglichkeit, den zunehmenden Wert, den wir aus Daten ziehen, zu verstehen, ist die „DIKUW-Pyramide“ (manchmal auch „DIKW-Pyramide“ genannt), die zeigt, wie die Datengrundlage durch Informationen, Wissen, Verständnis und Weisheit transformiert werden kann größeren Wert.
Big Data hat uns gelehrt, mit großen Datenmengen umzugehen. Nicht nur, wie die Daten gespeichert werden, sondern auch, wie all diese Daten verarbeitet, manipuliert und analysiert werden. Maschinelles Lernen bietet noch mehr Mehrwert, indem es die verschiedenen Arten unstrukturierter, halbstrukturierter oder strukturierter Daten verarbeitet, die Unternehmen sammeln. Tatsächlich handelt es sich bei dieser jüngsten KI-Welle um eine Welle von Big-Data-gesteuerten Analysen.
3. Übermäßige falsche Daten und unzureichende korrekte Daten töten KI-Projekte.
Heim Technologie-Peripheriegeräte KI Haben Sie bei KI-Projekten schon einmal diese fatalen Fehler gemacht?

Haben Sie bei KI-Projekten schon einmal diese fatalen Fehler gemacht?

Apr 20, 2023 am 08:10 AM
项目 ai 数据

​Übersetzer |. Bugatti

Rezensent |.Da Daten der Kern der künstlichen Intelligenz (KI) sind, ist es nicht verwunderlich, dass KI- und maschinelle Lernsysteme (ML) zum Lernen genügend hochwertige Daten benötigen. Um ein KI- oder ML-System richtig zu trainieren, sind insbesondere bei überwachten Lernmethoden in der Regel große Mengen hochwertiger Daten erforderlich. Wie viele Daten erforderlich sind, hängt vom implementierten KI-Modell, den verwendeten Algorithmen und anderen Faktoren wie internen Daten und Daten Dritter ab. Beispielsweise erfordern neuronale Netze große Datenmengen zum Trainieren, während Entscheidungsbäume oder Bayes'sche Klassifikatoren nicht so viele Daten benötigen, um qualitativ hochwertige Ergebnisse zu erhalten.

Man denkt also vielleicht, je mehr Daten, desto besser, oder? Bitte denken Sie noch einmal darüber nach. Organisationen mit großen Datenmengen (sogar Exabytes) erkennen, dass mehr Daten das Problem nicht wie erwartet lösen. Tatsächlich bringen mehr Daten auch mehr Fragen mit sich. Je mehr Daten Sie haben, desto mehr Daten müssen Sie bereinigen und vorbereiten, je mehr Daten Sie kennzeichnen und verwalten müssen, desto mehr Daten müssen Sie sichern, schützen, Voreingenommenheit reduzieren und andere Maßnahmen ergreifen. Wenn man anfängt, die Datenmenge zu erhöhen, können aus kleinen Projekten schnell große Projekte werden. Tatsächlich führen große Datenmengen oft zum Scheitern von Projekten.

Der fehlende Schritt zwischen der Identifizierung eines Geschäftsproblems und der Organisation von Daten zur Lösung dieses Problems besteht eindeutig darin, zu bestimmen, welche Daten benötigt werden und wie viele davon tatsächlich benötigt werden. Sie benötigen genügend Daten, haben aber nicht zu viele: nicht mehr und nicht weniger, genau richtig. Leider stürzen sich Unternehmen oft in KI-Projekte, ohne die Daten zu verstehen. Organisationen müssen viele Fragen beantworten, darunter herauszufinden, wo sich die Daten befinden, wie viele Daten sie bereits haben, in welchem ​​Zustand sie sich befinden, welche Merkmale der Daten am wichtigsten sind, interne und externe Verwendungen der Daten, Herausforderungen beim Datenzugriff und Anforderungen zur Verbesserung bestehender Daten sowie anderer Schlüsselfaktoren und Fragen. Ohne die Beantwortung dieser Fragen können KI-Projekte scheitern oder sogar in einem Datenmeer untergehen.

1. Die Daten besser verstehen

Um zu verstehen, wie viele Daten Sie benötigen, müssen Sie zunächst verstehen, wo sich die Daten in der Struktur des KI-Projekts befinden. Eine visuelle Möglichkeit, den zunehmenden Wert, den wir aus Daten ziehen, zu verstehen, ist die „DIKUW-Pyramide“ (manchmal auch „DIKW-Pyramide“ genannt), die zeigt, wie die Datengrundlage durch Informationen, Wissen, Verständnis und Weisheit transformiert werden kann größeren Wert.

Mit einer soliden Datengrundlage können Sie auf der nächsten Informationsebene tiefere Einblicke gewinnen, die Ihnen bei der Beantwortung grundlegender Fragen zu diesen Daten helfen können. Sobald Sie grundlegende Verbindungen zwischen Daten hergestellt haben, um Erkenntnisse zu gewinnen, können Sie Muster in diesen Informationen finden und verstehen, wie die Informationsteile miteinander verbunden sind, um tiefere Erkenntnisse zu gewinnen. Organisationen können einen größeren Mehrwert erzielen, indem sie auf der Wissensebene aufbauen und verstehen, warum diese Muster auftreten, und so dabei helfen, die zugrunde liegenden Muster zu verstehen. Schließlich können Sie den größtmöglichen Nutzen aus Informationen auf der Intelligenzebene ziehen, indem Sie die Ursache und Wirkung von Informationsentscheidungen genau verstehen.

Die jüngste KI-Welle konzentriert sich vor allem auf die Wissensschicht, da maschinelles Lernen Erkenntnisse liefert, um Muster auf der Informationsschicht zu erkennen. Leider stößt maschinelles Lernen auf der Verständnisebene auf einen Engpass, da das Finden von Mustern nicht ausreicht, um Rückschlüsse zu ziehen. Wir verfügen über maschinelles Lernen, aber nicht über maschinelles Denken, um zu verstehen, warum Muster auftreten. Sie sehen diese Einschränkung jedes Mal, wenn Sie mit einem Chatbot interagieren. Während die auf maschinellem Lernen basierende Verarbeitung natürlicher Sprache (NLP) sehr gut darin ist, menschliche Sprache zu verstehen und Absichten abzuleiten, stößt sie beim Versuch, sie zu verstehen und zu begründen, an Grenzen. Wenn Sie beispielsweise einen Sprachassistenten fragen, ob Sie morgen einen Regenmantel tragen möchten, versteht dieser nicht, dass Sie nach dem Wetter fragen. Es liegt an den Menschen, den Maschinen diese Erkenntnisse zu vermitteln, denn der Sprachassistent hat keine Ahnung, was Regen eigentlich ist.

2. Bleiben Sie datenbewusst, um Fehler zu vermeiden

Big Data hat uns gelehrt, mit großen Datenmengen umzugehen. Nicht nur, wie die Daten gespeichert werden, sondern auch, wie all diese Daten verarbeitet, manipuliert und analysiert werden. Maschinelles Lernen bietet noch mehr Mehrwert, indem es die verschiedenen Arten unstrukturierter, halbstrukturierter oder strukturierter Daten verarbeitet, die Unternehmen sammeln. Tatsächlich handelt es sich bei dieser jüngsten KI-Welle um eine Welle von Big-Data-gesteuerten Analysen.

Aber genau aus diesem Grund müssen einige Organisationen einen großen Rückschlag in Sachen KI hinnehmen. Anstatt KI-Projekte aus einer datenzentrierten Perspektive durchzuführen, konzentrieren sie sich auf die funktionalen Aspekte. Um KI-Projekte zu steuern und fatale Fehler zu vermeiden, müssen Unternehmen nicht nur KI und maschinelles Lernen, sondern auch die verschiedenen „Vs“ von Big Data besser verstehen. Es geht nicht nur um die Menge der Daten, sondern auch um die Art der Daten. Zu den Vs von Big Data gehören:

  • Menge: Die absolute Menge an Big Data im Besitz.
  • Geschwindigkeit: Die Geschwindigkeit, mit der sich Big Data verändert. Der erfolgreiche Einsatz von KI bedeutet, KI auf Hochgeschwindigkeitsdaten anzuwenden.
  • Vielfalt: Daten können in vielen verschiedenen Formaten vorliegen, darunter strukturierte Daten wie Datenbanken, halbstrukturierte Daten wie Rechnungen und unstrukturierte Daten wie E-Mails, Bilder und Videodateien. Erfolgreiche KI-Systeme können mit dieser Vielfalt umgehen.
  • Authentizität: Dies bezieht sich auf die Qualität und Genauigkeit der Daten und darauf, wie sehr Sie diesen Daten vertrauen. Müll rein, Müll raus, insbesondere in datengesteuerten KI-Systemen. Daher müssen erfolgreiche KI-Systeme in der Lage sein, mit stark unterschiedlichen Datenqualitäten umzugehen.

Mit jahrzehntelanger Erfahrung im Management von Big-Data-Projekten haben Organisationen, die im Bereich KI erfolgreich sind, vor allem im Bereich Big Data Erfolg gehabt. Organisationen, die das Scheitern von KI-Projekten erlebt haben, gehen KI-Probleme oft mit einer anwendungsentwicklungsorientierten Denkweise an.

3. Übermäßige falsche Daten und unzureichende korrekte Daten töten KI-Projekte.

Obwohl KI-Projekte korrekt gestartet werden, scheitern der Mangel an notwendigen Daten, mangelndes Verständnis und ungelöste praktische Probleme. Unternehmen schreiten immer weiter voran, ohne ein wirkliches Verständnis der erforderlichen Daten und Datenqualität zu haben, was zu echten Herausforderungen führt.

Einer der Gründe, warum Unternehmen diesen Datenfehler machen, ist, dass sie bei der Arbeit an KI-Projekten über keine echte Methodik verfügen, außer der Verwendung agiler oder Anwendungsentwicklungsmethoden. Doch erfolgreiche Unternehmen haben erkannt, dass die Verwendung eines datenzentrierten Ansatzes das Datenverständnis als erste Phase eines Projektansatzes einschließt. Der CRISP-DM-Ansatz, den es seit mehr als 20 Jahren gibt, spezifiziert das Datenverständnis als nächsten Schritt nach der Identifizierung der Geschäftsanforderungen. Basierend auf CRISP-DM und kombiniert mit agilen Methoden erfordert der Cognitive Project Management with AI (CPMAI)-Ansatz in der zweiten Phase Datenverständnis. Andere erfolgreiche Ansätze erfordern auch ein frühes Verständnis der Daten im Projekt, denn schließlich sind KI-Projekte Datenprojekte. Wie baut man ein erfolgreiches Programm auf Daten auf, wenn man es angeht, ohne die Daten zu verstehen? Dies ist definitiv ein fataler Fehler, den Sie vermeiden möchten.

Originallink: https://www.forbes.com/sites/cognitiveworld/2022/08/20/are-you-making-these-deadly-mistakes-with-your-ai-projects/?sh= 352955946b54

Das obige ist der detaillierte Inhalt vonHaben Sie bei KI-Projekten schon einmal diese fatalen Fehler gemacht?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Repo: Wie man Teamkollegen wiederbelebt
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Wie kann die inländische Technologie -Q & A -Community unter den Auswirkungen von ChatGPT durchbrechen? Wie kann die inländische Technologie -Q & A -Community unter den Auswirkungen von ChatGPT durchbrechen? Apr 01, 2025 pm 05:18 PM

Wie reagieren die Fragen und Antworten der Inlandstechnologie angesichts der Auswirkungen von ChatGPT? Neuerer Stack ...

Wie kann ich das Problem lösen, dass die Kamera auf HTML -Seiten, die von Flask und Yolov5 entwickelt wurden, keine Erkennungsboxen anzeigen können? Wie kann ich das Problem lösen, dass die Kamera auf HTML -Seiten, die von Flask und Yolov5 entwickelt wurden, keine Erkennungsboxen anzeigen können? Apr 01, 2025 pm 06:33 PM

Wie öffne ich die Kamera erfolgreich und zeigt das Erkennungsfeld auf HTML -Webseiten an, die von Flask und Yolov5 entwickelt wurden? Bei der Entwicklung von HTML -Webseiten mithilfe von Flask Framework und Yolov5 öffnen Sie das Foto ...

Wie hört Uvicorn kontinuierlich auf HTTP -Anfragen ohne Serving_forver () an? Wie hört Uvicorn kontinuierlich auf HTTP -Anfragen ohne Serving_forver () an? Apr 01, 2025 pm 10:51 PM

Wie hört Uvicorn kontinuierlich auf HTTP -Anfragen an? Uvicorn ist ein leichter Webserver, der auf ASGI basiert. Eine seiner Kernfunktionen ist es, auf HTTP -Anfragen zu hören und weiterzumachen ...

Was ist der Grund für die Umleitung von 404 Fehlern nach dem Anmelden bei Selen? Wie löst ich es? Was ist der Grund für die Umleitung von 404 Fehlern nach dem Anmelden bei Selen? Wie löst ich es? Apr 01, 2025 pm 10:54 PM

Lösung zum Umleiten von 404 -Fehlern nach der Simulationsanmeldung Bei der Verwendung von Selen für die Simulationsanmeldung stoßen wir häufig auf schwierige Probleme. � ...

Wie erstelle ich dynamisch ein Objekt über eine Zeichenfolge und rufe seine Methoden in Python auf? Wie erstelle ich dynamisch ein Objekt über eine Zeichenfolge und rufe seine Methoden in Python auf? Apr 01, 2025 pm 11:18 PM

Wie erstellt in Python ein Objekt dynamisch über eine Zeichenfolge und ruft seine Methoden auf? Dies ist eine häufige Programmieranforderung, insbesondere wenn sie konfiguriert oder ausgeführt werden muss ...

Wie löse ich das Problem des fehlenden dynamischen Ladeninhalts beim Erhalten von Webseitendaten? Wie löse ich das Problem des fehlenden dynamischen Ladeninhalts beim Erhalten von Webseitendaten? Apr 01, 2025 pm 11:24 PM

Probleme und Lösungen, die bei der Verwendung der Anforderungsbibliothek zum Crawl -Webseitendaten auftreten. Wenn Sie die Anforderungsbibliothek verwenden, um Webseitendaten zu erhalten, begegnen Sie manchmal auf die ...

Wie kann man Go oder Rost verwenden, um Python -Skripte anzurufen, um eine echte parallele Ausführung zu erreichen? Wie kann man Go oder Rost verwenden, um Python -Skripte anzurufen, um eine echte parallele Ausführung zu erreichen? Apr 01, 2025 pm 11:39 PM

Wie kann man Go oder Rost verwenden, um Python -Skripte anzurufen, um eine echte parallele Ausführung zu erreichen? Vor kurzem habe ich Python verwendet ...

Wie kann die technische Fragen und Antworten in der Chatgpt -Ära auf Herausforderungen reagieren? Wie kann die technische Fragen und Antworten in der Chatgpt -Ära auf Herausforderungen reagieren? Apr 01, 2025 pm 11:51 PM

Die technische Q & A -Community in der Chatgpt -Ära: SegmentFaults Antwortstrategie Stackoverflow ...

See all articles