#Dieser Artikel wurde von „Everyone is a Product Manager’s „Original Incentive Plan“ erstellt.
Obwohl groß angelegte KI-Modelle mittlerweile sehr beliebt sind und jedes Unternehmen ein Stück davon haben möchte, sind die Algorithmen und Daten, die zur Realisierung dieses Prozesses erforderlich sind, nicht leicht zu verstehen. Unter ihnen ist die Datenübertragung und -verwaltung ein großes Problem. Dieser Artikel konzentriert sich auf den Engpass beim KI-Anwendungstraining, fasst die Schwierigkeiten des KI-Trainings zusammen und kombiniert sie mit IDC-Analyseberichten, um zu dem Schluss zu kommen, dass „Daten“ der größte Engpass sind, und erörtert Lösungen für dieses Problem.
1. Produkthintergrund
„In letzter Zeit gibt es wieder Stimmen, die über KI diskutieren. Anders als die abwartende Haltung gegenüber KI in den letzten zwei Jahren sagen viele Leute, dass mit der Anwendung von ChatGPT das KI-Zeitalter wirklich angekommen ist, und das Produkt.“ und Operationsstudenten sind damit beschäftigt, zu verstehen, was ChatGPT ist, was stabile Diffusion usw. ist, aber die Algorithmusingenieure haben verrückte Kopfschmerzen und beschweren sich wie verrückt. Die Leiter bitten sie, so schnell wie möglich ein großes Modell zu erstellen und die Algorithmusmodellindikatoren zu verbessern Als ich so schnell wie möglich am Algorithmus-Team vorbeikam, hörte ich das folgende Gespräch:
Gong Zhang: Bruder Hu, wie läuft deine Modelausbildung?
Gong Hu: Leider ist es schwierig, es in einem Satz zu erklären. Ich habe die Daten schließlich nicht an die Geschäftsabteilung übermittelt, oder die Daten, die sie gesammelt haben, waren alle unterschiedlich gebraucht?
Gong Zhang: Bei mir ist das nicht der Fall. Kürzlich summierten sich die Bilder und Videos des Kunden auf mehr als 10 T. Allein der Import der Daten hat unser Team lange gekostet.
Gong Hu sagte, wenn das Unternehmen eine Datenplattform aufbauen kann, die es uns ermöglicht, Daten schnell abzurufen und zu verwalten, wird es für uns bequemer sein, Daten in unserer täglichen Arbeit zu verwenden.
Nachdem ich das obige Gespräch gehört hatte, kam mir eine Idee, die ich kürzlich für Kunden entwickelt habe, die auf der Idee der Datenweberei basieren. Deshalb habe ich ihnen schnell eine detaillierte Produkteinführung gegeben und ihnen erklärt, wie das geht Verwenden Sie „Daten“. Das Designkonzept des „Webens“ wird verwendet, um eine Datenverwaltungsplattform aufzubauen, die Benutzern hilft, den Datenengpass beim KI-Anwendungstraining zu überwinden.
2. Schwierigkeiten bei der Anwendung des KI-Trainings
Mit Ausnahme der subjektiven Personalprobleme fassen wir die objektiven Schwierigkeiten des KI-Anwendungstrainings zusammen, die sich in den folgenden drei Punkten zusammenfassen lassen:
Hochwertige Daten: Um gute Ergebnisse beim Algorithmustraining zu erzielen, sind qualitativ hochwertige Daten die erste Voraussetzung. Es gibt jedoch folgende Schwierigkeiten:
Effiziente Rechenleistung: Bezieht sich auf das Training eines Modells, das normalerweise viel Rechenleistung erfordert. Gleichzeitig ist es schwierig, die Rechenleistung effizient zu nutzen
Ausgereiftes Framework: bezieht sich auf Algorithmusanwendungen, die ausgereifte, stabile und hoch skalierbare Algorithmus-Frameworks erfordern
Zusammenfassung: Aus der Analyse der drei Schwierigkeiten beim KI-Anwendungstraining geht hervor, dass sie alle mit Daten zusammenhängen. Wenn das Datenproblem gelöst werden kann, kann es daher effektiv dabei helfen, den Engpass beim KI-Anwendungstraining zu überwinden.
3. Sind Daten der Flaschenhals von KI-Anwendungen?Obwohl das Zusammenfassen von Daten von der Anwendungsseite den Engpass beim Training von KI-Anwendungen darstellt, stellt sich die Frage, wie viele Benutzer das glauben? Zur Veranschaulichung ist ein Datenelement erforderlich.
Ranking der größten Herausforderungen bei Anwendungen der künstlichen Intelligenz
Wie viel Arbeit wird bei der Entwicklung von Modellen der künstlichen Intelligenz in die Datenaufbereitung investiert? Hinweis:
Die Daten stammen aus dem IDC-Statistikbericht Aus den Statistiken geht hervor, dass 29 % der Benutzer der Meinung sind, dass es bei Anwendungen für künstliche Intelligenz an Trainings- und Testdaten mangelt, und 85 % der Benutzer glauben, dass mindestens die Hälfte des Arbeitsaufwands für die Datenaufbereitung aufgewendet wird.
Zusammenfassung: Da Daten nachweislich tatsächlich der Flaschenhals von KI-Anwendungen sind, können Sie erwägen, einen Einstiegspunkt aus den Daten zu finden, um „einheitliche Standards und schnellen Zugriff auf große Mengen hochverfügbarer Datenquellen“ für die Produktausführung bereitzustellen Planung der Positionierung. 4. Produktdesign
Nachdem wir Daten als Einstiegspunkt gefunden haben, haben wir darüber nachgedacht, wie wir datenbasierte Produkte erstellen können. Basierend auf der obigen Analyse können wir feststellen, dass wir drei datenbasierte Probleme in unseren Produkten lösen müssen:
1. Produktarchitektur
1) ProduktpositionierungBereitstellung einer Datenverwaltungsplattform im Knowledge-Graph-Stil, die auf der Idee der Datenweberei basiert, um Kunden zu bedienen, die qualitativ hochwertige Daten benötigen.
Hinweis:Obwohl das Hauptziel darin besteht, den Datenengpass beim KI-Anwendungstraining zu lösen, haben wir aus Sicht der Produktplanung die Benutzerszenarien erweitert, und jeder, der Datendienste benötigt, ist der Zielbenutzer dieses Produkts.
2) ProduktanwendungsarchitekturVon der Datenschicht bis zur Produktanwendungsschicht entwerfen wir die folgende Produktarchitektur:
Datenschicht: Unterstützt den Zugriff auf verschiedene Datentypen sowie auf strukturierte und unstrukturierte Daten. Es gibt viele Datentypen für das KI-Training, insbesondere multimodale Anwendungen, die mehrere Datentypen erfordern.
Speicherschicht: Angesichts der diskreten Natur von Daten ist es notwendig, die Speicherung von Daten an verschiedenen Orten zu unterstützen und den Zugriff von Cloud-Daten auf lokale Daten zu unterstützen.
Datenverwaltungsplattform: Das Kernprodukt, das dieses Mal entworfen werden soll, besteht hauptsächlich aus vier Teilen:
Datenverwaltung: Ein gemeinsames Modul herkömmlicher Datenverwaltungsplattformen, das Funktionen wie Datenanalyse, Bereinigung und Regeldefinition bereitstellt.
API/SDK-Dienst: Für Unternehmen oder Benutzer mit technischen Fähigkeiten, wie z. B. dem Engpass bei KI-Trainingsanwendungen, den dieser Artikel lösen möchte, können Sie die KI-Plattform direkt in den API-Dienst der Datenplattform integrieren, um die zu erhalten erforderliche Daten und verwenden Sie die bereinigten Daten für das Modelltraining.
Hinweis: Tianyancha-Screenshots dienen nur als Lernreferenz
2. Kommerzialisierung
Sobald das Produkt auf den Markt kommt, ist keine Kommerzialisierung möglich, daher muss die Kommerzialisierungsrichtung während der Produktplanungsphase klar berücksichtigt werden und die folgenden drei Schlüsselaspekte sollten berücksichtigt werden:
1) Inhalte verkaufen
Für B-End-Kunden bieten wir zwei Arten von Vertriebsinhalten an, darunter Standardprodukte „Datenverwaltungsplattform“ und „technische Lösungen“.
2) Verkaufsmethode
Die beiden gängigen Vertriebsmodelle für B-End-Produkte sind „Channel-Kooperation“ und „Direktvertrieb“. Diese Methoden kommen auch bei diesem Produkt zum Einsatz.
3) Differenzierungsvorteile
Da es sich um eine Datenverwaltungsplattform handelt, die auf neuen Designideen basiert, muss sie während des Produktverkaufsprozesses ihre differenzierten Vorteile gegenüber herkömmlichen Datenverwaltungsplattformen widerspiegeln, um aufzuholen und Benutzer anzulocken. Wir können sie in den folgenden drei Vorteilen zusammenfassen :
Die Reife des Produkts erfordert auch einen kontinuierlichen Konstruktionsprozess. Während des Konstruktionsprozesses dieses Produkts basiert es auf „Projektpolierprodukten“ und wird in zwei Hauptphasen aufgebaut.
Dieser Artikel konzentriert sich auf den Engpass beim KI-Anwendungstraining, fasst die Schwierigkeiten des KI-Trainings zusammen und kombiniert sie mit IDC-Analyseberichten, um zu dem Schluss zu kommen, dass „Daten“ der größte Engpass sind, und erörtert Lösungen für dieses Problem.
Führen Sie ein Produkttransformationsdesign basierend auf den Konzepten der Datenweberei und des Wissensgraphen durch und führen Sie eine intelligente Datenverwaltungsplattform für „Daten findende Personen“ aus den Perspektiven der Produktpositionierung, Produktarchitektur, Anwendungsszenarien usw. im Detail ein Außerdem können Werbeideen und Konstruktionspfade Kunden bei Datenanwendungsszenarien wie KI-Trainingsplattformen, Datenanmerkungsplattformen und sogar Kunden helfen, die herkömmliche Datenverwaltungsprodukte transformieren und aktualisieren müssen.
In Zukunft werden wir die Idee der Ausweitung der Datenverflechtung auf den eigentlichen Prozess des modellparallelen Trainings weiter untersuchen und nach einer besseren Durchführbarkeit der Dateneffizienz streben.
Kolumnist
Eric_d, der Produktmanager-Kolumnist für alle. Ich habe eine Leidenschaft für KI, Big Data und andere Bereiche. Ich verfüge über ausgezeichnete Fähigkeiten in den Bereichen Anforderungsanalyse, Produktprozess und Architekturdesign.
Dieser Artikel wurde von „Everyone is a Product Manager’s „Original Incentive Plan“ erstellt.
Das Titelbild stammt von Unsplash, basierend auf der CC0-Lizenz.
Das obige ist der detaillierte Inhalt vonAnwendung in der KI-Branche: Datenweberei verhilft zu Durchbrüchen beim Training von KI-Anwendungen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!