Im Prozess großer Modelle, die Tausende von Branchen veränderten, übernahm Volcano Engine die Führung bei der Bereitstellung einer personalisierten Antwort für die Datenbranche. Am 19. September kündigte Volcano Engine auf dem „Data Flywheel V-Tech Data Driven Technology Summit“ in Shanghai die Fähigkeiten der digitalen Intelligenzplattform VeDI für große Sprachmodelle (Large Language Models) an. Nach dem Produkt-Upgrade kann es natürliche Sprache verwenden, um „Zahlen zu finden“, die Entwicklung von Data-Warehouse-Modellen zu unterstützen, Code zu optimieren und auch die Generierung visueller Diagramme abzuschließen und Attributionsanalysen während Gesprächen und anderen Funktionen durchzuführen. Selbst normale Bediener ohne Programmierkenntnisse können Zahlen schnell finden und analysieren. Derzeit wurden VeDI-bezogene Datenprodukte zum Testen eingeladen. Die aktualisierten Datenprodukte haben die Schwelle für die Datennutzung erheblich gesenkt. Wenn ein gewöhnlicher Betreiber in der Vergangenheit die Nummer herausfinden wollte, musste er sich oft an Forschungs- und Entwicklungspersonal wenden, das Codes schrieb, um die Nummer abzurufen. Die Analyse eines Datenelements erforderte viel Fachwissen. Mit Hilfe aktualisierter Datenprodukte können Betreiber jetzt ihre Anforderungen jederzeit in natürlicher Sprache eingeben und erhalten die gewünschten Daten in Echtzeit. Dadurch wird der Wert von Daten weiter gesteigert. Innerhalb des Unternehmens wird ein niedrigerer Nutzungsschwellenwert es mehr Personen in der Datenverbrauchskette ermöglichen, mit Daten in Kontakt zu treten und sie zu nutzen. Der Datenbedarf, der in der Vergangenheit durch den tatsächlichen Schwellenwert unterdrückt wurde, wird gedeckt und auf Daten basierende Geschäftseinblicke werden ermöglicht zeitnaher und die Entscheidungsfindung wird zeitnaher erfolgen. Für Unternehmen, die sich im Prozess der Digitalisierung befinden, wird der Wert der Daten in einer höheren Umlauffrequenz freigesetzt und die Datenschwungrad wird weiter beschleunigt. Große Modelle sind in die vollständige Datenverbindung integriert, wodurch die Schwelle für die Datenproduktion und -nutzung weiter gesenkt wird.Im Vergleich zu kleinen Modellen verfügen große Modelle über leistungsstarke Funktionen zur Verallgemeinerung, zum Abrufen externer Tools usw Code Generative Fähigkeit. Diese Fähigkeiten haben erhebliche Auswirkungen auf Datenprodukte. Stärkeres allgemeines Denkvermögen bedeutet höhere Intelligenz, muss aber gleichzeitig durch die Kombination vieler Werkzeuge ergänzt werden, um verschiedene Fähigkeiten wie Mathematik und analytische Fähigkeiten anzupassen. Das im Zeitalter großer Modelle eröffnete Interaktionsmodell mit natürlicher Sprache hat auch neuen Vorstellungsraum für die Verwendung von Datenprodukten eröffnet. Ab März dieses Jahres begann Byte, in kleinen Tests mit schneller Iteration große Modelle mit Datenprodukten zu kombinieren und Veränderungen sind offensichtlich. Anschließend begann das Team, in großem Maßstab mit Datenproduktszenarien zu experimentieren, die Prioritäten der Szenarien ständig zu quantifizieren und die Implementierung großer Modelle in Produkte voranzutreiben. Im Prozess der Transformation großer Modelle in der Datenbranche ist die Auswahl von Szenarien einer der wichtigsten Schritte Ein geeignetes Nutzungsszenario muss nicht nur auf der Grundlage der aktuellen oder vorhersehbaren Technologie erstellt werden, sondern auch Es ist garantiert, dass Benutzer oder Geschäftsparteien nach dem Hinzufügen großer Modelle eine bessere Erfahrung machen und gleichzeitig einen höheren Datenverbrauchswert erzielen können, was die Datenproduktion weiter vorantreiben kann. Luo Um natürliche Sprache zu verwenden, kann dieses Szenario den Erfahrungsanforderungen des Unternehmens an Aktualität nicht gerecht werden und ist nicht gültig. „Beim kurzen Codegenerierungsprozess wird jedoch die Effizienz der Szene nach dem Hinzufügen natürlicher Sprache in Zukunft erheblich verbessert, da sich die Leistung großer Modelle in allen Aspekten weiter verbessert.“ Durch die vollständige Datenverbindung können große Modelle auf die damit verbundenen intelligenten Veränderungen gespannt sein.“ Die von Volcano Engine angekündigte VeDI-Plattform besteht hauptsächlich aus zwei Teilen: DataLeap und DataWind. Unter anderem kann der „Zahlenassistent“ in DataLeap das Finden von Zahlen im Frage-und-Antwort-Verfahren unterstützen, und der „Entwicklungsassistent“ kann die Generierung und Optimierung von SQL-Code in natürlicher Sprache unterstützen Sprache zur Vervollständigung der Datenvisualisierungsabfrage und -analyse. Umfasst die gesamte Verbindung des Findens, Abrufens und Analysierens von Zahlen und senkt die technische Schwelle für den gesamten Prozess der Datenproduktion und -nutzung.
DataLeap - Zahlensuchassistent
„Zahlen finden“ ist normalerweise der erste Schritt in der gesamten Datenverbrauchskette. Nur durch das Finden der richtigen Datenbestände kann der Datenverbrauch realisiert werden.Allerdings ist das „Finden von Zahlen“ im herkömmlichen Verfahren keine einfache Aufgabe und erfordert eine starke Abhängigkeit von der Eingabe von Geschäftsexpertise. Normalerweise können Menschen dies nur durch Stichwortsuche und anschließendes manuelles Screening oder die Suche nach professionellen Datenentwicklern bestätigen. P Verwenden Sie DataLEAP -Finden Sie den Assistenten „Finden Sie Zählen“
Die Funktion „Finden Sie den Assistenten“, die in Kombination mit dem großen Sprachmodell (LLM) die Schwelle des „Findens Zählen“ erheblich reduziert. Mit dem „Numerischen Suchassistenten“ können auch Personen ohne Programmierkenntnisse „anthropomorphe“ Abfragen in natürlicher Sprache durchführen Ein E-Commerce-Betreiber kann beispielsweise direkt fragen: „Wie sind die Betriebsbedingungen des Haowu-Live-Übertragungsraums?“ die letzten sieben Tage? DataLeap – Der Datensuchassistent empfiehlt Tabellen zu Geschäftsbedingungen basierend auf der Geschäftswissensdatenbank und erläutert die Datendimensionen, die jeder Tabelle entsprechen.
Derzeit kann der „Number Finder Assistant“ den Frage-und-Antwort-Abruf verschiedener Datentypen und zugehöriger Geschäftskenntnisse implementieren, einschließlich Hive-Tabellen, Datensätzen, Dashboards, Datenindikatoren, Dimensionen usw., und anthropomorphe Abfragen realisieren . Darüber hinaus erleichtert der „Zahlensuchassistent“ in Kombination mit der Fähigkeit großer Modelle nicht nur das „Zahlenfinden“, sondern kann auch die Genauigkeit des „Zahlenfindens“ weiter verbessern. Bei herkömmlichen technischen Lösungen beruhte der Abruf von Datenbeständen in der Vergangenheit auf der Verwaltung strukturierter Daten, und bei der Verwendung von Schlüsselwörtern für den Abruf fehlten möglicherweise Verbindungen zu unstrukturierten Geschäftsdaten, was zu einem Linkfragmentierungsproblem führen konnte, das die Anzahl der darauf basierenden Daten erheblich reduzieren konnte Geschäftsszenarien. Effizient finden und konsumieren. Darüber hinaus liefert die Suche eine Reihe von Kandidatenantworten auf der Grundlage von Schlüsselwörtern, die eine manuelle Überprüfung und Bestätigung erfordern. Es handelt sich nicht um direkte Antworten, was es für Benutzer schwierig macht, eine gute Erfahrung zu machen.
Jetzt können große Sprachmodelle (LLM) im Konversationsprozess mit Benutzern die wahren Absichten der Benutzer verstehen, wodurch der Suchprozess fokussierter wird, Kosten für menschliches Urteilsvermögen eingespart werden und das „Suchen von Zahlen“ selbst mehr wird Gleichzeitig weist die Konversationsabfrage mit der schrittweisen Verbesserung des semantischen Verständnisses und der Analysefähigkeiten des Modells eine höhere Abrufeffizienz über den gesamten Link auf als die einfache Schlüsselwortabfrage.
DataLeap - EntwicklungsassistentIm Datenproduktions- und -verarbeitungsprozess kann der „Entwicklungsassistent“ die Verwendung natürlicher Sprache unterstützen und automatisch SQL-Code generieren; er kann Fehlerreparatur und Code automatisch implementieren Optimierung für vorhandene Codes, Erklärungen und Kommentare usw. Darüber hinaus können Sie sich im Dialog auch zu Fragen der SQL-Nutzung wie Dokumentensuche, Funktionsnutzung, Codebeispielen usw. beraten lassen.代 Automatische Entwicklung von SQL-Code Der Entwicklungsassistent unter der unteren Ebene übernimmt das große Sprachmodell (LLM) und kann entsprechend der natürlichen Sprache des Benutzers Informationen in hoher Qualität generieren Sie verfügen über Kenntnisse im Datenverarbeitungscode und sind in der Lage, den Code zu verstehen, neu zu schreiben sowie zu hinterfragen und zu beantworten. 码 Automatische Reparatur Der vorhandene Code 复 Entwicklungsassistent durchbrach die Sprachbarriere und reduzierte die Schwelle für die Datenentwicklung erheblich. „Ursprünglich musste man zum (Verarbeiten) von Daten möglicherweise eine Programmiersprache wie SQL oder Python beherrschen, was eine relativ starke Anforderung an die Fähigkeiten darstellt. Jetzt braucht man jedoch keine Programmiersprache mehr und kann natürliche Sprache verwenden. Also, Dies bedeutet, dass die Anforderungen an Personen, die dies tun, weiter reduziert wurden. „
Analysten und Betreiber mit Anforderungen an den Datenverbrauch können einige grundlegende ETL durchführen, auch wenn sie SQL nicht verstehen. Betreiber können DataLeap automatisch Datennachfragecodes generieren lassen, die den Geschäftsbedingungen entsprechen, z. B. Auftragsverkäufe nach Stadt oder Live-Übertragungsraumverkehr nach Zeitraum usw. Bediener können auch nach der Bedeutung des Codes fragen, z. B. „Gibt es einen Optimierungsplan, während diese Tabelle ausgeführt wird?“, oder sie können ein Gespräch führen: „Helfen Sie mir, diese Codezeichenfolge zu überprüfen und zu korrigieren.“ Sie können den generierten Code auch mit einem Klick analysieren, SQL-Tools aufrufen, um die Tabelle zu überprüfen, und klicken, um die automatische KI-Reparatur zu bestätigen, um die Datenbestände weiter zu optimieren.
Noch wichtiger ist, dass DataLeap – Development Assistant professionellen Entwicklern dabei helfen kann, einige grundlegende Arbeiten zu erledigen und einige komplexe, aber grundlegende Anforderungen von Datenanalysten und Geschäftsbetreibern zu erfüllen, die auf Daten angewiesen sind. Ingenieure müssen diese nur korrigieren und überprüfen Genauigkeit des generierten Codes am Ende.
Dadurch kann sich das F&E-Personal auf kreativere Arbeit konzentrieren, sich stärker auf die Anforderungen komplexer Szenarien konzentrieren, Entwicklungsassistenten zur Codeoptimierung einsetzen und die F&E-Produktivität und Codequalität verbessern. DataWind - AnalyseassistentNachdem wir die Zahlensuche und -abfrage erkannt hatten, kamen wir zum Datenanalyse-Link. DataWind – Analysis Assistant, der Funktionen für große Modelle kombiniert, kann Personen in nicht analytischen Positionen dabei helfen, eine Reihe von Geschäftserkundungen wie Datenvisualisierungsabfragen und -analysen durch Dialoge in natürlicher Sprache durchzuführen, wodurch die Schwelle für diesen Link gesenkt wird.
Das erste ist die Erstellung des „Datensatzes“. Bei Datenbeständen verwenden Betreiber DataWind per Drag-and-Drop, um Datensätze zu erstellen, und definieren dann mithilfe natürlicher Sprache die Logik verschiedener Felder, z. B. die direkte Überprüfung der Daten der „Live-Übertragungsperiode großer Prominenter“.
Nachdem das Feld generiert wurde 后 Nach der Überprüfung kann der Bediener die Analyse und Erkundung visualisieren. In der Vergangenheit verwendeten BI-Tools im Allgemeinen Drag-and-Drop-Vorgänge. Obwohl der Schwellenwert bei der Dashboard-Erstellung gesenkt wurde, ist im Bereich Analyse und Einblick immer noch ein großes Maß an Fachwissen erforderlich, um die Daten besser zu verstehen eine „Schwelle“. Visuelle Erkundung
Aber mit der Unterstützung der stärkeren verallgemeinerten Argumentationsfunktionen großer Modelle konnte Datawind grundlegende Annahmen und Überprüfungen durchführen und Analyseideen vorschlagen.
Die von DataWind bereitgestellte automatische KI-Analysefunktion kann die weitere Erforschung der Gründe dafür anhand von Diagrammen unterstützen. Beispielsweise kann KI die generierten visuellen Diagramme wie „Live-Übertragungsraum-Verkehrsdiagramm nach Zeitraum“ und „Live-Übertragungsraum-Verkaufsobergrenze“ automatisch analysieren. Die Betreiber müssen lediglich durch Dialog auf der Grundlage der Analyseergebnisse weitere Zuordnungen vornehmen.
Gleichzeitig verbindet sich DataWind auch mit Office-Collaboration-Tools wie Feishu. Benutzer können über IM-Nachrichtenabonnements und natürliche Gespräche eine umfassendere Analyse durchführen und so jederzeit und überall flexible Analysen durchführen und so den Anforderungen von Datensätzen gerecht werden Einblicke und Nachrichtenabonnements. Self-Service-Intelligenz über die gesamte Verbindung und die Office-Integration von China Unicom ermöglichen eine nahtlose Integration der Datenanalyse in den Alltag. Koordinierte IM-Nachrichten Abonnieren Sie die Erweiterungsanalyse
Durch die Analyse des Schwellenwerts für Analyseassistenten wird der Analyseschwellenwert vom Lesen von „Datendiagrammen“ bis zum direkten Verständnis der Ergebnisse durch Dialog in natürlicher Sprache, Datenanalyse und Denkzyklus weiter gesenkt wurde stark gekürzt, um frühere Analysen früherer Analysen zu lösen. Gewinnen Sie Einblicke in Schwachstellen, die viel Fachwissen erfordern, und verkürzen Sie den Datenanalysezyklus.
Zu diesem Zeitpunkt sind die Anwendungsszenarien von DataWind – Analysis Assistant bereits sehr umfangreich. Zusätzlich zur Ermöglichung der Konversationserkundung in Kernanalyseszenarien erweitert der Analysis Assistant seine Fähigkeiten auch auf die Ausdrucksgenerierung und andere Aufgaben, die zuvor mehr erforderten technische Schwellenwerte in der Szene. Großes Modell beschleunigt das Datenschwungrad, um Unternehmen dabei zu helfen, datengesteuert besser zu erreichen
ByteDance verfügt über ein tiefgreifendes datengesteuertes Gen. Seit seiner Gründung wurden fast alle Szenarien innerhalb von ByteDance A/B-Tests unterzogen, und Anpassungen werden durch Datenfeedback vorgenommen, um Geschäftsstrategien voranzutreiben, z. B. ob der Optimierungseffekt der Douyin-Videoqualität gut ist, ob die Strategieoptimierung des Empfehlungsalgorithmus gut ist genau und sogar Die Namen von Toutiao wurden auch A/B-getestet.
Innerhalb von Byte ist der Umfang des Datenverbrauchs sehr groß. Organisatorisch gesehen kann im Grunde jeder vom oberen bis zum mittleren Management sowie die Mitarbeiter an vorderster Front die Daten sehen und sie nutzen, um den Betriebsstatus, die Einnahmen und Ausgaben, den Geschäftsfortschritt und die Produktstrategien des Unternehmens zu bewerten. In bestimmten Szenarien, wie zum Beispiel Echtzeit-Marketing im Live-E-Commerce, entwerfen und pushen Betriebsabläufe entsprechende Marketingstrategien auf Basis von Echtzeitdaten.
Byte hat durch den Datenverbrauch eine wissenschaftliche Entscheidungsfindung und agiles Handeln erreicht, was durch den häufigen Datenverbrauch und geschäftliche Vorteile zu einem besseren Aufbau hochwertiger Datenbestände bei niedrigen Kosten geführt hat Unterstützung von Geschäftsanwendungen.
Im April dieses Jahres veröffentlichte Volcano Engine basierend auf der mehr als zehnjährigen datengesteuerten Praxiserfahrung von ByteDance ein neues Paradigma für das Upgrade der digitalen Intelligenz in Unternehmen, das „Data Flywheel“, das das „Data Flywheel“ vollständig nutzt Fassen Sie den Datenfluss des Unternehmens zusammen. Nach der Integration in den Geschäftsfluss kann der Schwungradeffekt zur Verbesserung von Datenbeständen und Geschäftsanwendungen erzielt werden.
Im Rahmen des allgemeinen Trends der Digitalisierung nähern sich Unternehmen in Tausenden von Branchen der Digitalisierung an und Daten werden für Unternehmen immer wichtiger. Als neuer Produktionsfaktor unterstützen Daten die digitale und intelligente Transformation von Unternehmen. Objektiv gesehen sind viele Unternehmen jedoch nicht in der Lage, den Wert der Daten voll auszuschöpfen, obwohl sie viel digital aufgebaut haben.
„Ein Unternehmen stellt möglicherweise Datenprodukte zu einem hohen Preis bereit, aber es gibt möglicherweise nur sehr wenige Menschen, die sie tatsächlich intern nutzen. Wenn der Datenfluss schwierig ist, wird es schwierig sein, ihren Wert zu erkennen.“ Auf dem Datenproduktmarkt ist Folgendes zu beobachten: Viele Unternehmen, die sich im digitalen Aufbau befinden, haben Probleme wie hohe Datenaufbau- und -verwaltungskosten, hohe Hindernisse bei der Nutzung von Datenprodukten und einen geringen Wert der Datenbestände.
Aus der Perspektive des gesamten Digitalisierungsprozesses ist es schwierig, aber richtig, „datengetrieben“ zu sein. Am Beispiel von Byte verriet Luo Nach der Erfahrung von Byte zu urteilen, bedeutet dies, dass die Nutzungsrate interner Datenprodukte innerhalb des Unternehmens und die Abdeckung verwaltbarer und betriebsbereiter Datenbestände im Szenario auf ein höheres Niveau erhöht werden müssen, um ein gutes „Datenschwungrad“ im Unternehmen zu bilden Unternehmen. . In diesem Prozess können Datenprodukte, die von großen Modellen unterstützt werden, eine wichtige treibende Kraft sein, um Unternehmen dabei zu helfen, ihre Ziele zu erreichen. Die digitale Intelligenzplattform VeDI, die mit Funktionen für große Modelle aufgerüstet wurde, hat den gesamten Prozess der Datenproduktion und -nutzung, wie z. B. das Finden von Zahlen, das Abrufen von Zahlen und die Datenanalyse, weiter reduziert. Bei gleicher Nachfrage hat sich mit dem aktualisierten VeDI die Zahl der Personen im Unternehmen, die Datenprodukte nutzen können, von professionellen Datenanalysten auf alle Personen mit Datenbedarf ausgeweitet, bei denen es sich um Betriebsabläufe, Vorgesetzte, Produktmanager usw. handeln kann. usw. Der Datenverbrauch wird inklusive.
„Nur wenn wir die Schwelle senken und die Daten nutzen, können wir wissen, welchen Wert die Daten im Umlauf erzeugen werden.“ Ausgegrabene Schätze und Datenprodukte mit niedrigerem Schwellenwert können der Schlüssel zu ihrer Erschließung sein. Mit dem Segen großer Modelle wird das „Datenschwungrad“ innerhalb des Unternehmens seine Rotation beschleunigen. Das Unternehmen verfügt über einen leistungsfähigeren Motor, und das Geschäftspersonal kann in Sekundenschnelle Datenrückmeldungen erhalten, wodurch das Geschäft schneller optimiert wird. Durch den beschleunigten Datenfluss sammeln sich weiterhin hochwertigere Datenbestände an. Geben Sie dem Unternehmen mehr Einblicke und treffen Sie letztendlich Geschäftsentscheidungen wissenschaftlicher und agiler. Das obige ist der detaillierte Inhalt vonVerwenden Sie den Vulkanmotor und das große Modell, um das Datenschwungrad zu „zünden'.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!