MLOps: Wiederholen Unternehmen die gleichen DIY-Fehler?
Übersetzer |. Cui Hao
Rezensent |.Eröffnung
Generell gibt es einen Grund, warum Unternehmen nicht die Initiative ergreifen, ihre eigene Cloud-Computing-Infrastruktur aufzubauen. Im letzten Jahrzehnt haben IT-Infrastrukturteams versucht, ihre eigenen privaten Clouds aufzubauen, weil sie glaubten, dass diese ihre Unternehmen kostengünstiger unterstützen würden als öffentliche Clouds. Doch entgegen den Erwartungen übertrafen der Zeit- und Kostenaufwand für die private Cloud die Erwartungen. Nach dem Aufbau der privaten Cloud waren mehr Ressourcen für deren Wartung erforderlich und sie war der öffentlichen Cloud in Bezug auf Sicherheit und Erweiterung etwas unterlegen. Dies führt dazu, dass Unternehmen, die ihre eigenen privaten Clouds aufbauen, am Ende nicht über mehr Ressourcen verfügen, um in das Kerngeschäft zu investieren, sondern stattdessen viel Zeit und Personal in eine Infrastruktur investieren, die die Geschäftsanforderungen nicht erweitern kann.
Heutzutage generieren viele Unternehmen Lösungen über verschiedene Open-Source-Tools (wie Apache Spark), aber die meisten Aktionen für MLOps erfordern wiederholte manuelle Vorgänge.
Dies führt dazu, dass Modellbereitstellungen Wochen oder sogar Monate dauern, ineffiziente Laufzeiten (gemessen daran, dass die Ausführung von Berechnungen und Inferenzen Zeit in Anspruch nimmt) und ein Mangel an Beobachtungen für Modelltests und -überwachung besteht. Außerdem war der verwendete Ansatz zu individuell und konnte keine skalierbaren, wiederverwendbaren Geschäftsprozesse für mehrere Anwendungsfälle in verschiedenen Teilen des Unternehmens bereitstellen.
Ein Fall eines falsch diagnostizierten Problems
Darüber hinaus führten Gespräche mit Geschäftsbereichsleitern und Chief Data Analytics Officers zu dem Schluss, dass die Organisation zwar viele Datenwissenschaftler anstellte, aber keine Rendite erzielte. Im Zuge der Vertiefung der Forschung werden sie weiterhin verschiedene Fragen stellen und diese Fragen nutzen, um die Schwierigkeiten und Hindernisse zu identifizieren, mit denen künstliche Intelligenz konfrontiert ist. Sie erkannten schnell, dass das Hauptproblem auf der „letzten Meile“ lag – der Bereitstellung der Modelle und deren Anwendung auf Echtzeitdaten, deren effiziente Ausführung, so dass der Nutzen die Kosten überwog und so ihre Leistung besser gemessen werden konnte.
Um Geschäftsprobleme zu lösen und Geschäftsentscheidungen zu treffen, wandeln Datenwissenschaftler Daten in Modelle um. Dieser Prozess wird durch zwei Arten von Fähigkeiten unterstützt: das Fachwissen und die Fähigkeiten, die zum Erstellen großartiger Modelle erforderlich sind, und die Fähigkeiten, Code zu verwenden, um das Modell in der realen Welt zu steuern und es gleichzeitig zu überwachen und zu aktualisieren. Diese beiden Arten von Fähigkeiten sind jedoch völlig unterschiedlich.
Genau wegen dieses Unterschieds kommen ML-Ingenieure ins Spiel. ML-Ingenieure integrieren Tools und Frameworks, um sicherzustellen, dass Daten, Pipelines und Infrastruktur zusammenarbeiten, um ML-Modelle im großen Maßstab zu erstellen.
Also, was nun tun? Mehr Ingenieure für maschinelles Lernen einstellen?
Selbst mit den besten ML-Ingenieuren stehen Unternehmen bei der Skalierung von KI immer noch vor zwei großen Problemen:
Unfähigkeit, ML-Ingenieure schnell einzustellen: Die Nachfrage nach ML-Ingenieuren ist so groß geworden, dass die Stellenangebote für ML-Ingenieure schneller wachsen als im IT-Services wächst 30-mal schneller. MLOps-Teams müssen manchmal Monate oder sogar Jahre auf die Besetzung von Positionen warten und müssen einen effizienten Weg finden, mehr ML-Modelle und Anwendungsfälle zu unterstützen, ohne die Anzahl der ML-Ingenieure zu erhöhen, um die Nachfrage nach ML-Anwendungen zu decken. Dies führt jedoch zu einem zweiten Engpass ...- Mangel an wiederholbaren, skalierbaren Best Practices für die Bereitstellung von Modellen, unabhängig davon, wo und wie sie erstellt werden: Der aktuelle Stand des modernen Unternehmensdaten-Ökosystems ist, dass verschiedene Geschäftseinheiten unterschiedliche Datenplattformen verwenden auf ihre Daten- und Technologieanforderungen (z. B. müssen Produktteams möglicherweise Streaming-Daten unterstützen, während die Finanzabteilung eine einfache Abfrageschnittstelle für nichttechnische Benutzer bereitstellen muss). Darüber hinaus erfordert Data Science auch die Dezentralisierung von Anwendungen über Geschäftsbereiche hinweg statt der Zentralisierung von Anwendungen. Mit anderen Worten: Verschiedene Data-Science-Teams verfügen über einen einzigartigen Satz an Modellschulungsrahmen für die Anwendungsfälle (Domänen), auf die sie sich konzentrieren. Dies bedeutet, dass ein einheitlicher Schulungsrahmen nicht für das gesamte Unternehmen (einschließlich mehrerer) erstellt werden kann Abteilungen/Domänen) von.
- Wie man den größtmöglichen Nutzen aus künstlicher Intelligenz zieht
Um die Automatisierungsmöglichkeiten zu verbessern und umfassendere, detailliertere und vorhersehbarere Benutzerversprechen zu erfüllen, haben Unternehmen investiert an künstlicher Intelligenz. Bisher besteht jedoch eine große Lücke zwischen den Versprechen und Ergebnissen der KI, da nur etwa 10 % der KI-Investitionen einen signifikanten ROI generieren.
Um das MLOps-Problem zu lösen, müssen Chief Data Analytics Officers schließlich ihre eigenen Fähigkeiten rund um die Datenwissenschaft im Kern des Geschäfts aufbauen und gleichzeitig in andere Technologien im Zusammenhang mit der MLOps-Automatisierung investieren. Dabei handelt es sich um ein häufiges „Build vs. Buy“-Dilemma, das nicht nur aus betrieblicher Sicht (Kosten-Nutzen) betrachtet wird, sondern auch die Geschwindigkeit und Effizienz der KI-Investitionen berücksichtigt, die das gesamte Unternehmen durchdringen, und ob neue Methoden möglich sind Erzielen Sie einen besseren Umsatz mit Produkten und einem besseren Kundenstamm oder senken Sie die Kosten durch zunehmende Automatisierung und Reduzierung von Verschwendung.
Übersetzer-Einführung
Cui Hao, 51CTO-Community-Redakteur, leitender Architekt, verfügt über 18 Jahre Erfahrung in der Softwareentwicklung und Architektur sowie 10 Jahre Erfahrung in verteilter Architektur. Ehemals technischer Experte bei HP. Er ist bereit zu teilen und hat viele beliebte Fachartikel geschrieben, die mehr als 600.000 Mal gelesen wurden. Autor von „Distributed Architecture Principles and Practice“.
Originaltitel:MLOps |. Wiederholt das Unternehmen die gleichen DIY-Fehler?
Das obige ist der detaillierte Inhalt vonMLOps: Wiederholen Unternehmen die gleichen DIY-Fehler?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Diese Seite berichtete am 27. Juni, dass Jianying eine von FaceMeng Technology, einer Tochtergesellschaft von ByteDance, entwickelte Videobearbeitungssoftware ist, die auf der Douyin-Plattform basiert und grundsätzlich kurze Videoinhalte für Benutzer der Plattform produziert Windows, MacOS und andere Betriebssysteme. Jianying kündigte offiziell die Aktualisierung seines Mitgliedschaftssystems an und führte ein neues SVIP ein, das eine Vielzahl von KI-Schwarztechnologien umfasst, wie z. B. intelligente Übersetzung, intelligente Hervorhebung, intelligente Verpackung, digitale menschliche Synthese usw. Preislich beträgt die monatliche Gebühr für das Clipping von SVIP 79 Yuan, die Jahresgebühr 599 Yuan (Hinweis auf dieser Website: entspricht 49,9 Yuan pro Monat), das fortlaufende Monatsabonnement beträgt 59 Yuan pro Monat und das fortlaufende Jahresabonnement beträgt 499 Yuan pro Jahr (entspricht 41,6 Yuan pro Monat). Darüber hinaus erklärte der Cut-Beamte auch, dass diejenigen, die den ursprünglichen VIP abonniert haben, das Benutzererlebnis verbessern sollen

Verbessern Sie die Produktivität, Effizienz und Genauigkeit der Entwickler, indem Sie eine abrufgestützte Generierung und ein semantisches Gedächtnis in KI-Codierungsassistenten integrieren. Übersetzt aus EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG, Autor JanakiramMSV. Obwohl grundlegende KI-Programmierassistenten natürlich hilfreich sind, können sie oft nicht die relevantesten und korrektesten Codevorschläge liefern, da sie auf einem allgemeinen Verständnis der Softwaresprache und den gängigsten Mustern beim Schreiben von Software basieren. Der von diesen Coding-Assistenten generierte Code eignet sich zur Lösung der von ihnen zu lösenden Probleme, entspricht jedoch häufig nicht den Coding-Standards, -Konventionen und -Stilen der einzelnen Teams. Dabei entstehen häufig Vorschläge, die geändert oder verfeinert werden müssen, damit der Code in die Anwendung übernommen wird

Um mehr über AIGC zu erfahren, besuchen Sie bitte: 51CTOAI.x Community https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou unterscheidet sich von der traditionellen Fragendatenbank, die überall im Internet zu sehen ist erfordert einen Blick über den Tellerrand hinaus. Large Language Models (LLMs) gewinnen in den Bereichen Datenwissenschaft, generative künstliche Intelligenz (GenAI) und künstliche Intelligenz zunehmend an Bedeutung. Diese komplexen Algorithmen verbessern die menschlichen Fähigkeiten, treiben Effizienz und Innovation in vielen Branchen voran und werden zum Schlüssel für Unternehmen, um wettbewerbsfähig zu bleiben. LLM hat ein breites Anwendungsspektrum und kann in Bereichen wie der Verarbeitung natürlicher Sprache, der Textgenerierung, der Spracherkennung und Empfehlungssystemen eingesetzt werden. Durch das Lernen aus großen Datenmengen ist LLM in der Lage, Text zu generieren

Large Language Models (LLMs) werden auf riesigen Textdatenbanken trainiert und erwerben dort große Mengen an realem Wissen. Dieses Wissen wird in ihre Parameter eingebettet und kann dann bei Bedarf genutzt werden. Das Wissen über diese Modelle wird am Ende der Ausbildung „verdinglicht“. Am Ende des Vortrainings hört das Modell tatsächlich auf zu lernen. Richten Sie das Modell aus oder verfeinern Sie es, um zu erfahren, wie Sie dieses Wissen nutzen und natürlicher auf Benutzerfragen reagieren können. Aber manchmal reicht Modellwissen nicht aus, und obwohl das Modell über RAG auf externe Inhalte zugreifen kann, wird es als vorteilhaft angesehen, das Modell durch Feinabstimmung an neue Domänen anzupassen. Diese Feinabstimmung erfolgt mithilfe von Eingaben menschlicher Annotatoren oder anderer LLM-Kreationen, wobei das Modell auf zusätzliches Wissen aus der realen Welt trifft und dieses integriert

Laut Nachrichten dieser Website vom 31. Juli verklagte der Technologieriese Amazon am Dienstag vor dem Bundesgericht in Delaware das finnische Telekommunikationsunternehmen Nokia und beschuldigte es, mehr als ein Dutzend Amazon-Patente im Zusammenhang mit Cloud-Computing-Technologie verletzt zu haben. 1. Amazon gab in der Klage an, dass Nokia mit dem Amazon Cloud Computing Service (AWS) verbundene Technologien, einschließlich Cloud-Computing-Infrastruktur, Sicherheits- und Leistungstechnologien, missbraucht habe, um seine eigenen Cloud-Service-Produkte zu verbessern. Amazon habe AWS im Jahr 2006 eingeführt und seine bahnbrechende Cloud-Computing-Technologie sei seit Anfang der 2000er Jahre entwickelt worden, heißt es in der Beschwerde. „Amazon ist ein Pionier im Cloud Computing, und jetzt nutzt Nokia Amazons patentierte Cloud-Computing-Innovationen ohne Erlaubnis“, heißt es in der Beschwerde. Amazon beantragt vor Gericht eine einstweilige Verfügung zur Sperrung

Herausgeber | Der Frage-Antwort-Datensatz (QA) von ScienceAI spielt eine entscheidende Rolle bei der Förderung der Forschung zur Verarbeitung natürlicher Sprache (NLP). Hochwertige QS-Datensätze können nicht nur zur Feinabstimmung von Modellen verwendet werden, sondern auch effektiv die Fähigkeiten großer Sprachmodelle (LLMs) bewerten, insbesondere die Fähigkeit, wissenschaftliche Erkenntnisse zu verstehen und zu begründen. Obwohl es derzeit viele wissenschaftliche QS-Datensätze aus den Bereichen Medizin, Chemie, Biologie und anderen Bereichen gibt, weisen diese Datensätze immer noch einige Mängel auf. Erstens ist das Datenformular relativ einfach, die meisten davon sind Multiple-Choice-Fragen. Sie sind leicht auszuwerten, schränken jedoch den Antwortauswahlbereich des Modells ein und können die Fähigkeit des Modells zur Beantwortung wissenschaftlicher Fragen nicht vollständig testen. Im Gegensatz dazu offene Fragen und Antworten

Herausgeber |. KX Im Bereich der Arzneimittelforschung und -entwicklung ist die genaue und effektive Vorhersage der Bindungsaffinität von Proteinen und Liganden für das Arzneimittelscreening und die Arzneimitteloptimierung von entscheidender Bedeutung. Aktuelle Studien berücksichtigen jedoch nicht die wichtige Rolle molekularer Oberflächeninformationen bei Protein-Ligand-Wechselwirkungen. Auf dieser Grundlage schlugen Forscher der Universität Xiamen ein neuartiges Framework zur multimodalen Merkmalsextraktion (MFE) vor, das erstmals Informationen über Proteinoberfläche, 3D-Struktur und -Sequenz kombiniert und einen Kreuzaufmerksamkeitsmechanismus verwendet, um verschiedene Modalitäten zu vergleichen Ausrichtung. Experimentelle Ergebnisse zeigen, dass diese Methode bei der Vorhersage von Protein-Ligand-Bindungsaffinitäten Spitzenleistungen erbringt. Darüber hinaus belegen Ablationsstudien die Wirksamkeit und Notwendigkeit der Proteinoberflächeninformation und der multimodalen Merkmalsausrichtung innerhalb dieses Rahmens. Verwandte Forschungen beginnen mit „S

Laut Nachrichten dieser Website vom 1. August hat SK Hynix heute (1. August) einen Blogbeitrag veröffentlicht, in dem es ankündigt, dass es am Global Semiconductor Memory Summit FMS2024 teilnehmen wird, der vom 6. bis 8. August in Santa Clara, Kalifornien, USA, stattfindet viele neue Technologien Generation Produkt. Einführung des Future Memory and Storage Summit (FutureMemoryandStorage), früher Flash Memory Summit (FlashMemorySummit), hauptsächlich für NAND-Anbieter, im Zusammenhang mit der zunehmenden Aufmerksamkeit für die Technologie der künstlichen Intelligenz wurde dieses Jahr in Future Memory and Storage Summit (FutureMemoryandStorage) umbenannt Laden Sie DRAM- und Speicheranbieter und viele weitere Akteure ein. Neues Produkt SK Hynix wurde letztes Jahr auf den Markt gebracht
