Traducteur | Cui Hao
Critique | Sun Shujuan
De manière générale, il y a une raison pour laquelle les entreprises ne prennent pas l'initiative de construire leur propre infrastructure de cloud computing. Au cours de la dernière décennie, les équipes d'infrastructure informatique ont tenté de créer leurs propres cloud privés, car elles pensaient qu'ils soutiendraient leur entreprise de manière plus rentable que les cloud publics. Mais contrairement aux attentes, le temps et le coût consacrés au cloud privé ont dépassé les attentes. Une fois le cloud privé créé, davantage de ressources étaient nécessaires pour le maintenir, et il était légèrement inférieur au cloud public en termes de sécurité et d'extension. En conséquence, les entreprises qui construisent leurs propres cloud privés finissent par ne pas disposer de plus de ressources pour investir dans leurs activités principales, mais investissent plutôt beaucoup de temps et de personnel dans une infrastructure qui ne peut pas répondre aux besoins de leur entreprise.
De nos jours, de nombreuses entreprises génèrent des solutions via divers outils open source (tels qu'Apache Spark), mais la plupart des actions MLOps nécessitent des opérations manuelles répétées.
Cela se traduit par des déploiements de modèles prenant des semaines, voire des mois, des temps d'exécution inefficaces (mesurés par le calcul et l'inférence prenant du temps à s'exécuter) et un manque d'observations pour les tests et la surveillance des modèles. En outre, l'approche utilisée était trop personnalisée pour fournir des processus métier évolutifs et réutilisables pour plusieurs cas d'utilisation dans différentes parties de l'entreprise.
De plus, des conversations avec les dirigeants des secteurs d'activité et les responsables de l'analyse des données ont conduit à la conclusion que même si l'organisation a embauché de nombreux data scientists, elle n'a vu aucun retour. Au fur et à mesure que la recherche s'approfondit, ils continueront à poser diverses questions et à utiliser ces questions pour identifier les difficultés et les obstacles rencontrés par l'intelligence artificielle. Ils ont rapidement compris que le problème clé résidait dans le « dernier kilomètre » : déployer les modèles et les appliquer aux données en temps réel, en les exécutant efficacement afin que les avantages dépassent les coûts et ainsi mieux mesurer leurs performances.
Pour résoudre les problèmes commerciaux et prendre des décisions commerciales, les data scientists transforment les données en modèles. Ce processus nécessite deux ensembles de compétences : premièrement, l'expertise et les compétences nécessaires pour créer de bons modèles ; deuxièmement, les compétences nécessaires pour utiliser le code pour piloter le modèle dans le monde réel, tout en surveillant et en mettant à jour le modèle. Or, ces deux types de compétences sont complètement différentes.
C'est précisément à cause de cette différence que les ingénieurs ML entrent en jeu. Les ingénieurs ML intègrent des outils et des cadres pour garantir que les données, les pipelines et l'infrastructure fonctionnent ensemble pour produire des modèles ML à grande échelle.
Même avec les meilleurs ingénieurs ML, les entreprises sont toujours confrontées à deux problèmes majeurs lors du développement de l'IA :
Afin d'améliorer les capacités d'automatisation ; afin de fournir des expériences personnalisées à grande échelle aux utilisateurs afin de tenir les promesses des utilisateurs plus précises, plus granulaires et prévisibles, les entreprises ont investi ; en intelligence artificielle. Mais jusqu’à présent, il existe un énorme écart entre les promesses de l’IA et ses résultats, puisque seulement 10 % environ des investissements dans l’IA génèrent un retour sur investissement significatif.
Enfin, afin de résoudre le problème du MLOps, les responsables de l'analyse des données doivent développer leurs propres capacités autour de la science des données au cœur de l'entreprise, tout en investissant également dans d'autres technologies liées à l'automatisation du MLOps. Il s’agit d’un dilemme courant « construire ou acheter ». Il n’est pas seulement considéré d’un point de vue opérationnel (coût-bénéfice), mais doit également tenir compte de la rapidité et de l’efficacité des investissements en IA dans toute l’entreprise, et de la possibilité de nouvelles méthodes. mieux générer des revenus, des produits et une clientèle, ou réduire les coûts en augmentant l'automatisation et en réduisant les déchets.
Cui Hao, rédacteur de la communauté 51CTO, architecte senior, a 18 ans d'expérience en développement de logiciels et en architecture, et 10 ans d'expérience en architecture distribuée. Anciennement expert technique chez HP. Il est prêt à partager et a écrit de nombreux articles techniques populaires avec plus de 600 000 lectures. Auteur de "Principes et pratique de l'architecture distribuée".
Titre original :MLOps | L'entreprise répète-t-elle les mêmes erreurs de bricolage ?
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!