企業が人工知能を導入して機械学習プロジェクトを初めて構築するとき、多くの場合、理論に焦点を当てます。それでは、必要な結果を提供できるモデルはあるのでしょうか?もしそうなら、そのようなモデルをどのように構築してトレーニングすればよいでしょうか?
IDC のデータによると、人工知能または機械学習ソリューションの導入には平均して 9 か月以上かかります。その主な理由は、データ サイエンティストがこれらの概念実証を構築するために使用するツールが、運用システムにうまく応用できないことが多いためです。 IDCアナリストのSriram Subramanian氏は、「私たちは研究開発プロセスに必要な時間を『モデルスピード』と呼んでいます。つまり、開始から終了までにかかる時間を指します。」
企業はMLOpsを使用して上記の問題を解決できます。 MLOps (Machine Learning Operations) は、理論的概念を使用して AI システムを検証し、効果的にするためのデータ、モデル、展開、監視、その他の側面を企業が管理するのに役立つ一連のベスト プラクティス、フレームワーク、ツールです。
Subramanian 氏はさらに、「MLOps を使用すると、モデルの速度が数週間、場合によっては数日まで短縮されます。これは、DevOps を使用してアプリケーションの平均構築時間を短縮するのと同じです。これが MLOps が必要な理由です。」と説明しました。より多くのモデル、より迅速な革新、より多くの使用シナリオに対応します。 「MLOps の価値提案は明らかです。」
IDC によると、2024 年までに企業の 60% が機械学習ワークフローの実装に MLOps を使用する予定です。 Subramanian 氏は、AI と機械学習の導入の課題について回答者を調査したところ、コストに次いで最大の障壁の 1 つは MLOps の不足であったと述べました。
この記事では、MLOps とは何か、MLOps がどのように進化してきたか、AI 運用に対するこの新たなアプローチを最大限に活用するために組織が何を達成し、留意する必要があるかを検討します。
数年前、Eugenio Zuccarelli が初めて機械学習プロジェクトの構築を始めたとき、MLOps は単なるベスト プラクティスのセットでした。それ以来、Zuccarelli 氏はヘルスケアや金融サービスを含むいくつかの企業で AI プロジェクトに取り組み、MLOps が時間の経過とともに進化し始め、さまざまなツールやプラットフォームが組み込まれるのを見てきました。
現在、MLOps は人工知能を運用するための非常に強力なフレームワークを提供しています。現在 CVS Health でイノベーション データ サイエンティストを務める Zuccarelli 氏は、以前に取り組んだプロジェクトを引用して、次のような有害な結果を予測するためのアプリケーションを作成できるシステムを作成したと述べました。再入院または病気の進行として。
「私たちはデータセットとモデルを調査し、医師とコミュニケーションをとって、最適なモデルの特徴を見つけ出しています。しかし、これらのモデルが本当に役立つためには、ユーザーがこれらのモデルを実際に使用する必要があります。」
これは、API を介して接続されたバックエンドの機械学習システムを使用して、信頼性が高く、高速で安定したモバイル アプリケーションを構築することを意味します。 「MLOps がなければ、これを確実に行うことはできません。」と彼は言い、彼のチームは H2O MLOps プラットフォームとその他のツールを使用して、モデルの健全性ダッシュボードを作成しました。 「モデルに大幅な変更を加えることは絶対に望ましくありません。また、バイアスを導入することも望ましくありません。健全性ダッシュボードを使用すると、システムが変更されたかどうかを理解できます。」
実稼働システムの更新も可能です。 MLOps プラットフォームを使用して作成されます。 「アプリケーションの作業を停止せずにファイルをスワップアウトすることは非常に困難です。MLOps は、システムへの影響を最小限に抑えながら、運用の進行中にシステムをスワップアウトできます。」
彼は、MLOps プラットフォームが成熟するにつれて、企業はプロジェクトごとにフレームワークを再発明する必要がなくなるため、モデル開発プロセス全体がスピードアップします。データ パイプライン管理機能も AI の実装にとって重要です。
「相互に通信する必要があるデータ ソースが複数ある場合、ここで MLOps が活躍します。機械学習モデルに流入するすべてのデータには一貫性があり、高品質であることが必要です。その文「よく言われるように、ゴミが入ったらゴミが出ます。モデルの情報が貧弱であれば、予測自体も貧弱になります。」
MLOps の基礎: 常に変化するターゲット
Zuccarelli 氏は次のように述べています。「MLOps プロジェクトを確実に成功させるには、データ エンジニアとデータ サイエンティストが同じチームで作業する必要があります。」
さらに、偏見を防ぎ、透明性を確保し、 「これは非常に新しい分野であるため、この分野で行う必要のある作業は間違いなく多くあります。」
したがって、完全なターンキー ソリューションが利用可能になると、企業は AI のあらゆる側面を実装する際に MLOps を効果的に行う方法を十分に理解する必要があります。それは広範な専門知識を構築することを意味すると、テクノロジーコンサルタント会社インサイトのAIチームのナショナルプラクティスマネージャーであるミーガン・ジェントリー氏は述べた。
MLOps は、データ収集、検証、分析から、マシン リソースの管理、モデル パフォーマンスの追跡までの範囲全体をカバーします。ローカル、クラウド、またはエッジに展開できる補助ツールが多数あります。これらのツールの一部はオープンですソースと一部は独自のものです。
しかし、テクノロジーのマスタリングは 1 つの側面にすぎず、MLOps は DevOps の反復開発のアジャイルな手法と原則も利用している、と Gentry 氏は言いました。さらに、他のアジャイル関連分野と同様に、コミュニケーションが重要です。
「データ サイエンティストとデータ エンジニアの間のコミュニケーション、DevOps とのコミュニケーション、そして IT チーム全体とのコミュニケーションなど、それぞれの役割でのコミュニケーションが非常に重要です。」
起業したばかりの企業にとって、MLOps は次のことができます。多くの一般原則、多数の関連ベンダー、さらには多数のオープンソース ツール セットがあります。
「ここにはあらゆる種類の落とし穴があります」とキャップジェミニ アメリカズのエンタープライズ アーキテクチャ担当シニア マネージャーのヘレン リストフ氏は言います。 「それらの多くはまだ開発中であり、正式なガイドラインはまだありません。DevOps と同様、これはまだ新興テクノロジーであり、ガイドラインと関連ポリシーが展開されるまでにはしばらく時間がかかります。」
Ristov 企業はデータ プラットフォームから MLOps の取り組みを開始することをお勧めします。 「おそらくデータセットはあるでしょうが、それらは異なる場所にあり、統一された環境はありません。」
企業はすべてのデータを 1 つのプラットフォームに移行する必要はありませんが、移行する必要はあると彼女は言いました。メソッドはさまざまなデータ ソースからデータを導入し、アプリケーションが異なれば状況も異なります。たとえば、データ レイクは、大量の分析を高頻度で低コストのストレージで実行する企業に最適です。 MLOps プラットフォームには、データ パイプラインを構築および管理し、さまざまなバージョンのトレーニング データを追跡するためのツールが備わっていることがよくありますが、これは万能のアプローチではありません。さらに、モデルの作成、バージョン管理、ロギング、機能セットの測定、モデル自体の管理などの他の側面もあります。
「多くのコーディングが必要です。MLOps プラットフォームの構築には数か月かかる場合があり、統合に関してはプラットフォーム ベンダーがやるべきことがまだたくさんあります。」とリストフ氏は言いました。
「これらのさまざまな方向に開発の余地がたくさんあり、多くのツールがまだ開発中です。エコシステムは非常に大きく、人々は必要なものを選んでいるだけです。MLOps はまだ開発段階にあります。
IDC の Subramanian 氏は、MLOps の市場規模は 2020 年の 1 億 8,500 万ドルから、 2025 米ドルで約 7 億ドルですが、MLOps 製品は大規模なプラットフォームにバンドルされていることが多いため、この市場が大幅に過小評価されている可能性もあります。同氏は、MLOps市場の実際の規模は2025年までに20億ドルを超える可能性があると述べた。
Subramanian 氏は、MLOps ベンダーは 3 つの大きなカテゴリに分類される傾向があると述べ、1 つ目は、MLOps 機能をサービスとして顧客に提供する、AWS、Azure、Google Cloud などの大規模なクラウド プロバイダーです。
2 番目のカテゴリは、DataRobot、Dataiku、Iguazio などの機械学習プラットフォーム メーカーです。
「3 番目のカテゴリは、Cloudera、SAS、DataBricks などのデータ管理ベンダーと呼ばれるものです。彼らの利点はデータ管理機能とデータ操作にあり、さらに機械学習機能にも拡張されます。
Subramanian 氏は、これら 3 つの分野が爆発的な成長を示しており、MLOps ベンダーを際立たせるのは、ローカル環境とクラウド展開モデルの両方をサポートできるかどうか、そして信頼できるソリューションを実装できるかどうかであると述べました。 , 責任ある人工知能、プラグアンドプレイであるかどうか、拡張が容易であるかどうか、これは違いを反映する側面です。 」
最近の IDC 調査によると、責任ある AI を実装するためのさまざまな方法の欠如が、人工知能と機械学習の普及に対する上位 3 つの障壁の 1 つであり、MLOps の欠如と並んで 2 位となっています。 Gartner の人工知能と機械学習のリサーチ アナリスト、Sumit Agarwal 氏は、この状況は MLOps を採用する以外に選択肢がないことが主な原因であると述べています。 、他のオプションは実際にはありません。スケーリングしたい場合は自動化が必要です。コード、データ、モデルのトレーサビリティが必要です。 "
Gartner による最近の調査によると、モデルの概念実証から製品化までにかかる平均時間は 9 か月から 7.3 か月に短縮されました。" しかし、7.3 か月はまだ長い時間です。組織が MLOps を活用する機会は数多くあります。 "
MLOps によってもたらされた企業文化の変化
「データ サイエンティストは、干し草の山から針を見つけようとしているマッド サイエンティストであることがよくあります。しかし実際には、データ サイエンティストは発見者および探索者であり、ウィジェットを生産する工場ではありません。 「企業は、自分たちが行う必要のある労力を過小評価することがよくあります。
」人々はエンジニアリングをよりよく理解し、ユーザー エクスペリエンスに対してこれこれの要件を持つことができますが、何らかの理由で、人々は展開モデルに対してまったく異なる要件を持っています。環境のテストが得意なデータ サイエンティストは全員、これらのモデルを自然に展開するか、数人の IT スタッフを派遣して展開できると考える人もいるでしょうが、これは間違いです。人々は自分たちが何を必要としているのか理解していません。 「
多くの企業は、MLOps が会社の他の側面に与える波及効果に気づいていません。それが社内に大きな変化をもたらすことがよくあります。
「コールセンターに MLOps を導入すると、単純なものは機械や AI に処理を任せることができ、人間に任せるものは実際により長い時間がかかるため、平均応答時間は実際に増加します。これらのことは傾向が強いためです。」 「もっと複雑になります。ですから、これらの仕事が何なのか、どんな人材が必要なのか、どんなスキルを持った人材が必要なのかを再考する必要があります。」
Tripathy 氏は、現在、企業の組織内の意思決定はアルゴリズムによって左右されますが、これは急速に変化しています。 「今後 5 年間で、意思決定の 20% から 25% がアルゴリズムによって行われるようになると予測しています。そして、私たちが目にするあらゆる統計は、人工知能の急速な拡大の変曲点にあることを示しています。」
彼は MLOps が重要な部分であると信じています。 MLOps がなければ、AI を一貫して使用することはできません。 MLOps は、エンタープライズ AI を拡張するための触媒です。
以上がAI 開発を加速するために、企業はどのように MLOps を使用して生産効率を向上させることができるでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。