AI 開発を加速するために、企業はどのように MLOps を使用して生産効率を向上させることができるでしょうか?
企業が人工知能を導入して機械学習プロジェクトを初めて構築するとき、多くの場合、理論に焦点を当てます。それでは、必要な結果を提供できるモデルはあるのでしょうか?もしそうなら、そのようなモデルをどのように構築してトレーニングすればよいでしょうか?
IDC のデータによると、人工知能または機械学習ソリューションの導入には平均して 9 か月以上かかります。その主な理由は、データ サイエンティストがこれらの概念実証を構築するために使用するツールが、運用システムにうまく応用できないことが多いためです。 IDCアナリストのSriram Subramanian氏は、「私たちは研究開発プロセスに必要な時間を『モデルスピード』と呼んでいます。つまり、開始から終了までにかかる時間を指します。」
企業はMLOpsを使用して上記の問題を解決できます。 MLOps (Machine Learning Operations) は、理論的概念を使用して AI システムを検証し、効果的にするためのデータ、モデル、展開、監視、その他の側面を企業が管理するのに役立つ一連のベスト プラクティス、フレームワーク、ツールです。
Subramanian 氏はさらに、「MLOps を使用すると、モデルの速度が数週間、場合によっては数日まで短縮されます。これは、DevOps を使用してアプリケーションの平均構築時間を短縮するのと同じです。これが MLOps が必要な理由です。」と説明しました。より多くのモデル、より迅速な革新、より多くの使用シナリオに対応します。 「MLOps の価値提案は明らかです。」
IDC によると、2024 年までに企業の 60% が機械学習ワークフローの実装に MLOps を使用する予定です。 Subramanian 氏は、AI と機械学習の導入の課題について回答者を調査したところ、コストに次いで最大の障壁の 1 つは MLOps の不足であったと述べました。
この記事では、MLOps とは何か、MLOps がどのように進化してきたか、AI 運用に対するこの新たなアプローチを最大限に活用するために組織が何を達成し、留意する必要があるかを検討します。
MLOps の進化
数年前、Eugenio Zuccarelli が初めて機械学習プロジェクトの構築を始めたとき、MLOps は単なるベスト プラクティスのセットでした。それ以来、Zuccarelli 氏はヘルスケアや金融サービスを含むいくつかの企業で AI プロジェクトに取り組み、MLOps が時間の経過とともに進化し始め、さまざまなツールやプラットフォームが組み込まれるのを見てきました。
現在、MLOps は人工知能を運用するための非常に強力なフレームワークを提供しています。現在 CVS Health でイノベーション データ サイエンティストを務める Zuccarelli 氏は、以前に取り組んだプロジェクトを引用して、次のような有害な結果を予測するためのアプリケーションを作成できるシステムを作成したと述べました。再入院または病気の進行として。
「私たちはデータセットとモデルを調査し、医師とコミュニケーションをとって、最適なモデルの特徴を見つけ出しています。しかし、これらのモデルが本当に役立つためには、ユーザーがこれらのモデルを実際に使用する必要があります。」
これは、API を介して接続されたバックエンドの機械学習システムを使用して、信頼性が高く、高速で安定したモバイル アプリケーションを構築することを意味します。 「MLOps がなければ、これを確実に行うことはできません。」と彼は言い、彼のチームは H2O MLOps プラットフォームとその他のツールを使用して、モデルの健全性ダッシュボードを作成しました。 「モデルに大幅な変更を加えることは絶対に望ましくありません。また、バイアスを導入することも望ましくありません。健全性ダッシュボードを使用すると、システムが変更されたかどうかを理解できます。」
実稼働システムの更新も可能です。 MLOps プラットフォームを使用して作成されます。 「アプリケーションの作業を停止せずにファイルをスワップアウトすることは非常に困難です。MLOps は、システムへの影響を最小限に抑えながら、運用の進行中にシステムをスワップアウトできます。」
彼は、MLOps プラットフォームが成熟するにつれて、企業はプロジェクトごとにフレームワークを再発明する必要がなくなるため、モデル開発プロセス全体がスピードアップします。データ パイプライン管理機能も AI の実装にとって重要です。
「相互に通信する必要があるデータ ソースが複数ある場合、ここで MLOps が活躍します。機械学習モデルに流入するすべてのデータには一貫性があり、高品質であることが必要です。その文「よく言われるように、ゴミが入ったらゴミが出ます。モデルの情報が貧弱であれば、予測自体も貧弱になります。」
MLOps の基礎: 常に変化するターゲット
しかし、利用可能なプラットフォームやツールが非常に多くあるというだけの理由で、MLOps の核となる原則が無視されているとは考えないでください。 MLOps を初めて使用する企業は、MLOps の核心はデータ サイエンスとデータ エンジニアリングの間に強力なつながりを築くことであることを覚えておく必要があります。
Zuccarelli 氏は次のように述べています。「MLOps プロジェクトを確実に成功させるには、データ エンジニアとデータ サイエンティストが同じチームで作業する必要があります。」
さらに、偏見を防ぎ、透明性を確保し、 「これは非常に新しい分野であるため、この分野で行う必要のある作業は間違いなく多くあります。」
したがって、完全なターンキー ソリューションが利用可能になると、企業は AI のあらゆる側面を実装する際に MLOps を効果的に行う方法を十分に理解する必要があります。それは広範な専門知識を構築することを意味すると、テクノロジーコンサルタント会社インサイトのAIチームのナショナルプラクティスマネージャーであるミーガン・ジェントリー氏は述べた。
MLOps は、データ収集、検証、分析から、マシン リソースの管理、モデル パフォーマンスの追跡までの範囲全体をカバーします。ローカル、クラウド、またはエッジに展開できる補助ツールが多数あります。これらのツールの一部はオープンですソースと一部は独自のものです。
しかし、テクノロジーのマスタリングは 1 つの側面にすぎず、MLOps は DevOps の反復開発のアジャイルな手法と原則も利用している、と Gentry 氏は言いました。さらに、他のアジャイル関連分野と同様に、コミュニケーションが重要です。
「データ サイエンティストとデータ エンジニアの間のコミュニケーション、DevOps とのコミュニケーション、そして IT チーム全体とのコミュニケーションなど、それぞれの役割でのコミュニケーションが非常に重要です。」
起業したばかりの企業にとって、MLOps は次のことができます。多くの一般原則、多数の関連ベンダー、さらには多数のオープンソース ツール セットがあります。
「ここにはあらゆる種類の落とし穴があります」とキャップジェミニ アメリカズのエンタープライズ アーキテクチャ担当シニア マネージャーのヘレン リストフ氏は言います。 「それらの多くはまだ開発中であり、正式なガイドラインはまだありません。DevOps と同様、これはまだ新興テクノロジーであり、ガイドラインと関連ポリシーが展開されるまでにはしばらく時間がかかります。」
Ristov 企業はデータ プラットフォームから MLOps の取り組みを開始することをお勧めします。 「おそらくデータセットはあるでしょうが、それらは異なる場所にあり、統一された環境はありません。」
企業はすべてのデータを 1 つのプラットフォームに移行する必要はありませんが、移行する必要はあると彼女は言いました。メソッドはさまざまなデータ ソースからデータを導入し、アプリケーションが異なれば状況も異なります。たとえば、データ レイクは、大量の分析を高頻度で低コストのストレージで実行する企業に最適です。 MLOps プラットフォームには、データ パイプラインを構築および管理し、さまざまなバージョンのトレーニング データを追跡するためのツールが備わっていることがよくありますが、これは万能のアプローチではありません。さらに、モデルの作成、バージョン管理、ロギング、機能セットの測定、モデル自体の管理などの他の側面もあります。
「多くのコーディングが必要です。MLOps プラットフォームの構築には数か月かかる場合があり、統合に関してはプラットフォーム ベンダーがやるべきことがまだたくさんあります。」とリストフ氏は言いました。
「これらのさまざまな方向に開発の余地がたくさんあり、多くのツールがまだ開発中です。エコシステムは非常に大きく、人々は必要なものを選んでいるだけです。MLOps はまだ開発段階にあります。
MLOps の市場状況
IDC の Subramanian 氏は、MLOps の市場規模は 2020 年の 1 億 8,500 万ドルから、 2025 米ドルで約 7 億ドルですが、MLOps 製品は大規模なプラットフォームにバンドルされていることが多いため、この市場が大幅に過小評価されている可能性もあります。同氏は、MLOps市場の実際の規模は2025年までに20億ドルを超える可能性があると述べた。
Subramanian 氏は、MLOps ベンダーは 3 つの大きなカテゴリに分類される傾向があると述べ、1 つ目は、MLOps 機能をサービスとして顧客に提供する、AWS、Azure、Google Cloud などの大規模なクラウド プロバイダーです。
2 番目のカテゴリは、DataRobot、Dataiku、Iguazio などの機械学習プラットフォーム メーカーです。
「3 番目のカテゴリは、Cloudera、SAS、DataBricks などのデータ管理ベンダーと呼ばれるものです。彼らの利点はデータ管理機能とデータ操作にあり、さらに機械学習機能にも拡張されます。
Subramanian 氏は、これら 3 つの分野が爆発的な成長を示しており、MLOps ベンダーを際立たせるのは、ローカル環境とクラウド展開モデルの両方をサポートできるかどうか、そして信頼できるソリューションを実装できるかどうかであると述べました。 , 責任ある人工知能、プラグアンドプレイであるかどうか、拡張が容易であるかどうか、これは違いを反映する側面です。 」
最近の IDC 調査によると、責任ある AI を実装するためのさまざまな方法の欠如が、人工知能と機械学習の普及に対する上位 3 つの障壁の 1 つであり、MLOps の欠如と並んで 2 位となっています。 Gartner の人工知能と機械学習のリサーチ アナリスト、Sumit Agarwal 氏は、この状況は MLOps を採用する以外に選択肢がないことが主な原因であると述べています。 、他のオプションは実際にはありません。スケーリングしたい場合は自動化が必要です。コード、データ、モデルのトレーサビリティが必要です。 "
Gartner による最近の調査によると、モデルの概念実証から製品化までにかかる平均時間は 9 か月から 7.3 か月に短縮されました。" しかし、7.3 か月はまだ長い時間です。組織が MLOps を活用する機会は数多くあります。 "
MLOps によってもたらされた企業文化の変化
Genpact の分析グローバル責任者であるアマレシュ トリパシー氏は、MLOps の実装にはエンタープライズ AI チームとしての文化的な変化も必要であると述べました。
「データ サイエンティストは、干し草の山から針を見つけようとしているマッド サイエンティストであることがよくあります。しかし実際には、データ サイエンティストは発見者および探索者であり、ウィジェットを生産する工場ではありません。 「企業は、自分たちが行う必要のある労力を過小評価することがよくあります。
」人々はエンジニアリングをよりよく理解し、ユーザー エクスペリエンスに対してこれこれの要件を持つことができますが、何らかの理由で、人々は展開モデルに対してまったく異なる要件を持っています。環境のテストが得意なデータ サイエンティストは全員、これらのモデルを自然に展開するか、数人の IT スタッフを派遣して展開できると考える人もいるでしょうが、これは間違いです。人々は自分たちが何を必要としているのか理解していません。 「
多くの企業は、MLOps が会社の他の側面に与える波及効果に気づいていません。それが社内に大きな変化をもたらすことがよくあります。
「コールセンターに MLOps を導入すると、単純なものは機械や AI に処理を任せることができ、人間に任せるものは実際により長い時間がかかるため、平均応答時間は実際に増加します。これらのことは傾向が強いためです。」 「もっと複雑になります。ですから、これらの仕事が何なのか、どんな人材が必要なのか、どんなスキルを持った人材が必要なのかを再考する必要があります。」
Tripathy 氏は、現在、企業の組織内の意思決定はアルゴリズムによって左右されますが、これは急速に変化しています。 「今後 5 年間で、意思決定の 20% から 25% がアルゴリズムによって行われるようになると予測しています。そして、私たちが目にするあらゆる統計は、人工知能の急速な拡大の変曲点にあることを示しています。」
彼は MLOps が重要な部分であると信じています。 MLOps がなければ、AI を一貫して使用することはできません。 MLOps は、エンタープライズ AI を拡張するための触媒です。
以上がAI 開発を加速するために、企業はどのように MLOps を使用して生産効率を向上させることができるでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性を実証しています。 「S」で始まる関連研究

7月5日のこのウェブサイトのニュースによると、グローバルファウンドリーズは今年7月1日にプレスリリースを発行し、自動車とインターネットでの市場シェア拡大を目指してタゴール・テクノロジーのパワー窒化ガリウム(GaN)技術と知的財産ポートフォリオを買収したことを発表した。モノと人工知能データセンターのアプリケーション分野で、より高い効率とより優れたパフォーマンスを探求します。生成 AI などのテクノロジーがデジタル世界で発展を続ける中、窒化ガリウム (GaN) は、特にデータセンターにおいて、持続可能で効率的な電力管理のための重要なソリューションとなっています。このウェブサイトは、この買収中にタゴール・テクノロジーのエンジニアリングチームがGLOBALFOUNDRIESに加わり、窒化ガリウム技術をさらに開発するという公式発表を引用した。 G
