ドイツのフライブルク大学の機械学習研究室長フランク・ヒッター氏は、こうした人間による決断の結果、複雑なモデルは体系的ではなく「直観的に設計」されることになる、と述べた。
#自動機械学習 (autoML) と呼ばれる成長分野は、この推測を排除することを目的としています。そのアイデアは、現在研究者がモデルを設計する際に行わなければならない決定をアルゴリズムに引き継がせることです。最終的には、これらのテクノロジーにより機械学習がよりアクセスしやすくなる可能性があります。
自動機械学習は 10 年近く前から存在していますが、研究者は依然としてその改良に取り組んでいます。本日ボルチモアで開催される新しいカンファレンスでは、autoML の精度を向上させ、パフォーマンスを合理化するための取り組みが紹介されます。
機械学習を簡素化する autoML の可能性に強い関心が寄せられています。 Amazon や Google などの企業は、autoML テクノロジーを活用したローコード機械学習ツールをすでに提供しています。これらの手法がより効果的になれば、研究がスピードアップされ、より多くの人が機械学習を利用できるようになる可能性があります。
そのアイデアは、人々が尋ねたい質問を選択し、それに autoML ツールを向けて、望む結果が得られるようにすることです。
このビジョンは「コンピューター サイエンスの聖杯」であると、ワイオミング大学のコンピューター サイエンス助教授でカンファレンスの主催者であるラース コットホフ氏は述べています。しかし、まず研究者は、これらの技術の時間効率とエネルギー効率を高める方法を見つけ出す必要があります。
#自動機械学習は何を解決できるのでしょうか? 一見すると、autoML の概念は冗長に思えるかもしれません。結局のところ、機械学習はすでにデータから洞察を引き出すプロセスを自動化するものなのです。ただし、autoML アルゴリズムは、基礎となる機械学習モデルよりも上の抽象化レベルで動作し、ガイダンスとしてこれらのモデルの出力のみに依存するため、時間と計算労力を節約します。 研究者は、autoML テクノロジーを事前トレーニングされたモデルに適用して、既存の研究を複製して計算能力を無駄にすることなく、新しい洞察を得ることができます。 たとえば、米国の富士通総研の研究員である Mehdi Bahrami 氏とその共著者らは、さまざまな事前トレーニング済みモデルで BERT ソート アルゴリズムを使用して、さまざまな状況に適応する方法に関する最近の研究を発表しました。新しい目的。 BERT ソートは、データセットでトレーニングするときに、いわゆる「意味的順序」を見つけるアルゴリズムです。たとえば、映画レビュー データが与えられた場合、「素晴らしい」映画が「良い」映画や「悪い」映画よりも上位にランク付けされることがわかります。 autoML テクノロジーの助けを借りて、学習された意味順序を一般化して、がん診断や外国語テキストを分類することもできるため、時間と計算量が削減されます。 「BERT は何か月もの計算が必要で、モデルを生成してプロセスを繰り返すのに 100 万ドルほどかかるなど、非常に高価です。だから、全員が同じことをしたいと思ったら、それは高価です。それはエネルギーではありません」と Bahrami 氏は述べました。 この分野で期待が示されているにもかかわらず、研究者たちは依然として autoML テクノロジーの計算効率を高める方法を模索しています。たとえば、最適なモデルを見つけるために多くの異なるモデルが構築およびテストされる Neural Architecture Search (NAS) のような手法では、これらすべての反復を完了するために必要なエネルギーが膨大になる可能性があります。 自動機械学習は、データを分類するためのランダム決定フォレストやサポート ベクター マシンの作成など、ニューラル ネットワークを含まない機械学習アルゴリズムにも適用できます。これらの分野の研究は進行中であり、autoML テクノロジーをプロジェクトに統合したい人が利用できるコーディング ライブラリがすでに多数存在します。 Hutter 氏は、次のステップは autoML を使用して不確実性を定量化し、アルゴリズムの信頼性と公平性の問題に対処することであると述べました。このビジョンでは、信頼性と公平性の基準は、精度などの他の機械学習の制約と同様になります。 AutoML は、これらのアルゴリズムで見つかったバイアスをリリース前にキャプチャして自動的に修正できます。 ニューラル アーキテクチャの検索における継続的な進歩しかし、ディープ ラーニングのようなアプリケーションにとって、autoML はまだ長い道のりです。深層学習モデルのトレーニングに使用されるデータ (画像、ドキュメント、録音された音声など) は、多くの場合、高密度で複雑です。処理するには膨大な計算能力が必要です。これらのモデルをトレーニングするためのコストと時間は、潤沢な資金を持つ大企業で働く研究者以外の誰にとっても法外な金額になる可能性があります。 カンファレンスのコンペティションでは、参加者はニューラル アーキテクチャ検索のためのエネルギー効率の高い代替アルゴリズムを開発することが求められます。このテクノロジーは計算要件が厳しいことで有名なので、これは非常に困難です。無数の深層学習モデルを自動的に循環させて、研究者がアプリケーションに適したモデルを選択できるようにしますが、このプロセスには数か月かかり、100万ドル以上の費用がかかる場合があります。ゼロコスト ニューラル アーキテクチャ検索エージェントとして知られるこれらの代替アルゴリズムの目標は、計算要件を大幅に削減することで、ニューラル アーキテクチャ検索をよりアクセスしやすく、環境に優しいものにすることです。結果の実行には数か月ではなく、数秒かかります。現在、これらの手法はまだ開発の初期段階にあり、信頼性が低いことも多いですが、機械学習の研究者らは、モデル選択プロセスをより効率的にする可能性があると予測しています。
以上がautoML テクノロジーで AI をより簡単に開発の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。