責任ある機械学習 – 「ガラスの箱」アプローチ
翻訳者 | Cui Hao
レビュアー | Sun Shujuan
冒頭
機械学習は奥深いテクノロジーではありません。複雑なディープ ニューラル ネットワークにおけるマルチパラメーターおよびハイパーパラメーターの手法がコグニティブ コンピューティングの単なる形式であるのと同様に、それらはそれほど奥深いものではないようです。
他のタイプの機械学習もあります (ディープ ニューラル ネットワークを含むものもあります)。このタイプの機械学習のモデルの結果、モデルの決定、および複雑さは、モデルに影響を与えるものはすべて非常に透明です。
これはすべて、組織がデータのソースをどの程度理解しているかによって決まります。
言い換えれば、モデルのトレーニング データから運用データ モデルまですべてを理解する必要があります。また、結果を解釈、洗練、改善するためにも不可欠です。このようにして、組織はモデルのビジネス価値を大幅に高めることができます。
さらに重要なのは、このテクノロジーの公平性、説明責任、透明性がさらに向上し、社会全体にとって信頼性と完全性が向上することです。
Databricks のマーケティング担当副社長である Joel Minnick 氏は次のように認めています。「責任を持って機械学習を行うには、データの上流と下流を詳細に理解する必要があるのはこのためです。」
for data Lineage コンピレーション カタログ
モデルのデータ トレーニングとデータ生成には、データ ソース、データ変換、データ統合などの複数のテクノロジが関係します。成熟したデータ カタログ ソリューションでは、リアルタイムのデータ キャプチャが実現できるため、いつでも進行状況を監視してモデルの実行の進行状況を把握できます。 「モデル内でデータが使用されているコンテキストを明確に理解できるようになります。また、このデータはどこから来たのか? そこから他にどのようなデータを取得したのか? それはいつ生成されたのか? それで、このデータをどのように使用すべきかをよりよく理解するためです」とデータサイエンティストのミニク氏は述べています。
「データ系統」 (データ ソースの記録、移動、処理) はメタデータで構成され、データ ディレクトリは関連するデータ セットを保存するために使用されます。また、カタログを使用すると、ユーザーはタグやその他の記述子を追加のメタデータとして含めることができ、データの出所を追跡し、データの信頼性を確立するのに役立ちます。 Minnick 氏が説明する「データ リネージ」は、さまざまなプラットフォーム (データ サイエンティスト プラットフォーム、データ エンジニア プラットフォーム、エンドユーザー プラットフォームを含む) を接続する「API 主導のサービス」を生成できます。
データ ガバナンス: データ サイエンスのために誕生
データ トレーニングとデータ操作のトレーサビリティの向上は、機械学習モデルの結果に影響を与え、モデルの結果はデータ ガバナンスに関連します。データ サイエンスの分野。密接に関連しています。したがって、データ ガバナンスは、モデルを作成してデプロイするデータ サイエンス プラットフォームと密接に関係しています。 「スキルはスプレッドシートとファイルの管理、ノートブックの管理、ダッシュボードの管理を同時に行います。これは、生産データと消費データを管理する最新の方法です」と Minnick 氏はコメントしました。この言葉は、ノートブックでモデルを構築し、ダッシュボードを通じて出力を監視するデータ サイエンティストにとって当てはまります。
明確かつ透過的
とはいえ、API を介してデータ サイエンス ツール プラットフォームに接続して「データ リネージ」を取得するだけでは、機械学習を透過的に活用することの 1 つの側面にすぎません。モデルの出力を向上させるという目的を達成するには、データリネージで決定された内容で出力モデルを調整する必要もあります。たとえば、データサイエンティストが「データに何か問題があった場合にそれを理解し、データのその部分を切り分けることができる」ように、データのトレーサビリティをモデル化する方法についてミニク氏は述べた。
論理的には、この知識を使用して、特定のデータ型に問題がある理由を理解し、問題を修正したり、完全に削除してモデルの精度を向上させることができます。 Minnick 氏によると、「今日のさまざまな業界で機械学習と人工知能が台頭していることもあり、ますます多くの組織がモデル結果に「データ リネージ」を適用する利点を認識しています。これはますます一般的になってきています。昨年、 AutoML 製品を発売したとき、データ ソースへの透明性を表すために「ガラスの箱」を使用しました。」
規制上の影響とその他
一部の組織では、次の機能を提供するために「データ リネージ」も使用しています。適応型コグニティブ コンピューティング モデルを使用して、規制順守能力を強化します。金融やヘルスケアなどの業界は厳しく規制されており、企業は顧客のために意思決定を行う方法を明確に説明する必要があります。データのトレーサビリティは、機械学習モデルを構築し、モデルの結果を理解するためのロードマップを作成します。これは、規制遵守にとって非常に貴重です。
この情報は内部監査にも役立ち、企業が規制分野のどこに欠陥があるかを把握できるため、問題を修正して違反を防ぐことができます。 「テーブル全体だけでなく、広範な組織のどこでもそのデータを使用できる非常に詳細なデータ系統情報を規制当局に提示できることは、非常に重要です」とミニク氏は主張します。この利点が、データ ソースによってモデルの精度が向上するという考えと一致する場合、このアプローチは、このテクノロジを導入するためのベスト プラクティスになる可能性があります。
翻訳者紹介
Cui Hao は、51CTO のコミュニティ編集者兼シニア アーキテクトであり、ソフトウェア開発とアーキテクチャの経験が 18 年、分散アーキテクチャの経験が 10 年あります。元HPの技術専門家。彼は喜んで共有し、600,000 回以上読まれる人気の技術記事を多数執筆してきました。 『分散アーキテクチャの原則と実践』の著者。
原題: A "Glass Box" Approach to Responsible Machine Learning 、著者: Jelani Harper
以上が責任ある機械学習 – 「ガラスの箱」アプローチの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









機械学習とデータ サイエンスの分野では、モデルの解釈可能性が常に研究者や実務家に焦点を当ててきました。深層学習やアンサンブル手法などの複雑なモデルが広く適用されるようになったことで、モデルの意思決定プロセスを理解することが特に重要になってきました。 Explainable AI|XAI は、モデルの透明性を高めることで、機械学習モデルに対する信頼と自信を構築するのに役立ちます。モデルの透明性の向上は、複数の複雑なモデルの普及や、モデルを説明するための意思決定プロセスなどの方法によって実現できます。これらの方法には、特徴重要度分析、モデル予測間隔推定、ローカル解釈可能性アルゴリズムなどが含まれます。特徴重要度分析では、入力特徴に対するモデルの影響度を評価することで、モデルの意思決定プロセスを説明できます。モデルの予測間隔の推定

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

テスラのロボット「オプティマス」の最新映像が公開され、すでに工場内で稼働可能となっている。通常の速度では、バッテリー(テスラの4680バッテリー)を次のように分類します:公式は、20倍の速度でどのように見えるかも公開しました - 小さな「ワークステーション」上で、ピッキング、ピッキング、ピッキング:今回は、それがリリースされたハイライトの1つビデオの内容は、オプティマスが工場内でこの作業を完全に自律的に行い、プロセス全体を通じて人間の介入なしに完了するというものです。そして、オプティマスの観点から見ると、自動エラー修正に重点を置いて、曲がったバッテリーを拾い上げたり配置したりすることもできます。オプティマスのハンドについては、NVIDIA の科学者ジム ファン氏が高く評価しました。オプティマスのハンドは、世界の 5 本指ロボットの 1 つです。最も器用。その手は触覚だけではありません

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機(VISTA)で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランク ケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、

翻訳者 | Li Rui によるレビュー | 今日、人工知能 (AI) および機械学習 (ML) モデルはますます複雑になっており、これらのモデルによって生成される出力はブラックボックスになっており、関係者に説明することができません。 Explainable AI (XAI) は、利害関係者がこれらのモデルがどのように機能するかを理解できるようにし、これらのモデルが実際に意思決定を行う方法を確実に理解できるようにし、AI システムの透明性、信頼性、およびこの問題を解決するための説明責任を確保することで、この問題を解決することを目指しています。この記事では、さまざまな説明可能な人工知能 (XAI) 手法を検討して、その基礎となる原理を説明します。説明可能な AI が重要であるいくつかの理由 信頼と透明性: AI システムが広く受け入れられ、信頼されるためには、ユーザーは意思決定がどのように行われるかを理解する必要があります

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

先週、社内の辞任と社外からの批判が相次ぐ中、OpenAIは内外のトラブルに見舞われた。 - 未亡人姉妹への侵害が世界中で白熱した議論を巻き起こした - 「覇権条項」に署名した従業員が次々と暴露 - ネットユーザーがウルトラマンの「」をリストアップ噂の払拭: Vox が入手した漏洩情報と文書によると、アルトマンを含む OpenAI の上級幹部はこれらの株式回収条項をよく認識しており、承認しました。さらに、OpenAI には、AI セキュリティという深刻かつ緊急の課題が直面しています。最近、最も著名な従業員2名を含むセキュリティ関連従業員5名が退職し、「Super Alignment」チームが解散したことで、OpenAIのセキュリティ問題が再び注目を集めている。フォーチュン誌は OpenA を報じた。

MetaFAIR はハーバード大学と協力して、大規模な機械学習の実行時に生成されるデータの偏りを最適化するための新しい研究フレームワークを提供しました。大規模な言語モデルのトレーニングには数か月かかることが多く、数百、さらには数千の GPU を使用することが知られています。 LLaMA270B モデルを例にとると、そのトレーニングには合計 1,720,320 GPU 時間が必要です。大規模なモデルのトレーニングには、これらのワークロードの規模と複雑さにより、特有のシステム上の課題が生じます。最近、多くの機関が、SOTA 生成 AI モデルをトレーニングする際のトレーニング プロセスの不安定性を報告しています。これらは通常、損失スパイクの形で現れます。たとえば、Google の PaLM モデルでは、トレーニング プロセス中に最大 20 回の損失スパイクが発生しました。数値的なバイアスがこのトレーニングの不正確さの根本原因です。
