責任ある機械学習 – 「ガラスの箱」アプローチ-AI-php.cn

冒頭

for data Lineage コンピレーションカタログ

データガバナンス: データサイエンスのために誕生

明確かつ透過的

規制上の影響とその他

翻訳者紹介

ホームページ

テクノロジー周辺機器

責任ある機械学習 – 「ガラスの箱」アプローチ

王林

Apr 09, 2023 pm 12:21 PM

機械学習 api データ

翻訳者 | Cui Hao

レビュアー | Sun Shujuan

冒頭

機械学習は奥深いテクノロジーではありません。複雑なディープニューラルネットワークにおけるマルチパラメーターおよびハイパーパラメーターの手法がコグニティブコンピューティングの単なる形式であるのと同様に、それらはそれほど奥深いものではないようです。

責任ある機械学習 – 「ガラスの箱」アプローチ

他のタイプの機械学習もあります (ディープニューラルネットワークを含むものもあります)。このタイプの機械学習のモデルの結果、モデルの決定、および複雑さは、モデルに影響を与えるものはすべて非常に透明です。

これはすべて、組織がデータのソースをどの程度理解しているかによって決まります。

言い換えれば、モデルのトレーニングデータから運用データモデルまですべてを理解する必要があります。また、結果を解釈、洗練、改善するためにも不可欠です。このようにして、組織はモデルのビジネス価値を大幅に高めることができます。

さらに重要なのは、このテクノロジーの公平性、説明責任、透明性がさらに向上し、社会全体にとって信頼性と完全性が向上することです。

Databricks のマーケティング担当副社長である Joel Minnick 氏は次のように認めています。「責任を持って機械学習を行うには、データの上流と下流を詳細に理解する必要があるのはこのためです。」

for data Lineage コンピレーションカタログ

モデルのデータトレーニングとデータ生成には、データソース、データ変換、データ統合などの複数のテクノロジが関係します。成熟したデータカタログソリューションでは、リアルタイムのデータキャプチャが実現できるため、いつでも進行状況を監視してモデルの実行の進行状況を把握できます。「モデル内でデータが使用されているコンテキストを明確に理解できるようになります。また、このデータはどこから来たのか? そこから他にどのようなデータを取得したのか? それはいつ生成されたのか? それで、このデータをどのように使用すべきかをよりよく理解するためです」とデータサイエンティストのミニク氏は述べています。

「データ系統」 (データソースの記録、移動、処理) はメタデータで構成され、データディレクトリは関連するデータセットを保存するために使用されます。また、カタログを使用すると、ユーザーはタグやその他の記述子を追加のメタデータとして含めることができ、データの出所を追跡し、データの信頼性を確立するのに役立ちます。 Minnick 氏が説明する「データリネージ」は、さまざまなプラットフォーム (データサイエンティストプラットフォーム、データエンジニアプラットフォーム、エンドユーザープラットフォームを含む) を接続する「API 主導のサービス」を生成できます。

データガバナンス: データサイエンスのために誕生

データトレーニングとデータ操作のトレーサビリティの向上は、機械学習モデルの結果に影響を与え、モデルの結果はデータガバナンスに関連します。データサイエンスの分野。密接に関連しています。したがって、データガバナンスは、モデルを作成してデプロイするデータサイエンスプラットフォームと密接に関係しています。「スキルはスプレッドシートとファイルの管理、ノートブックの管理、ダッシュボードの管理を同時に行います。これは、生産データと消費データを管理する最新の方法です」と Minnick 氏はコメントしました。この言葉は、ノートブックでモデルを構築し、ダッシュボードを通じて出力を監視するデータサイエンティストにとって当てはまります。

明確かつ透過的

とはいえ、API を介してデータサイエンスツールプラットフォームに接続して「データリネージ」を取得するだけでは、機械学習を透過的に活用することの 1 つの側面にすぎません。モデルの出力を向上させるという目的を達成するには、データリネージで決定された内容で出力モデルを調整する必要もあります。たとえば、データサイエンティストが「データに何か問題があった場合にそれを理解し、データのその部分を切り分けることができる」ように、データのトレーサビリティをモデル化する方法についてミニク氏は述べた。

論理的には、この知識を使用して、特定のデータ型に問題がある理由を理解し、問題を修正したり、完全に削除してモデルの精度を向上させることができます。 Minnick 氏によると、「今日のさまざまな業界で機械学習と人工知能が台頭していることもあり、ますます多くの組織がモデル結果に「データリネージ」を適用する利点を認識しています。これはますます一般的になってきています。昨年、 AutoML 製品を発売したとき、データソースへの透明性を表すために「ガラスの箱」を使用しました。」

規制上の影響とその他

一部の組織では、次の機能を提供するために「データリネージ」も使用しています。適応型コグニティブコンピューティングモデルを使用して、規制順守能力を強化します。金融やヘルスケアなどの業界は厳しく規制されており、企業は顧客のために意思決定を行う方法を明確に説明する必要があります。データのトレーサビリティは、機械学習モデルを構築し、モデルの結果を理解するためのロードマップを作成します。これは、規制遵守にとって非常に貴重です。

この情報は内部監査にも役立ち、企業が規制分野のどこに欠陥があるかを把握できるため、問題を修正して違反を防ぐことができます。「テーブル全体だけでなく、広範な組織のどこでもそのデータを使用できる非常に詳細なデータ系統情報を規制当局に提示できることは、非常に重要です」とミニク氏は主張します。この利点が、データソースによってモデルの精度が向上するという考えと一致する場合、このアプローチは、このテクノロジを導入するためのベストプラクティスになる可能性があります。

翻訳者紹介

Cui Hao は、51CTO のコミュニティ編集者兼シニアアーキテクトであり、ソフトウェア開発とアーキテクチャの経験が 18 年、分散アーキテクチャの経験が 10 年あります。元HPの技術専門家。彼は喜んで共有し、600,000 回以上読まれる人気の技術記事を多数執筆してきました。『分散アーキテクチャの原則と実践』の著者。

原題: A "Glass Box" Approach to Responsible Machine Learning 、著者: Jelani Harper

以上が責任ある機械学習 – 「ガラスの箱」アプローチの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7529

CakePHP チュートリアル

1378

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

この記事では、SHAP: 機械学習のモデルの説明について説明します。 Jun 01, 2024 am 10:58 AM

機械学習とデータサイエンスの分野では、モデルの解釈可能性が常に研究者や実務家に焦点を当ててきました。深層学習やアンサンブル手法などの複雑なモデルが広く適用されるようになったことで、モデルの意思決定プロセスを理解することが特に重要になってきました。 Explainable AI|XAI は、モデルの透明性を高めることで、機械学習モデルに対する信頼と自信を構築するのに役立ちます。モデルの透明性の向上は、複数の複雑なモデルの普及や、モデルを説明するための意思決定プロセスなどの方法によって実現できます。これらの方法には、特徴重要度分析、モデル予測間隔推定、ローカル解釈可能性アルゴリズムなどが含まれます。特徴重要度分析では、入力特徴に対するモデルの影響度を評価することで、モデルの意思決定プロセスを説明できます。モデルの予測間隔の推定

C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 Jun 03, 2024 pm 01:25 PM

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマートポインター、最新のスレッドライブラリ、SIMD 命令、サードパーティライブラリの使用、コーディングスタイルガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

テスラのロボットは工場で働く、マスク氏：手の自由度は今年22に達する！ May 06, 2024 pm 04:13 PM

テスラのロボット「オプティマス」の最新映像が公開され、すでに工場内で稼働可能となっている。通常の速度では、バッテリー（テスラの4680バッテリー）を次のように分類します：公式は、20倍の速度でどのように見えるかも公開しました - 小さな「ワークステーション」上で、ピッキング、ピッキング、ピッキング：今回は、それがリリースされたハイライトの1つビデオの内容は、オプティマスが工場内でこの作業を完全に自律的に行い、プロセス全体を通じて人間の介入なしに完了するというものです。そして、オプティマスの観点から見ると、自動エラー修正に重点を置いて、曲がったバッテリーを拾い上げたり配置したりすることもできます。オプティマスのハンドについては、NVIDIA の科学者ジムファン氏が高く評価しました。オプティマスのハンドは、世界の 5 本指ロボットの 1 つです。最も器用。その手は触覚だけではありません

アメリカ空軍が初のAI戦闘機を公開し注目を集める！大臣はプロセス全体を通じて干渉することなく個人的にテストを実施し、10万行のコードが21回にわたってテストされました。 May 07, 2024 pm 05:00 PM

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機（VISTA）で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランクケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、

説明可能な AI: 複雑な AI/ML モデルの説明 Jun 03, 2024 pm 10:08 PM

翻訳者 | Li Rui によるレビュー | 今日、人工知能 (AI) および機械学習 (ML) モデルはますます複雑になっており、これらのモデルによって生成される出力はブラックボックスになっており、関係者に説明することができません。 Explainable AI (XAI) は、利害関係者がこれらのモデルがどのように機能するかを理解できるようにし、これらのモデルが実際に意思決定を行う方法を確実に理解できるようにし、AI システムの透明性、信頼性、およびこの問題を解決するための説明責任を確保することで、この問題を解決することを目指しています。この記事では、さまざまな説明可能な人工知能 (XAI) 手法を検討して、その基礎となる原理を説明します。説明可能な AI が重要であるいくつかの理由信頼と透明性: AI システムが広く受け入れられ、信頼されるためには、ユーザーは意思決定がどのように行われるかを理解する必要があります

あなたが知らない機械学習の 5 つの流派 Jun 05, 2024 pm 08:51 PM

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

AI スタートアップ企業は一斉に OpenAI に転職し、イリヤが去った後にセキュリティチームが再編成されました。 Jun 08, 2024 pm 01:00 PM

先週、社内の辞任と社外からの批判が相次ぐ中、OpenAIは内外のトラブルに見舞われた。 - 未亡人姉妹への侵害が世界中で白熱した議論を巻き起こした - 「覇権条項」に署名した従業員が次々と暴露 - ネットユーザーがウルトラマンの「」をリストアップ噂の払拭: Vox が入手した漏洩情報と文書によると、アルトマンを含む OpenAI の上級幹部はこれらの株式回収条項をよく認識しており、承認しました。さらに、OpenAI には、AI セキュリティという深刻かつ緊急の課題が直面しています。最近、最も著名な従業員2名を含むセキュリティ関連従業員5名が退職し、「Super Alignment」チームが解散したことで、OpenAIのセキュリティ問題が再び注目を集めている。フォーチュン誌は OpenA を報じた。

フラッシュアテンションは安定していますか?メタとハーバードは、モデルの重みの偏差が桁違いに変動していることを発見しました May 30, 2024 pm 01:24 PM

MetaFAIR はハーバード大学と協力して、大規模な機械学習の実行時に生成されるデータの偏りを最適化するための新しい研究フレームワークを提供しました。大規模な言語モデルのトレーニングには数か月かかることが多く、数百、さらには数千の GPU を使用することが知られています。 LLaMA270B モデルを例にとると、そのトレーニングには合計 1,720,320 GPU 時間が必要です。大規模なモデルのトレーニングには、これらのワークロードの規模と複雑さにより、特有のシステム上の課題が生じます。最近、多くの機関が、SOTA 生成 AI モデルをトレーニングする際のトレーニングプロセスの不安定性を報告しています。これらは通常、損失スパイクの形で現れます。たとえば、Google の PaLM モデルでは、トレーニングプロセス中に最大 20 回の損失スパイクが発生しました。数値的なバイアスがこのトレーニングの不正確さの根本原因です。

See all articles

責任ある機械学習 – 「ガラスの箱」アプローチ

冒頭

for data Lineage コンピレーション カタログ

データ ガバナンス: データ サイエンスのために誕生

明確かつ透過的

規制上の影響とその他

翻訳者紹介

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

for data Lineage コンピレーションカタログ

データガバナンス: データサイエンスのために誕生