1. 全体的なフレームワーク
主なタスクは 3 つのカテゴリに分類できます。 1 つ目は因果構造の発見、つまりデータから変数間の因果関係を特定することです。 2 つ目は因果効果の推定です。つまり、ある変数が別の変数に及ぼす影響の程度をデータから推測します。この影響は相対的な性質を指すのではなく、1 つの変数が介入したときに別の変数の値または分布がどのように変化するかを指すことに注意してください。最後のステップはバイアスを修正することです。多くのタスクでは、さまざまな要因によって開発サンプルとアプリケーション サンプルの配布が異なる可能性があるためです。この場合、因果推論はバイアスを修正するのに役立つ可能性があります。
これらの関数はさまざまなシナリオに適していますが、最も典型的なのは意思決定シナリオです。因果推論を通じて、さまざまなユーザーが私たちの意思決定行動にどのように反応するかを理解できます。第 2 に、産業シナリオでは、ビジネス プロセスが複雑で長いことが多く、データの偏りにつながります。因果推論を通じてこれらの逸脱の因果関係を明確に記述することは、逸脱を修正するのに役立ちます。さらに、多くのシナリオでは、モデルの堅牢性と解釈可能性に対して高い要件が課されます。このモデルが因果関係に基づいて予測を行うことができ、因果推論がより強力な説明モデルの構築に役立つことが期待されています。最後に、意思決定の結果の影響を評価することも重要です。因果推論は、戦略の実際の効果をより適切に分析するのに役立ちます。
次に、因果推論において重要な2つの問題、すなわち、シーンが因果推論に適しているかどうかを判断する方法と、因果推論における代表的なアルゴリズムを紹介します。
まず、シナリオが因果推論の適用に適しているかどうかを判断することが重要です。因果推論は通常、因果関係の問題を解決するために、つまり、観察されたデータを通じて原因と結果の関係を推測するために使用されます。したがって、
を判断する場合 2. アプリケーションシナリオの評価(意思決定問題)
まず、シナリオが推論を使用するのに適しているかどうかを判断することを紹介します。主に意思決定の問題が含まれます。
意思決定の問題については、まずそれが何であるか、つまり、どの目標を最大化するためにどのような制約の下でどのような行動をとるべきかを明確にする必要があります。次に、このアクションが目標と制約に影響を与えるかどうか、予測に因果推論モデルを使用する必要があるかどうかを検討する必要があります。
たとえば、製品をマーケティングする場合、通常、総予算を考慮して、各ユーザーにクーポンを発行するか、割引を発行するかを検討します。全体的な目標として売上を最大化することを検討してください。予算の制約がない場合、最終的な売上に影響する可能性がありますが、前向きな戦略であることを理解している限り、すべてのユーザーに割引を与えることができます。
この場合、意思決定アクションはターゲットに影響を与えますが、予測に因果推論モデルを使用する必要はありません。
以上が意思決定問題の基本的な分析であり、さらにデータ項目が満たされているかどうかを観察する必要があります。因果モデルを構築する場合、因果アルゴリズムが異なれば、データとタスクの仮定に対する要件も異なります。
- 潜在的な結果クラスのモデルには 3 つの重要な前提があります。まず、個々の因果効果が安定している必要があります。たとえば、クーポン発行がユーザーの購入確率に及ぼす影響を調査する場合、ユーザーの行動がオフラインでの価格比較や影響を受けるなど、他のユーザーの影響を受けないようにする必要があります。さまざまな割引効果のあるクーポンによって。 2 番目の仮定は、ユーザーの実際の処理と潜在的な結果は、特有の状況を考慮すると独立しており、観察されていない交絡に対処するために使用できるということです。 3 番目の仮説は重複に関するものです。つまり、どの種類のユーザーも異なる決定を下す必要があり、そうでなければ、異なる決定の下でのこの種類のユーザーのパフォーマンスは観察できません。
- 構造因果モデルが直面する主な仮定は変数間の因果関係であり、これらの仮定を証明するのは多くの場合困難です。メタ学習とツリーベースの手法を使用する場合、通常は条件付きの独立性が前提となります。つまり、与えられた特徴、意思決定アクション、および潜在的な結果は独立しています。この仮定は、前述の独立性の仮定と似ています。
実際のビジネスシーンでは、事前知識を理解することが重要です。まず、これまでの判断の根拠となる実際の観測データの分布メカニズムを理解する必要があります。最も正確なデータが利用できない場合、推測を行うために仮定に頼る必要がある場合があります。第 2 に、ビジネス経験は、特徴量エンジニアリングにとって重要な因果効果の区別にどの変数が大きな影響を与えるかを判断する際に役立ちます。したがって、実際のビジネスに取り組む際、観測データやビジネス経験の流通メカニズムと組み合わせることで、課題に適切に対処し、意思決定や特徴量エンジニアリングを効果的に実行できるようになります。
3. 典型的な因果アルゴリズム
2 番目の重要な問題は、因果推論アルゴリズムの選択です。
1つ目は、因果構造発見アルゴリズムです。これらのアルゴリズムの中心的な目的は、変数間の因果関係を判断することです。主な研究アイデアは 3 つのカテゴリーに分類できます。 1つ目は、因果関係グラフにおけるノードネットワークの条件独立特性に基づいて判定する方法である。もう 1 つのアプローチは、因果関係図の品質を測定するスコアリング関数を定義することです。例えば、尤度関数を定義することにより、その関数を最大化する有向非巡回グラフを探索し、因果グラフとして使用する。 3 番目のタイプの方法では、より多くの情報が導入されます。たとえば、2 つの変数の実際のデータ生成プロセスが n m タイプ (加法性ノイズ モデル) に従っていると仮定し、2 つの変数間の因果関係の方向を解きます。
因果効果の推定には、さまざまなアルゴリズムが含まれます。以下に、一般的なアルゴリズムをいくつか示します。
- 一つ目は、計量経済学でよく言われる操作変数法、did法、合成制御法です。操作変数法の中心的な考え方は、治療に関連するが確率誤差項には関連しない変数、つまり操作変数を見つけることです。このとき、操作変数と従属変数の関係は交絡の影響を受けません。予測は 2 つの段階に分けることができます。まず、操作変数を使用して治療変数を予測し、次に、予測された治療変数を使用して予測します。従属変数。得られた回帰係数は次のとおりです。平均治療効果 (ATE) です。 DID法や合成制御則はパネルデータ向けに設計された手法ですが、ここでは詳しく紹介しません。
- もう 1 つの一般的なアプローチは、傾向スコアを使用して因果効果を推定することです。この方法の核心は、クーポンを発行する確率とクーポンを発行しない確率など、隠れた割り当てメカニズムを予測することです。 2 人のユーザーがクーポンを発行する確率が同じであるが、1 人のユーザーが実際にクーポンを受け取り、もう 1 人のユーザーがクーポンを受け取らなかった場合、配布メカニズムの観点から 2 人のユーザーは同等であると考えることができるため、その効果を比較することができます。これに基づいて、マッチング方法、階層的方法、重み付け方法などの一連の方法を一般化できます。
- もう一つの方法は、結果を直接予測することです。観察されていない交絡が存在する場合でも、結果は仮定を通じて直接予測でき、モデルを通じて自動的に調整できます。ただし、このアプローチでは次のような疑問が生じるかもしれません。結果を直接予測するだけで十分なら、問題は解決しないのではないか?実際にはそうではありません。
- 4 つ目は、傾向スコアと潜在的な結果を組み合わせるというアイデアで、二重のロバストおよび二重の機械学習手法を使用する方がより正確である可能性があります。二重の堅牢性と二重の機械学習は、2 つの方法を組み合わせることで二重の保証を提供し、どちらかの部分の精度によって最終結果の信頼性が保証されます。
- もう 1 つの方法は、構造因果モデルです。これは、因果関係図や構造化方程式などの因果関係に基づいてモデルを構築します。このアプローチでは、結果を得るために変数を直接介入することや、反事実的な推論が可能になります。ただし、このアプローチは、変数間の因果関係がすでにわかっていることを前提としていますが、これは多くの場合贅沢な仮定です。
- メタ学習法は、さまざまなカテゴリーをカバーする重要な学習法です。その 1 つは、処理方法を特徴として扱い、それをモデルに直接入力する S ラーニングです。この機能を調整することで、さまざまな処理方法での結果の変化を観察できます。このアプローチは、実験グループと対照グループのそれぞれにモデルを構築し、結果を観察するために特徴を変更するため、単一モデル学習器と呼ばれることもあります。もう 1 つの方法は X 学習です。そのプロセスは S 学習と似ていますが、モデルのパフォーマンスをより正確に評価するために相互検証のステップがさらに考慮されます。
- ツリー法は、左右のノードの因果効果の差を最大化するためにツリー構造を構築してサンプルを分割する直感的でシンプルな方法です。ただし、この方法は過適合になりやすいため、実際には過適合のリスクを軽減するためにランダム フォレストなどの方法が使用されることがよくあります。ブースティング手法を使用すると、一部の情報をフィルターで除外することが容易になるため、課題が増える可能性があります。そのため、使用時に情報の損失を防ぐために、より複雑なモデルを設計する必要があります。メタ学習方法とツリーベースのアルゴリズムは、しばしば Uplift モデルとも呼ばれます。
- 因果表現は、近年学術界において一定の成果を上げている分野の一つです。この方法は、さまざまなモジュールを分離し、影響を与える要因を分離して、交絡要因をより正確に特定することを目的としています。従属変数 y と治療変数 (治療) に影響を与える因子を分析することで、y と治療に影響を与える可能性のある交絡因子を特定できます。これらの因子は交絡因子と呼ばれます。この方法により、モデルのエンドツーエンドの学習効果が向上することが期待されます。たとえば傾向スコアを考えてみましょう。傾向スコアは交絡因子にうまく対処することがよくあります。ただし、傾向スコアの精度が高すぎると好ましくない場合があります。同じ傾向スコアでは、重複する仮定が満たされない状況が発生する可能性があります。これは、傾向スコアには交絡因子に関連する情報が含まれている可能性があるためですが、y には影響を与えないためです。モデルの学習が正確すぎると、重み付けマッチングまたは階層処理中に大きなエラーが発生する可能性があります。これらのエラーは実際には交絡因子によって引き起こされるものではないため、考慮する必要はありません。因果表現学習方法は、この問題を解決する方法を提供し、因果関係の特定と分析をより効果的に処理できます。
4. 因果推論の実際の実装における困難さ
因果推論は、実際の応用において多くの課題に直面します。
- 因果関係の弱体化。多くのシナリオでは、因果関係はノイズのランダムな変動と同程度であることが多く、これがモデリング作業に大きな課題をもたらします。この場合、因果関係自体が明らかではないため、モデリングの利点は比較的低くなります。ただし、モデリングが必要な場合でも、この弱まった因果関係を正確に捉えるには、より強力な学習機能を備えたモデルが必要になります。同時に、過学習の問題には特別な注意を払う必要があります。これは、強力な学習能力を持つモデルはノイズの影響を受けやすく、モデルがデータを過学習させる可能性があるためです。
- 2 番目の一般的な問題は、データ条件が不十分であることです。この問題の範囲は比較的広いですが、その主な理由は、私たちが使用するアルゴリズムの仮定には多くの欠点があり、特にモデリングに観測データを使用する場合、私たちの仮定が完全に真実ではない可能性があるためです。最も典型的な問題には、重複の仮定が満たされない可能性があること、割り当てメカニズムにランダム性が欠けている可能性があることが含まれます。さらに深刻な問題は、十分なランダム テスト データさえないため、モデルのパフォーマンスを客観的に評価することが困難になっていることです。この場合、それでもモデリングを主張し、モデルのパフォーマンスが前年比ルールよりも優れている場合は、ある程度のビジネス経験を利用して、モデルの決定が合理的かどうかを評価できます。ビジネスの観点から見ると、観測されていない交絡要因など、一部の前提が当てはまらない状況に対する特に優れた理論的解決策はありません。ただし、モデルを使用する必要がある場合は、ビジネスに基づいて小規模なランダム シミュレーションを実行してみることができます。交絡因子の影響の方向と大きさを評価するための経験またはテスト。同時に、モデルでこれらの要因を考慮して、重複の仮定が満たされない状況については、後で列挙する 4 番目の問題になりますが、ここでいくつかのアルゴリズムを使用して一部を除外することができます。非交絡因子の割り当てメカニズム。つまり、この問題は因果表現の学習によって軽減されます。
- この複雑さに対処する場合、意思決定のアクションが特に重要です。既存のモデルの多くは二値問題の解決に重点を置いていますが、複数の処理ソリューションが関係する場合、リソースをどのように割り当てるかがより複雑な問題になります。この課題に対処するために、複数の処理ソリューションをさまざまな分野のサブ問題に分解できます。さらに、深層学習手法を使用すると、治療スキームを特徴として扱い、連続する治療スキームと結果の間に何らかの関数的関係があると想定できます。これらの関数のパラメーターを最適化することで、連続決定問題をより適切に解決できますが、これにより、重複問題などの追加の仮定も導入されます。
- 配布メカニズムは修正されています。上記の分析を参照してください。
- もう 1 つの一般的な問題は、ターゲットの予測がたくさんあることです。場合によっては、目標の予測は複数の要因の影響を受け、それらの要因が治療の選択肢に関係します。この問題を解決するには、マルチタスク学習方法を使用します。複雑な役割の問題に直接対処するのは難しいかもしれませんが、問題を単純化し、治療計画の影響を受ける最も重要な指標のみを予測し、段階的に提供することができます。意思決定の参考に。
- 最後に、一部のシナリオではランダム テストのコストが高くなり、効果の回復サイクルが長くなります。モデルをオンラインにする前に、モデルのパフォーマンスを十分に評価することが特に重要です。この場合、小規模なランダム化テストを使用して有効性を評価できます。モデルの評価に必要なサンプルセットはモデリング用のサンプルセットに比べてはるかに小さいですが、小規模なランダムテストさえ不可能な場合は、ビジネス上の解釈可能性によってモデルの決定結果の妥当性を判断するしかない可能性があります。
5. ケース - JD Technology の信用限度額決定モデル
次に、因果推論技術を使用してクレジット商品を策定するための JD Technology の補助アプリケーションを取り上げます。例として、因果推論テクノロジーを使用してクレジット商品を策定する方法を示します。ビジネス目標が決定されると、通常、これらの目標はユーザーの製品使用状況や借入行動などのユーザー パフォーマンス指標に分類できます。これらの指標を分析することで、利益や規模などの経営目標を算出することができます。したがって、与信限度額の決定プロセスは 2 つのステップに分かれています。まず、因果推論テクノロジーを使用して、さまざまな与信限度額の下でユーザーのパフォーマンスを予測し、次にさまざまな方法を使用して、これらのパフォーマンスに基づいて各ユーザーに最適な与信限度額を決定します。運用目標。
6. 将来の発展
私たちは将来の発展において、一連の課題と機会に直面します。
まず第一に、現在の因果モデルの欠点を考慮して、学界は一般に、より複雑な非線形関係を処理するには大規模なモデルが必要であると考えています。因果モデルは通常 2 次元データのみを扱い、ほとんどのモデル構造は比較的単純であるため、将来の研究の方向性にはこの問題への対処が含まれる可能性があります。
第二に、研究者らは因果表現学習の概念を提案し、表現学習における切り離しとモジュール化されたアイデアの重要性を強調しました。データ生成プロセスを因果関係の観点から理解することで、現実世界の法則に基づいて構築されたモデルの転送機能と一般化が向上する可能性があります。
最後に、研究者らは、現在の仮定が強すぎて多くの場合実際のニーズを満たすことができないため、シナリオごとに異なるモデルを採用する必要があると指摘しました。これにより、モデル実装のしきい値が非常に高くなります。したがって、汎用性の高いスネークオイルアルゴリズムを見つけることは非常に価値があります。
以上がそこに集中してください! !因果推論のための 2 つの主要なアルゴリズム フレームワークの分析の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。