1. 전체 프레임워크
주요 작업은 세 가지로 나눌 수 있습니다. 첫 번째는 인과구조의 발견, 즉 데이터로부터 변수들 간의 인과관계를 찾아내는 것이다. 두 번째는 인과관계 추정, 즉 한 변수가 다른 변수에 미치는 영향 정도를 데이터로부터 추론하는 것이다. 이러한 영향은 상대적인 성격을 말하는 것이 아니라, 하나의 변수가 개입될 때 다른 변수의 값이나 분포가 어떻게 변하는가를 의미한다는 점에 유의해야 합니다. 마지막 단계는 편향을 수정하는 것입니다. 왜냐하면 많은 작업에서 다양한 요인으로 인해 개발 샘플과 애플리케이션 샘플의 분포가 다를 수 있기 때문입니다. 이 경우 인과 추론은 편견을 수정하는 데 도움이 될 수 있습니다.
이러한 기능은 다양한 시나리오에 적합하며, 가장 일반적인 시나리오는 의사결정 시나리오입니다. 인과 추론을 통해 우리는 다양한 사용자가 의사 결정 행동에 어떻게 반응하는지 이해할 수 있습니다. 둘째, 산업 시나리오에서는 비즈니스 프로세스가 복잡하고 길어 데이터 편향이 발생하는 경우가 많습니다. 인과 추론을 통해 이러한 편차의 원인과 결과 관계를 명확하게 설명하면 이를 수정하는 데 도움이 될 수 있습니다. 또한 많은 시나리오에서는 모델 견고성과 해석 가능성에 대한 높은 요구 사항을 제시합니다. 모델이 인과 관계를 기반으로 예측을 할 수 있고, 인과 추론을 통해 더욱 강력한 설명 모델을 구축할 수 있기를 바랍니다. 마지막으로 의사결정 결과의 효과를 평가하는 것도 중요하다. 인과 추론은 전략의 실제 효과를 더 잘 분석하는 데 도움이 될 수 있습니다.
다음으로 인과 추론에서 중요한 두 가지 문제, 즉 장면이 인과 추론에 적합한지 판단하는 방법과 인과 추론의 일반적인 알고리즘을 소개하겠습니다.
첫째, 시나리오가 인과 추론을 적용하기에 적합한지 여부를 결정하는 것이 중요합니다. 인과추론은 일반적으로 인과관계 문제를 해결하기 위해, 즉 관찰된 데이터를 통해 원인과 결과의 관계를 추론하는 데 사용됩니다. 따라서
2. 응용 시나리오 평가(의사결정 문제)
먼저 응용 시나리오 평가에 대해 추론을 활용하는 방법을 소개합니다. 주로 의사결정 문제와 관련된다.
의사결정 문제에 관해서는 먼저 그것이 무엇인지, 즉 어떤 목표를 극대화하기 위해 어떤 제약 하에서 어떤 조치를 취해야 하는지 명확히 해야 합니다. 그런 다음 이 작업이 목표와 제약 조건에 영향을 미치는지, 그리고 예측을 위해 인과 추론 모델을 사용해야 하는지 여부를 고려해야 합니다.
예를 들어, 제품을 마케팅할 때, 우리는 일반적으로 전체 예산을 고려하여 각 사용자에게 쿠폰을 발행할지, 할인을 발행할지를 고려합니다. 매출 극대화를 전반적인 목표로 고려하세요. 예산 제약이 없으면 최종 매출에 영향을 미칠 수 있지만, 전진 전략이라는 점만 알면 모든 이용자에게 할인을 제공할 수 있다.
이 경우 의사결정 행위가 대상에 영향을 미치더라도 예측을 위해 인과 추론 모델을 사용할 필요는 없다.
위는 의사결정 문제에 대한 기본 분석입니다. 또한, 데이터 항목이 만족되는지 관찰해야 합니다. 인과 모델을 구축하기 위해 다양한 인과 알고리즘에는 데이터 및 작업 가정에 대한 요구 사항이 다릅니다.
- 잠재적 결과 클래스 모델에는 세 가지 주요 가정이 있습니다. 첫째, 개인의 인과효과가 안정적이어야 한다. 예를 들어 쿠폰 발행이 사용자의 구매 확률에 미치는 영향을 탐색할 때, 사용자의 행동이 오프라인 가격 비교나 영향을 받는 등 다른 사용자로부터 영향을 받지 않는다는 점을 확인할 필요가 있다. 다양한 할인 혜택을 누릴 수 있습니다. 두 번째 가정은 사용자의 실제 처리 및 잠재적인 결과가 관찰되지 않은 교란을 처리하는 데 사용될 수 있는 특징적인 상황에서 독립적이라는 것입니다. 세 번째 가설은 중첩에 관한 것입니다. 즉, 모든 종류의 사용자는 다른 결정을 내려야 합니다. 그렇지 않으면 다른 결정에 따른 이러한 종류의 사용자의 성과를 관찰할 수 없습니다.
- 구조적 인과모형이 직면하는 주요 가정은 변수 간의 인과관계인데, 이러한 가정은 증명하기 어려운 경우가 많습니다. 메타 학습 및 트리 기반 방법을 사용할 때 가정은 일반적으로 조건부 독립입니다. 즉, 주어진 기능, 결정 조치 및 잠재적 결과는 독립적입니다. 이 가정은 앞에서 언급한 독립성 가정과 유사합니다.
실제 비즈니스 시나리오에서는 사전 지식을 이해하는 것이 중요합니다. 첫째, 이전 결정의 기초가 되는 실제 관측 데이터의 배포 메커니즘을 이해해야 합니다. 가장 정확한 데이터를 사용할 수 없는 경우 추론을 위해 가정에 의존해야 할 수도 있습니다. 둘째, 비즈니스 경험은 어떤 변수가 인과 관계를 구별하는 데 중요한 영향을 미치는지 결정하는 데 도움이 될 수 있으며 이는 기능 엔지니어링에 매우 중요합니다. 따라서 실제 비즈니스를 다룰 때 관찰 데이터 및 비즈니스 경험의 배포 메커니즘과 결합하여 문제에 더 잘 대처하고 의사 결정 및 기능 엔지니어링을 효과적으로 수행할 수 있습니다.
3. 일반적인 인과 알고리즘
두 번째 중요한 문제는 인과 추론 알고리즘의 선택입니다.
첫 번째는 인과 구조 발견 알고리즘입니다. 이러한 알고리즘의 핵심 목표는 변수 간의 인과 관계를 확인하는 것입니다. 주요 연구 아이디어는 세 가지로 구분할 수 있다. 첫 번째 방식은 인과관계 그래프에서 노드 네트워크의 조건부 독립성 특성을 기반으로 판단하는 것이다. 또 다른 접근 방식은 인과관계 다이어그램의 품질을 측정하기 위해 점수 함수를 정의하는 것입니다. 예를 들어 우도 함수를 정의하여 해당 함수를 최대화하는 방향성 비순환 그래프를 구하여 인과 그래프로 사용합니다. 세 번째 유형의 방법은 더 많은 정보를 소개합니다. 예를 들어, 두 변수에 대한 실제 데이터 생성 과정이 가산성 노이즈 모델인 n m 유형을 따른다고 가정하고 두 변수 간의 인과관계 방향을 해결합니다.
인과 효과 추정에는 다양한 알고리즘이 사용됩니다. 다음은 몇 가지 일반적인 알고리즘입니다.
- 첫 번째는 계량경제학에서 자주 언급되는 도구변수법, Did법, 종합제어법입니다. 도구변수법의 핵심 아이디어는 치료와 관련이 있지만 확률오차항과 관련이 없는 변수, 즉 도구변수를 찾는 것이다. 이때, 도구변수와 종속변수 사이의 관계는 교란의 영향을 받지 않습니다. 예측은 두 단계로 나눌 수 있습니다. 먼저 도구변수를 사용하여 치료변수를 예측하고, 다음으로 예측된 치료변수를 사용하여 예측합니다. 종속 변수는 다음과 같습니다. 평균 치료 효과(ATE)입니다. DID 방식과 합성 제어 법칙은 패널 데이터를 위해 고안된 방식이므로 여기서는 자세히 소개하지 않는다.
- 또 다른 일반적인 접근 방식은 성향 점수를 사용하여 인과 효과를 추정하는 것입니다. 이 방법의 핵심은 쿠폰을 발행할 확률과 쿠폰을 발행하지 않을 확률 등 숨겨진 할당 메커니즘을 예측하는 것입니다. 두 명의 사용자가 쿠폰을 발행할 확률이 동일하지만 실제로 한 명의 사용자는 쿠폰을 받았고 다른 사용자는 그렇지 않은 경우, 두 사용자는 배포 메커니즘 측면에서 동등한 것으로 간주할 수 있으므로 두 사용자의 효과를 비교할 수 있습니다. 이를 기반으로 매칭방법, 계층적 방법, 가중치 부여 방법 등 일련의 방법을 일반화할 수 있다.
- 또 다른 방법은 결과를 직접 예측하는 것입니다. 관찰되지 않은 혼란이 있는 경우에도 가정을 통해 결과를 직접 예측하고 모델을 통해 자동으로 조정할 수 있습니다. 그러나 이러한 접근 방식은 다음과 같은 질문을 제기할 수 있습니다. 결과를 직접적으로 예측하는 것만으로도 충분하다면 문제는 사라지지 않는 것일까요? 실제로는 그렇지 않습니다.
- 네 번째는 성향 점수와 잠재적 결과를 결합하는 아이디어로, 이중 견고성과 이중 기계 학습 방법을 사용하는 것이 더 정확할 수 있습니다. 이중 견고성과 이중 기계 학습은 두 가지 방법을 결합하여 이중 보증을 제공합니다. 여기서 각 부분의 정확성은 최종 결과의 신뢰성을 보장합니다.
- 또 다른 방법은 인과 관계 다이어그램이나 구조화된 방정식과 같은 인과 관계를 기반으로 모델을 구축하는 구조적 인과 모델입니다. 이 접근 방식을 사용하면 변수를 직접 개입하여 결과를 얻을 수 있을 뿐만 아니라 반사실적 추론도 가능합니다. 그러나 이 접근 방식은 변수 간의 인과 관계를 이미 알고 있다고 가정하는데, 이는 종종 사치스러운 가정입니다.
- 메타 학습 방법은 다양한 범주를 포괄하는 중요한 학습 방법입니다. 그 중 하나가 처리 방식을 특징으로 삼아 모델에 직접 입력하는 S-러닝이다. 이 기능을 조정하면 다양한 처리 방법에 따른 결과의 변화를 관찰할 수 있습니다. 이 접근 방식은 각 실험 그룹과 통제 그룹에 대한 모델을 구축한 다음 기능을 수정하여 결과를 관찰하기 때문에 단일 모델 학습자라고도 합니다. 또 다른 방법은 X-learning인데, 이 과정은 S-learning과 유사하지만, 모델의 성능을 보다 정확하게 평가하기 위해 교차 검증 단계를 추가로 고려합니다.
- 트리 방법은 왼쪽 노드와 오른쪽 노드에 대한 인과 효과의 차이를 최대화하기 위해 트리 구조를 구축하여 표본을 분할하는 직관적이고 간단한 방법입니다. 그러나 이 방법은 과적합이 발생하기 쉬우므로 실제로는 과적합 위험을 줄이기 위해 Random Forest와 같은 방법을 사용하는 경우가 많습니다. 부스팅 방법을 사용하면 일부 정보를 필터링하는 것이 더 쉽기 때문에 문제가 더 커질 수 있으므로 사용 시 정보 손실을 방지하려면 더 복잡한 모델을 설계해야 합니다. 메타 학습 방법과 트리 기반 알고리즘을 Uplift 모델이라고도 합니다.
- 인과적 표현은 최근 학계에서 확실한 성과를 거두고 있는 분야 중 하나입니다. 이 방법은 서로 다른 모듈을 분리하고 영향 요인을 분리하여 교란 요인을 보다 정확하게 식별하려고 노력합니다. 종속변수 y와 치료변수(treatment)에 영향을 미치는 요인을 분석함으로써, y와 치료에 영향을 줄 수 있는 교란요인을 식별할 수 있습니다. 이 방법은 모델의 end-to-end 학습 효과를 향상시킬 것으로 기대됩니다. 예를 들어, 혼란 요인을 다루는 데 탁월한 역할을 하는 성향 점수를 생각해 보십시오. 그러나 성향점수의 과도한 정확도는 때로는 바람직하지 않습니다. 동일한 성향 점수 하에서는 성향 점수에 교란 요인과 관련된 일부 정보가 포함될 수 있지만 y에는 영향을 미치지 않기 때문에 중첩 가정을 충족할 수 없는 상황이 있을 수 있습니다. 모델이 너무 정확하게 학습하면 가중치 매칭이나 계층적 처리 중에 더 큰 오류가 발생할 수 있습니다. 이러한 오류는 실제로 교란 요인으로 인해 발생하는 것이 아니므로 고려할 필요가 없습니다. 인과표상학습 방법은 이러한 문제를 해결하는 방법을 제공하고 인과관계의 식별과 분석을 보다 효과적으로 처리할 수 있습니다.
4. 인과추론 실제 구현의 어려움
인과 추론은 실제 적용에서 많은 어려움에 직면합니다.
- 인과관계 약화. 많은 시나리오에서 인과관계는 소음의 무작위 변동과 동일한 순서인 경우가 많으며 이는 모델링 노력에 큰 어려움을 초래합니다. 이 경우 인과관계 자체가 명확하지 않기 때문에 모델링의 이점이 상대적으로 낮습니다. 그러나 모델링이 필요하더라도 이렇게 약화된 인과 관계를 정확하게 포착하려면 더 강력한 학습 기능을 갖춘 모델이 필요할 것입니다. 동시에, 학습 능력이 강한 모델은 노이즈에 더 취약하여 모델이 데이터에 과적합될 수 있으므로 과적합 문제에 특별한 주의를 기울여야 합니다.
- 두 번째로 흔한 문제는 데이터 조건이 충분하지 않다는 것입니다. 이 문제의 범위는 상대적으로 넓습니다. 주로 우리가 사용하는 알고리즘 가정에는 많은 단점이 있기 때문입니다. 특히 모델링을 위해 관측 데이터를 사용할 때 우리의 가정은 완전히 사실이 아닐 수 있습니다. 가장 일반적인 문제는 중복 가정이 충족되지 않을 수 있고 할당 메커니즘에 무작위성이 부족할 수 있다는 것입니다. 더 심각한 문제는 무작위 테스트 데이터조차 부족해 모델의 성능을 객관적으로 평가하기 어렵다는 점이다. 이 경우에도 여전히 모델링을 고집하고 모델 성능이 전년 대비 규칙보다 낫다면 비즈니스 경험을 활용하여 모델의 결정이 합리적인지 평가할 수 있습니다. 비즈니스 관점에서 관찰되지 않은 교란 요인과 같이 일부 가정이 성립하지 않는 상황에 대해 특별히 좋은 이론적 솔루션은 없습니다. 그러나 모델을 사용해야 하는 경우 비즈니스를 기반으로 소규모 무작위 시뮬레이션을 수행해 볼 수 있습니다. 교란 요인의 영향 방향과 크기를 평가하기 위한 경험 또는 테스트. 동시에 모델에서 이러한 요소를 고려하여 중첩 가정이 충족되지 않는 상황에 대해서는 나중에 열거에서 네 번째 문제이지만 여기서는 일부 알고리즘을 사용하여 일부를 제외할 수 있습니다. 할당 메커니즘. 즉, 이 문제는 인과적 표현 학습을 통해 완화됩니다.
- 이러한 복잡성을 처리할 때는 의사 결정 조치가 특히 중요합니다. 기존의 많은 모델은 바이너리 문제를 해결하는 데 중점을 둡니다. 그러나 여러 처리 솔루션이 관련되면 리소스를 할당하는 방법이 더 복잡한 문제가 됩니다. 이 문제를 해결하기 위해 여러 솔루션을 다양한 분야의 하위 문제로 분해할 수 있습니다. 또한, 딥러닝 방법을 사용하여 치료 계획을 특징으로 처리하고 연속적인 치료 계획과 결과 사이에 기능적 관계가 있다고 가정할 수 있습니다. 이러한 함수의 매개변수를 최적화하면 연속 의사결정 문제를 더 잘 해결할 수 있지만, 이로 인해 중복 문제와 같은 몇 가지 추가 가정도 발생합니다.
- 배포 메커니즘이 수정되었습니다. 위의 분석을 참조하세요.
- 또 다른 일반적인 문제는 목표 예측이 너무 많다는 것입니다. 어떤 경우에는 목표 예측이 여러 요인의 영향을 받으며 이는 결국 치료 옵션과 연관됩니다. 이 문제를 해결하기 위해 다중 작업 학습 방법을 사용할 수 있습니다. 복잡한 역할 문제를 직접 다루기는 어려울 수 있지만 문제를 단순화하고 치료 계획에 영향을 받는 가장 중요한 지표만 예측하여 점진적으로 제공할 수 있습니다. 의사결정을 위한 참고자료입니다.
- 마지막으로 일부 시나리오에서는 무작위 테스트 비용이 더 높고 효과 복구 주기가 더 길어집니다. 모델이 온라인 상태가 되기 전에 모델의 성능을 완전히 평가하는 것이 특히 중요합니다. 이 경우 소규모 무작위 테스트를 사용하여 효과를 평가할 수 있습니다. 모델을 평가하는 데 필요한 샘플 세트는 모델링을 위한 샘플 세트에 비해 훨씬 적지만 소규모 무작위 테스트도 불가능하다면 비즈니스 해석성을 통해 모델 결정 결과의 합리성을 판단할 수밖에 없을 것입니다.
5. 사례 - 제이디테크놀로지의 신용한도 의사결정 모델
다음으로 인과추론 기술을 활용한 제이디테크놀로지의 신용상품 구성 보조 응용을 살펴보겠습니다. 인과 추론 기술을 활용하여 신용 상품을 구성하는 방법을 보여주는 예입니다. 사용자 특성과 비즈니스 목표에 따라 최적의 신용 한도가 결정됩니다. 비즈니스 목표가 결정된 후 이러한 목표는 일반적으로 사용자의 제품 사용 및 대출 행동과 같은 사용자 성과 지표로 분류될 수 있습니다. 이러한 지표를 분석함으로써 수익, 규모 등 사업 목표를 산출할 수 있습니다. 따라서 신용 한도 결정 과정은 크게 두 단계로 나누어진다. 첫째, 인과 추론 기술을 활용해 다양한 신용 한도 하에서 사용자의 성과를 예측하고, 이후 다양한 방법을 활용해 이러한 성과를 바탕으로 각 사용자에게 최적의 신용 한도를 결정하고, 운영 목표.
6. 미래 개발
우리는 미래 개발에서 일련의 도전과 기회에 직면하게 될 것입니다.
우선, 현재 인과 모델의 단점을 고려하여 학계에서는 일반적으로 보다 복잡한 비선형 관계를 처리하려면 대규모 모델이 필요하다고 믿고 있습니다. 인과 모델은 일반적으로 2차원 데이터만 다루고 대부분의 모델 구조는 상대적으로 단순하므로 향후 연구 방향에는 이 문제를 해결하는 것이 포함될 수 있습니다.
두 번째로, 연구자들은 표현 학습에서 디커플링과 모듈러 아이디어의 중요성을 강조하면서 인과적 표현 학습의 개념을 제안했습니다. 인과적 관점에서 데이터 생성 프로세스를 이해함으로써 실제 법칙을 기반으로 구축된 모델은 더 나은 전송 기능과 일반화를 가질 가능성이 높습니다.
마지막으로 연구원들은 현재의 가정이 너무 강하고 많은 경우 실제 요구 사항을 충족할 수 없으므로 다양한 시나리오에 대해 다양한 모델을 채택해야 한다고 지적했습니다. 이는 또한 모델 구현에 대한 임계값이 매우 높아지는 결과를 가져옵니다. 따라서 다용도의 뱀기름 알고리즘을 찾는 것은 큰 가치가 있습니다.
위 내용은 그것에 집중하세요! ! 인과 추론을 위한 두 가지 주요 알고리즘 프레임워크 분석의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!