기계 또는 딥 러닝 모델의 내부 작업, 의사 결정 과정 및 규칙과 선택의 직관을 설명 할 수있을 때 신뢰와 책임을 확립 할 수 있습니다. 또한 이해 관계자 및 파트너와의 협력 및 참여를 향상시키는 데 도움이됩니다. 개선 된 문제 해결
예상대로 무언가가 깨지거나 작동하지 않으면 문제의 출처를 찾아야합니다. 이를 위해서는 시스템이나 모델의 내부 작업으로의 투명성이 중요합니다. 문제를 진단하고 효과적인 조치를 취하기 위해 문제를 해결하는 데 도움이됩니다. 예를 들어, "B"를 대출로 승인해서는 안되는 사람을 예측하는 모델을 고려하십시오. 이를 이해하려면 모델의 예측과 결정을 조사해야합니다. 여기에는 사람 "B 's"관찰에 대한 모델이 우선 순위로 구성된 요인을 식별하는 것이 포함됩니다.
이러한 시나리오에서 모델 설명은 사람과 관련된 모델의 예측과 의사 결정에 대해 더 깊이 살펴볼 때 매우 편리합니다. 또한 모델의 내부 작업을 더 깊이 살펴 보는 동안 모델 결정에 영향을 미치고 영향을 줄 수있는 몇 가지 편견을 빠르게 발견 할 수 있습니다.
따라서 ML 및 AI 모델에 대한 설명을 갖고이를 활용하여 문제 해결, 모니터링 및 지속적인 개선 효율성을 높이고 편견을 식별하고 완화하고 모델 성능을 향상시키는 데 도움이됩니다.
ML 및 AI에 대한 인기있는 비즈니스 사용 사례는 설명 가능성 및 해석 가능성
우리는 항상 데이터 중심의 정보에 영향을 미치고 결정하는 모델의 전반적인 예측 능력에 관심이 있습니다. 은행 및 금융, 소매, 의료, 인터넷과 같은 다양한 산업 분야에서 ML 및 AI 모델에 대한 수많은 응용 프로그램이 있습니다. 상업, 보험, 자동차, 제조, 교육, 통신, 여행, 공간 등.
다음은 몇 가지 예입니다
은행 및 금융
은행 및 금융 산업의 경우 대출을 제공하거나 신용 카드를 발행하는 데 올바른 고객을 식별하는 것이 중요합니다. 또한 사기 거래 예방에 관심이 있습니다. 또한,이 산업은 규제가 높다.
응용 프로그램 승인 및 사기 모니터링과 같은 이러한 내부 프로세스를 효율적으로 만들기 위해 금융 및 금융 레버리지 ML 및 AI 모델링은 이러한 중요한 결정을 돕습니다. 그들은 ML 및 AI 모델을 사용하여 특정 및 알려진 요인에 따라 결과를 예측합니다.
일반적으로, 대부분의 기관들은 트랜잭션과 데이터를 지속적으로 모니터링하여 패턴, 추세 및 이상을 탐지합니다. 그들이 처리하는 각 응용 프로그램에 대한 ML 및 AI 모델 예측을 이해하는 것이 중요해집니다. 그들은 모델 예측의 추론과 예측에 중요한 역할을 한 요인을 이해하는 데 관심이 있습니다. 이제, ML 모델이 신용 점수가 높은 일부 고객에 대해 대출 신청을 거부 할 것으로 예측했다고 가정 해 봅시다. 이러한 시나리오에서는 위험 분석을위한 모델 설명을 활용하고 모델이 고객 애플리케이션을 거부하기로 결정한 이유 와이 의사 결정에서 어떤 고객 요소가 중요한 역할을했는지에 대한 더 깊은 통찰력을 얻을 수 있습니다. 이 발견은 모델 의사 결정에서 문제, 취약성 및 새로운 편견을 감지, 조사 및 완화하고 모델 성능을 향상시키는 데 도움이 될 수 있습니다.
.
건강 관리
.
도로에서 작동하도록 설계된 자율 주행의 경우, 내비게이션은 차량을 실시간으로 자율적으로 안내하고, 즉 객체를 탐지하고, 교통 신호 및 표시를 인식하고, 객체 행동을 인식하고, 레인을 유지하고, 계획 경로를 유지하고, 정보를 유지하고, 사전 결정을 예측하고, 가속, 스티어링, 스티어링과 같은 적절한 행동을 취하는 것과 같은 중요한 작업을 통해 실시간으로 차량을 자율적으로 안내하는 것을 의미합니다.
자율적 인 도로 차량에는 운전자, 승객, 공공 및 공공 재산의 안전이 포함되므로 공공 신뢰, 수용 및 채택을 얻기 위해 완벽하게 작동하고 규정 및 규정 준수를 준수해야합니다. 따라서 이러한 차량이 결정을 내리는 데 완전히 의존하는 AI 및 ML 모델에 대한 신뢰를 구축하는 것이 매우 중요합니다. 자율 주 차량에서 AI 및 ML 설명은 설명 가능한 AI (XAI)라고도합니다. 설명 가능한 AI는 AI 작업 및 결정에 대한 피드백을 실시간으로 제공하여 사용자 상호 작용을 개선하는 데 사용할 수 있으며, 이러한 도구는 AI 결정 및 문제를 조사하고 숨겨진 편향 및 취약성을 식별 및 제거하고 자율 주행 차량 모델을 개선하는 도구 역할을 할 수 있습니다.
소매
소매 산업에서 AI 및 ML 모델은 제품 판매, 재고 관리, 마케팅, 고객 지원 및 경험 등과 같은 다양한 결정을 안내하는 데 사용됩니다. ML 및 AI에 대한 설명은 모델 예측에 대한 이해를 촉진하고 판매가 발생하지 않는 제품의 예측과 관련된 예측과 관련된 예측과 관련된 예측과 관련된 예측에 대한 자세한 내용을 촉진합니다. 또는 어떤 마케팅 캠페인이 판매 등에 긍정적 인 영향을 미치는 등
위의 비즈니스 사용 사례에서 ML 및 AI 모델이 전체 모델에 대한 명확하고 사용 가능한 설명과 비즈니스 의사 결정을 안내하고 비즈니스 운영을 효율적으로 만드는 개별 예측을하는 것이 매우 중요하다는 것을 분명히 알 수 있습니다.
.
일부 복잡한 모델에는 내장 설명 가능성이 있으며 일부 모델은이를 위해 외부 도구에 의존합니다. 오늘날 모델 설명 가능성을 추가하는 데 도움이되는 몇 가지 모델 공연 도구가 있습니다. 우리는 이용 가능한 두 가지 도구를 더 깊이 살펴볼 것입니다.
ML 및 AI 모델을 개선하기위한 도구 설명 가능성 및 해석 성
모델 의사 결정 프로세스와 관련된 정보를 제공하는 모든 도구 및 모델 예측의 기능 기여는 매우 유용합니다. 시각화를 통해 설명을보다 직관적으로 만들 수 있습니다.
이 기사에서는 ML 및 AI 모델 설명 및 해석 가능성을 추가하기 위해 널리 사용되는 두 가지 외부 도구를 자세히 살펴볼 것입니다.
라임 (로컬 해석 가능한 모델-비수성 설명)
Shap (형태 적 부가 적 설명)
라임은 모델 불가지론이며, 모든 기계 학습 및 딥 러닝 모델로 구현 될 수 있습니다. 선형 및 로지스틱 회귀, 의사 결정 트리, 랜덤 포레스트, XGBOOST, KNN, ELASTICNET 등과 같은 기계 학습 모델 및 RNN, LSTM, CNN, 미리 훈련 된 블랙 박스 모델 등과 같은 심층 신경망 모델과 같은 기계 학습 모델과 함께 사용할 수 있습니다. 간단한 해석 가능한 모델을 사용하여 복잡한 모델의 내부 작업을 설명 할 수 있다고 가정합니다. 간단한 해석 가능한 모델은 간단한 선형 회귀 모델 또는 의사 결정 트리 모델 일 수 있습니다. 여기서는 간단한 선형 회귀 모델을 해석 가능한 모델로 사용하여 라임/쉐이프 설명을 사용하여 복잡한 모델에 대한 설명을 생성했습니다.
라임은 또한 한 번에 단일 관찰에서 로컬로 국소적인 해석 가능한 모델 공제 설명 작업을 호출하고 모델 이이 관찰의 점수를 어떻게 예측했는지 이해하는 데 도움이됩니다. 원래 관측에서 특징의 혼란스러운 값을 사용하여 합성 데이터를 생성하여 작동합니다.
교란 된 데이터는 무엇이며 어떻게 생성되는지?
테이블 데이터에 대한 교란 된 데이터 세트를 만들려면 Lime은 먼저 관찰의 모든 기능을 취한 다음 다양한 변환을 사용하여 기능 값을 약간 수정하여 관찰을위한 새로운 값을 반복적으로 생성합니다. 교란 된 값은 원래 관측 값에 매우 가깝고 원래의 값에 가까운 지역에서.
텍스트 및 이미지 데이터 유형의 경우 Lime은 원래 데이터 세트에서 기능을 무작위로 선택하고 기능에 대한 기능의 새로운 혼란스러운 값을 생성하여 데이터 세트를 반복적으로 생성합니다. 라임 커널 너비는 데이터 포인트 이웃의 크기를 제어합니다.
커널 크기가 작다는 것은 이웃이 작고 원래 값에 가장 가까운 포인트가 설명에 크게 영향을 미치는 반면, 큰 커널 크기의 경우 먼 지점이 라임 설명에 기여할 수 있습니다.
.
더 넓은 이웃 크기는 정확한 설명을 덜 이끌어 내지 만 데이터의 더 넓은 트렌드를 발견하는 데 도움이 될 수 있습니다. 보다 정확한 지역 설명을 위해서는 작은 이웃 크기를 선호해야합니다.
그림 이해
아래 그림 (그림 -1)을 통해 우리는 교란 된 값, 커널 크기 및 이웃에 약간의 직관을 주려고 노력합니다.
이 논의의 경우 BigMart 데이터 세트의 데이터 예제를 사용했으며 회귀 문제입니다. 우리는 라임에 대한 테이블 데이터를 사용했습니다
BigMart 데이터 세트에서 관측 #0을 고려합니다. 이 관찰에는 값이 13 인 'item_type'기능이 있습니다.이 기능의 평균 및 표준 편차를 계산했으며 평균 값은 7.234이고 표준 편차는 4.22입니다. 이것은 위 그림에 나와 있습니다. 이 정보를 사용하여 z- 점수를 1.366과 동일하게 계산했습니다. z- 점수의 왼쪽에있는 영역은 x 아래로 떨어질 기능의 값의 %를 우리에게 제공합니다. 1.366의 Z- 점수의 경우 x = 13 미만으로 떨어질 기능에 대해 약 91.40% 값이 있습니다. 따라서, 우리는이 기능에 대해 커널 폭이 x = 13 미만이어야한다는 직관을 얻습니다. 그리고 커널 너비는 교란 된 데이터에 대한 이웃의 크기를 제어하는 데 도움이 될 것입니다.
아래 그림 -2는 BigMart 데이터 세트의 3 가지 원래 테스트 데이터 포인트를 보여 주며 라임 프로세스의 직관을 얻기 위해이를 고려했습니다. Xgboost는 복잡한 모델이며 원래 관측 인스턴스에 대한 예측을 생성하는 데 사용되었습니다.
이 기사에서는 BigMart 전처리 및 인코딩 된 데이터 세트의 상위 3 개 레코드를 사용하여 토론을 뒷받침 할 예제 및 설명을 제공합니다.