XAI(Explainable AI)는 AI 모델의 예측 결과에 대해 인간이 이해할 수 있는 설명을 제공하는 기술이다. 딥러닝 모델의 블랙박스 특성으로 인해 의사결정 근거를 요구하는 고위험 분야(의료·금융·법률·채용)에서 필수 요소다.
필요성: EU AI Act 고위험 AI 설명 의무, GDPR ‘자동화 의사결정 설명 요구권’, 의료 AI 오진 책임 소재, AI 편향 탐지 및 신뢰 구축
| 기법 | 원리 | 특성 | 적용 분야 |
|---|---|---|---|
| LIME (Local Interpretable Model-agnostic Explanations) | 특정 예측 주변에서 입력 변형 → 단순한 대리 모델(Surrogate)로 근사 설명 | 모델 무관(Agnostic), 로컬 설명, 다양한 데이터 타입 | 텍스트·이미지·표형 데이터 분류 |
| SHAP (SHapley Additive exPlanations) | 게임 이론의 Shapley 값으로 각 피처가 예측에 기여한 정도를 수학적으로 계산 | 이론적 엄밀성, 전역·로컬 설명 모두 가능, 일관성 보장 | 신용 심사, 의료 진단, 피처 중요도 |
| Grad-CAM (Gradient-weighted CAM) | CNN 마지막 합성곱 레이어의 그래디언트를 이용해 예측에 중요한 이미지 영역 시각화 | 이미지 특화, 직관적 히트맵 | 의료 영상(X-ray·CT), 자율주행 객체 인식 |
| Attention Visualization | Transformer 어텐션 가중치를 시각화하여 모델이 주목한 토큰·위치 표시 | NLP·Vision Transformer에 자연스럽게 내장 | 텍스트 감성 분석, 기계 번역, 질의응답 |
| 편향 유형 | 설명 | 완화 기법 |
|---|---|---|
| 역사적 편향 | 사회 차별이 학습 데이터에 반영 (예: 특정 인종 채용 거절 이력) | 데이터 재균형(Resampling), 레이블 재조정 |
| 표현 편향 | 특정 그룹의 데이터가 과소/과대 표현 | Oversampling(SMOTE), 합성 데이터 생성 |
| 측정 편향 | 피처 측정 방식이 그룹에 따라 다른 품질 | 공정성 제약 조건 학습(Adversarial Debiasing) |
| 평가 편향 | 정확도 집계 지표가 하위 그룹 불평등 은폐 | 그룹별 정확도·FPR·FNR 별도 측정, 공정성 메트릭(Demographic Parity, Equalized Odds) |
XAI는 SHAP·LIME·Grad-CAM·Attention 기법으로 블랙박스 AI 모델의 설명을 제공하고, AI 편향을 탐지·완화하여 공정한 AI 시스템을 구현한다. EU AI Act와 GDPR 준수를 위해 고위험 AI에서 설명가능성과 공정성은 선택이 아닌 의무 요건이다.
코스피 8% 폭락, 서킷브레이커 발동, SK텔레콤 Claude AI 차단까지. 한국의 AI 레버리지 버블이 단 하루…
SNS 사진 1장으로 30초 만에 딥페이크 영상이 완성됩니다. 당신의 얼굴이 이미 범죄에 악용되고 있을 수…
SNS 사진 1장으로 30초 만에 딥페이크 영상이 완성됩니다. 당신의 얼굴이 이미 범죄에 악용되고 있을 수…
달러/원 환율이 급등하는 이유와 실생활 영향을 정리했습니다. 지금 당장 활용할 수 있는 환전·투자 대응 전략까지…
미래에셋·미래에셋벤처투자·미래에셋생명이 동반 급등한 이유는 스페이스X 상장 기대감입니다. 세 회사가 스페이스X와 어떻게 연결되어 있는지 상세히 분석했습니다.
스페이스X 상장이 계속 미뤄지는 진짜 이유를 파헤쳤습니다. 화성 계획, 스타링크 분리, 국방 계약... 머스크가 절대…