[제136회 정보관리기술사 1교시 1번] 연합학습(Federated Learning) — 데이터 프라이버시를 지키는 분산 AI 학습

📋 정보관리기술사 기출문제 해설

Table of Contents

제136회 · 1교시 · 1번

배점: 10점 | 유형: 단답형

📌 원문 문제

연합학습(Federated Learning)을 설명하시오.

의료·금융 데이터처럼 외부 공유가 불가한 민감 데이터를 활용한 AI 학습 방법으로, 개인정보보호법 강화 흐름과 맞물려 중요도가 높아졌습니다. 수평/수직 분류, 집계 서버 구조, 차분 프라이버시와의 연계까지 아우르면 고득점 답안이 됩니다.

연합학습(Federated Learning)이란 원본 데이터를 중앙 서버로 전송하지 않고, 각 참여 기기(클라이언트)에서 로컬로 모델을 학습한 뒤 모델 파라미터(그래디언트)만 중앙 서버에 전송하여 전역 모델을 갱신하는 분산 머신러닝 기법입니다.

Google이 제안한 대표 집계 알고리즘으로, 각 클라이언트의 데이터 수(n_k)에 비례하여 가중 평균으로 전역 모델을 갱신합니다.

전역모델 W = Σ (n_k / N) × W_k

  N: 전체 데이터 수, W_k: k번째 클라이언트 모델 파라미터

✅ 핵심 암기: 연합학습 = 데이터 안 움직이고 모델(파라미터)만 집계 | 수평(행 분할)·수직(열 분할) | FedAvg = 가중 평균 집계