AI·빅데이터 파트 출제 경향
인공지능과 빅데이터는 정보처리기사 신기술 파트에서 매 시험 빠지지 않는 주제입니다. 머신러닝 학습 유형, 딥러닝 주요 모델, 빅데이터의 3V, 하둡·스파크 특징이 핵심입니다.
【기출 토픽 1】 머신러닝 학습 유형
기출 문제 예시: 레이블(정답)이 없는 데이터에서 숨겨진 패턴이나 구조를 스스로 찾아내는 학습 방법은?
- ① 지도 학습 (Supervised Learning)
- ② 비지도 학습 (Unsupervised Learning) ✅
- ③ 강화 학습 (Reinforcement Learning)
- ④ 준지도 학습 (Semi-supervised Learning)
머신러닝 3대 학습 유형:
- 지도 학습: 레이블 있는 데이터, 분류·회귀 / 예: 이메일 스팸 분류, 주가 예측
- 비지도 학습: 레이블 없는 데이터, 클러스터링·차원축소 / 예: 고객 세분화
- 강화 학습: 보상 최대화, 에이전트-환경 상호작용 / 예: 알파고, 게임 AI
【기출 토픽 2】 딥러닝 주요 모델
기출 문제 예시: 이미지 인식에 특화되어 있으며 합성곱(Convolution) 연산으로 특징을 추출하는 딥러닝 모델은?
- ① RNN (Recurrent Neural Network)
- ② CNN (Convolutional Neural Network) ✅
- ③ GAN (Generative Adversarial Network)
- ④ Transformer
딥러닝 주요 모델 비교:
- CNN: 이미지·영상 처리, 합성곱·풀링 레이어
- RNN/LSTM: 순서 데이터(텍스트·시계열) 처리
- GAN: 생성자+판별자로 이미지 생성
- Transformer: 어텐션 메커니즘, ChatGPT 등 LLM의 기반
【기출 토픽 3】 빅데이터 3V·5V
기출 문제 예시: 빅데이터의 3V 특징에 해당하지 않는 것은?
- ① Volume (데이터 규모)
- ② Velocity (데이터 속도)
- ③ Variety (데이터 다양성)
- ④ Veracity (데이터 정확성) ✅
해설: 빅데이터 3V는 Volume·Velocity·Variety입니다. Veracity(정확성)와 Value(가치)는 5V 확장 개념입니다.
처리 방식: 배치 처리(Hadoop MapReduce) / 실시간 처리(Apache Kafka, Spark Streaming) / 대화형 분석(Spark, Hive)
【기출 토픽 4】 하둡(Hadoop) 에코시스템
기출 문제 예시: 대용량 데이터를 여러 노드에 분산 저장하는 하둡의 분산 파일 시스템은?
- ① MapReduce
- ② HDFS (Hadoop Distributed File System) ✅
- ③ YARN
- ④ HBase
하둡 주요 구성 요소:
- HDFS: 분산 파일 시스템 (블록 단위 복제 저장)
- MapReduce: 분산 병렬 처리 프레임워크
- YARN: 리소스 관리자
- Apache Spark: 인메모리 처리로 MapReduce보다 최대 100배 빠름
AI·빅데이터 최종 정리
머신러닝 3대 학습 유형, CNN·RNN·Transformer 적용 분야, 빅데이터 3V, HDFS와 MapReduce·Spark 역할을 중심으로 학습하세요. AI 윤리, 설명 가능한 AI(XAI), 페더레이티드 러닝도 최근 출제되고 있습니다.