엣지 컴퓨팅(Edge Computing)은 데이터 발생 지점(디바이스·네트워크 엣지)에서 가까운 곳에 컴퓨팅 자원을 배치하여 지연 시간 최소화, 대역폭 절감, 실시간 처리를 실현하는 분산 컴퓨팅 패러다임이다.
| 특성 | 클라우드 컴퓨팅 | 엣지 컴퓨팅 |
|---|---|---|
| 처리 위치 | 중앙 데이터센터 | 디바이스 근처 (현장/기지국/게이트웨이) |
| 지연 시간 | 수십~수백 ms | 1ms 미만 ~ 수 ms |
| 대역폭 | 모든 데이터 전송 (높은 비용) | 필요한 데이터만 클라우드 전송 (절감) |
| 프라이버시 | 원격 전송으로 프라이버시 위험 | 로컬 처리로 민감 데이터 보호 |
| 오프라인 | 인터넷 의존 | 오프라인 동작 가능 |
| 계층 | 구성 요소 | 주요 기능 | 프로토콜·기술 |
|---|---|---|---|
| 디바이스 계층 | 센서, 액추에이터, 마이크로컨트롤러(MCU), 임베디드 시스템 | 데이터 수집, 물리 세계 상호작용, 저전력 동작 | MQTT, CoAP, BLE, Zigbee, LoRaWAN |
| 엣지 계층 | 게이트웨이, MEC(Mobile Edge Computing) 서버, 산업용 PC | 로컬 데이터 전처리·필터링, 실시간 추론, 프로토콜 변환, 로컬 저장 | Docker/K3s, TensorFlow Lite, ONNX Runtime |
| 클라우드 계층 | IoT Hub, 데이터 레이크, AI/ML 플랫폼, 디지털 트윈 서버 | 장기 데이터 저장, 대규모 분석, 모델 학습, 디바이스 관리(OTA) | AWS IoT Core, Azure IoT Hub, GCP IoT |
| 기법 | 개념 | 효과 | 도구 |
|---|---|---|---|
| Pruning (가지치기) | 중요도가 낮은 가중치(뉴런·레이어)를 제거하여 모델 크기 축소 | 모델 크기 50~90% 감소, 추론 속도 향상 | TensorFlow Model Optimization, PyTorch |
| Quantization (양자화) | FP32 가중치를 INT8·INT4로 변환하여 메모리·연산량 감소 | 모델 크기 4x 감소, 추론 2~4x 가속 (정확도 소폭 저하) | TFLite, ONNX Runtime, QAT |
| Knowledge Distillation (지식 증류) | 대형 Teacher 모델의 소프트 레이블로 소형 Student 모델을 학습 | 정확도 유지하면서 모델 크기 대폭 감소 | DistilBERT, TinyBERT, MobileNet |
엣지 컴퓨팅은 실시간성·대역폭·프라이버시 요구를 충족하는 분산 처리 패러다임으로, IoT·자율주행·스마트 팩토리에서 핵심 인프라로 자리잡고 있다. 제한된 엣지 자원에서 AI 추론을 실행하려면 Pruning·Quantization·Knowledge Distillation 등 경량화 기법이 필수이며, 물리적 위협부터 네트워크 위협까지 다층 보안 전략이 동반되어야 한다.
요양원 선택 전 반드시 확인해야 할 체크리스트를 공개합니다. 공식 평가 자료 조회법, 방문 시 확인…
공공기관 채용 비리의 실태와 피해 지원자의 대응법을 정리했습니다. 채용 비리 신고 방법, 공익신고자 보호제도, 취준생…
주식 손실을 세금 절약에 활용하는 합법적 방법을 공개합니다. 해외주식 손익통산, ISA 계좌 활용, 연금계좌 절세까지…
배달이 예상 시간보다 크게 늦으면 취소·환불을 요청할 수 있습니다. 배달앱별 지연 취소 방법과 잘못 배달됐을…
통신비 절약의 핵심은 요금제 최적화입니다. 내 데이터 사용량 확인법, 알뜰폰 전환 비교, 위약금 없이 요금제…