PCA(Principal Component Analysis)
1. PCA란? PCA(Principal Component Analysis)는 데이터의 차원을 축소하면서도 데이터의 분산을 최대한 보존하는 기법입니다. 즉, 고차원 데이터를 저차원으로 변환하여 주요 정보만 유지하면서 계산 비용을 줄이고, 데이터의 시각화를 돕는 데 사용됩니다. 2. … Read more
빅데이터분석기사 관련
1. PCA란? PCA(Principal Component Analysis)는 데이터의 차원을 축소하면서도 데이터의 분산을 최대한 보존하는 기법입니다. 즉, 고차원 데이터를 저차원으로 변환하여 주요 정보만 유지하면서 계산 비용을 줄이고, 데이터의 시각화를 돕는 데 사용됩니다. 2. … Read more
1. 개요 로지스틱 회귀(Logistic Regression)는 종속 변수가 범주형(categorical)일 때 사용하는 지도 학습(Supervised Learning) 알고리즘입니다. 특히 이진 분류(Binary Classification) 문제에서 널리 사용됩니다. 예를 들면, 고객이 상품을 구매할지(1) 안 할지(0), 이메일이 스팸(1)인지 … Read more
엘라스틱넷(Elastic Net) 회귀는 릿지 회귀(Ridge)와 라쏘 회귀(Lasso)의 장점을 결합한 모델입니다.즉, L1 정규화(라쏘)와 L2 정규화(릿지)를 동시에 적용하여 변수 선택과 가중치 축소를 함께 수행합니다. 1. 엘라스틱넷의 핵심 개념 2. 엘라스틱넷 회귀 수식 … Read more
라쏘 회귀(Lasso Regression)는 선형 회귀(Linear Regression)에 L1 정규화(Regularization)를 추가한 모델입니다.라쏘(Lasso)는 Least Absolute Shrinkage and Selection Operator의 약자로, 변수 선택(Feature Selection) 기능을 제공하는 것이 특징입니다. 1. 라쏘 회귀의 핵심 개념 라쏘 … Read more
차원 축소(Dimensionality Reduction)는 고차원의 데이터를 저차원의 공간으로 변환하는 기법입니다. 이는 데이터의 중요한 정보를 최대한 유지하면서 불필요한 정보(노이즈)를 제거하고, 계산 효율성을 높이며, 데이터 시각화와 모델 성능 향상에 기여합니다. 1. 차원 축소의 … Read more
Scikit-learn은 파이썬에서 머신러닝을 위한 대표적인 라이브러리로, 다양한 머신러닝 알고리즘을 간편하게 활용할 수 있도록 지원합니다. 1. 특징 2. 주요 기능 ① 지도 학습 (Supervised Learning) ② 비지도 학습 (Unsupervised Learning) ③ … Read more
1. 머클 트리(Merkle Tree)란? 머클 트리(Merkle Tree)는 해시 트리(Hash Tree)의 일종으로, 대량의 데이터를 트리 구조로 해시 값을 저장하여 데이터 무결성을 검증하는 구조입니다.특히 블록체인, P2P 네트워크, 파일 시스템 등에서 데이터 무결성 … Read more
🔹 BERT란? BERT(Bidirectional Encoder Representations from Transformers)는✅ Google이 개발한 최신 자연어 처리(NLP) 모델이에요. ✅ 문장의 앞뒤를 모두 참고하는 “양방향(Bidirectional)” 모델! (GPT는 생성 방향에 특화, BERT는 이해하고 생성하는 양방향 특화 )✅ … Read more
🔹 LSTM이란? LSTM(Long Short-Term Memory, 장기 기억 신경망)은 RNN의 한 종류로,기억력이 짧은 RNN의 단점을 개선한 모델이에요! ✅ RNN은 연속된 데이터를 분석할 수 있지만, 기억력이 짧아서 “긴 문장”을 이해하지 못하는 문제가 … Read more