| 비교 항목 | 릿지 회귀 (Ridge Regression) | 라쏘 회귀 (Lasso Regression) |
|---|---|---|
| 정규화 방식 | L2 정규화 (제곱합 ∑βj2\sum \beta_j^2∑βj2) | L1 정규화 (절댓값 합 (\sum |
| 과적합 방지 | 가능 (모든 계수를 작게 만듦) | 가능 (일부 계수를 0으로 만들어 변수 선택) |
| 변수 선택 | ❌ 없음 (모든 변수를 유지) | ✅ 있음 (일부 계수를 0으로 만듦) |
| 계수 축소 방식 | 모든 계수를 작게 만듦 | 불필요한 변수의 계수를 0으로 만들어 완전히 제거 |
| 다중 공선성 해결 | ✅ 효과적 | ✅ 효과적이지만 릿지보다 불안정할 수 있음 |
| 해석 가능성 | ❌ 낮음 (모든 변수를 유지) | ✅ 높음 (불필요한 변수 제거) |
| 적합한 데이터셋 | 연속적인 데이터 (변수 선택이 필요하지 않은 경우) | 고차원 데이터 (변수 선택이 필요한 경우) |
| 모델의 복잡도 조절 | 모델의 크기만 줄임 (모든 변수를 사용) | 모델을 단순화하고 중요 변수만 선택 |
아래 그래프는 릿지와 라쏘의 계수 변화를 나타냅니다.
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import Ridge, Lasso
from sklearn.datasets import make_regression
# 데이터 생성
X, y = make_regression(n_samples=100, n_features=10, noise=10, random_state=42)
# 릿지와 라쏘 모델 생성
ridge = Ridge(alpha=1.0)
lasso = Lasso(alpha=0.1)
# 모델 학습
ridge.fit(X, y)
lasso.fit(X, y)
# 계수 시각화
plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.bar(range(len(ridge.coef_)), ridge.coef_)
plt.title("Ridge Regression Coefficients")
plt.xlabel("Feature Index")
plt.ylabel("Coefficient Value")
plt.subplot(1, 2, 2)
plt.bar(range(len(lasso.coef_)), lasso.coef_)
plt.title("Lasso Regression Coefficients")
plt.xlabel("Feature Index")
plt.ylabel("Coefficient Value")
plt.show() | 상황 | 추천 모델 |
|---|---|
| 모든 변수를 유지하고 싶음 | 릿지 (Ridge) |
| 다중 공선성이 높은 경우 | 릿지 (Ridge) |
| 중요하지 않은 변수를 자동으로 제거하고 싶음 | 라쏘 (Lasso) |
| 데이터에 변수가 많고 일부만 중요한 경우 | 라쏘 (Lasso) |
| 변수 선택 기능이 필요 없음 | 릿지 (Ridge) |
| 모델을 더 간결하게 만들고 싶음 | 라쏘 (Lasso) |
고차원 데이터에서 변수 선택이 필요하면 라쏘, 모든 변수를 유지하면서 조절하고 싶다면 릿지!
코스피 8% 폭락, 서킷브레이커 발동, SK텔레콤 Claude AI 차단까지. 한국의 AI 레버리지 버블이 단 하루…
SNS 사진 1장으로 30초 만에 딥페이크 영상이 완성됩니다. 당신의 얼굴이 이미 범죄에 악용되고 있을 수…
SNS 사진 1장으로 30초 만에 딥페이크 영상이 완성됩니다. 당신의 얼굴이 이미 범죄에 악용되고 있을 수…
달러/원 환율이 급등하는 이유와 실생활 영향을 정리했습니다. 지금 당장 활용할 수 있는 환전·투자 대응 전략까지…
미래에셋·미래에셋벤처투자·미래에셋생명이 동반 급등한 이유는 스페이스X 상장 기대감입니다. 세 회사가 스페이스X와 어떻게 연결되어 있는지 상세히 분석했습니다.
스페이스X 상장이 계속 미뤄지는 진짜 이유를 파헤쳤습니다. 화성 계획, 스타링크 분리, 국방 계약... 머스크가 절대…