비닝(Binning)과 회귀(Regression)은 데이터 분석에서 자주 사용되는 기법이지만, 목적과 활용 방식이 다릅니다.
비닝(Binning)은 연속형 데이터를 여러 개의 범주(구간, bin)로 나누는 과정입니다.
즉, 연속적인 값을 이산적(Discrete) 그룹으로 변환하는 기법입니다.
| 나이(연속형) | 비닝 후 (범주형) |
|---|---|
| 18 | 10~19세 (청소년) |
| 25 | 20~29세 (청년) |
| 35 | 30~39세 (중년) |
| 55 | 50~59세 (장년) |
📌 히스토그램에서의 비닝 예시
예를 들어, 키 데이터(연속형)를 “150160cm”, “160170cm”, “170~180cm” 같은 구간(bin)으로 나누는 것.
📌 평균 비닝 (Equal-width binning) vs. 분위수 비닝 (Equal-frequency binning)
회귀(Regression)는 연속형 변수 간의 관계를 수학적으로 모델링하여 값을 예측하는 기법입니다.
즉, 입력 변수(독립 변수 X)와 출력 변수(종속 변수 Y) 간의 관계를 찾아서 새로운 데이터를 예측하는 데 사용됩니다.
목표: 공부 시간(X)에 따른 시험 점수(Y) 예측
선형 회귀 방정식:Y=aX+bY = aX + bY=aX+b
(X: 공부 시간, Y: 점수)
예측:
📌 다항 회귀 (Polynomial Regression)
📌 로지스틱 회귀 (Logistic Regression)
| 비교 항목 | 비닝(Binning) | 회귀(Regression) |
|---|---|---|
| 목적 | 데이터를 구간(bin)으로 나눠 범주화 | 데이터의 관계를 모델링하여 예측 |
| 데이터 유형 | 연속형 → 범주형 변환 | 연속형 변수 간의 관계 분석 |
| 출력값 | 범주형 값 (그룹, 구간) | 연속형 값 (숫자 예측) |
| 예제 | 나이를 연령대(10대, 20대)로 변환 | 키에 따른 체중 예측 |
| 사용 사례 | 히스토그램, 그룹화된 통계 | 주가 예측, 날씨 예측, 수요 예측 |
즉, 비닝은 데이터를 단순화하는 과정이고, 회귀는 데이터를 기반으로 예측하는 기법입니다. 🎯
1. 타입스크립트 개요 타입스크립트(TypeScript)는 마이크로소프트(Microsoft)가 개발한 자바스크립트(JavaScript)의 상위 집합(Superset) 언어입니다.즉, 자바스크립트에 정적 타입(Static Type)을 추가하고,…
윈도우 운영체제의 노트북에서는 iPhone 유선 테더링이 잘 안되는 경우가 많습니다. 보통 iPhone의 드라이버가 설치가 안되있어서인…
안녕하세요, 혹시 이런 생각해 본 적 없으신가요? "내가 투자한 회사는 누가 감시하고, 어떻게 운영될까?" 오늘은…
1. Gemini CLI란 무엇인가요? Gemini CLI는 터미널 환경에서 직접 Gemini 모델과 상호작용할 수 있도록 만들어진…