테스트 타임 컴퓨팅(Test-Time Compute, TTC)

1년 ago

테스트 타임 컴퓨팅(Test-Time Compute, TTC) 개요 1. 테스트 타임 컴퓨팅(TTC)이란? 테스트 타임 컴퓨팅(Test-Time Compute, TTC)은 머신 러닝 및 딥 러닝…

자주 사용하는 전처리 (데이터 전처리)

1년 ago

데이터 전처리 - 자주 사용하는 전처리 (금융데이터) 데이터 준비 https://finance.naver.com/item/main.nhn?code=005930 import pandas as pd import io csv_text = ''' 시가총액,336조…

텍스트 데이터 인코딩 (데이터 전처리)

1년 ago

데이터 전처리 — 텍스트 데이터 인코딩 대표적인 인코딩 ASCII EUC-KR CP949 UTF-8 ASCII American Standard Code for Information Interchange 0x00…

NumPy

1년 ago

NumPy 라이브러리란? NumPy(넘파이, Numerical Python)는 파이썬에서 과학 계산 및 데이터 분석을 위한 대표적인 라이브러리입니다. 다차원 배열 객체인 ndarray를 제공하며, 수학…

비닝과 회귀의 차이

1년 ago

비닝(Binning)과 회귀(Regression)의 차이 비닝(Binning)과 회귀(Regression)은 데이터 분석에서 자주 사용되는 기법이지만, 목적과 활용 방식이 다릅니다. 1. 비닝(Binning) 🔹 개념 비닝(Binning)은 연속형…

68-95-99.7 규칙 (Three Sigma Rule)

1년 ago

68-95-99.7 규칙 (Three Sigma Rule) 68-95-99.7 규칙은 정규분포(Gaussian distribution)에서 평균(μ)과 표준편차(σ)를 기준으로 데이터가 분포하는 비율을 나타내는 경험적인 법칙입니다. 1. 규칙의…

데이터 전처리 실습

1년 ago

데이터 준비 결측치 처리 결측치 처리: 개수 확인 # 결측치 개수 df.isnull().sum() # 결측치 개수 (전체) df.isnull().sum().sum() df.dropna() # df.dropna(axis=0)…

FTP 패시브(Passive) 모드

1년 ago

FTP의 패시브(Passive) 모드는 클라이언트가 방화벽이나 NAT(Network Address Translation) 뒤에 있을 때 데이터 전송 문제를 해결하기 위해 사용됩니다. 기본적으로, FTP는 액티브(Active)…

IQR(Interquartile Range, 사분위 범위)

1년 ago

IQR(Interquartile Range, 사분위 범위)는 데이터에서 이상치를 탐지하고 변동성을 측정하는 데 사용되는 통계적 지표입니다. 📌 IQR의 정의 IQR은 데이터의 1사분위수(Q1)와 3사분위수(Q3)의…

데이터 전처리 개요

1년 ago

데이터 전처리 데이터 분석에 적합하게 데이터를 가공하는 작업 전처리가 분석 결과에 직접적인 영향 데이터 분석의 단계 중 가장 많은 시간이…