zerg96

자주 사용하는 전처리 (데이터 전처리)

데이터 전처리 - 자주 사용하는 전처리 (금융데이터) 데이터 준비 https://finance.naver.com/item/main.nhn?code=005930 import pandas as pd import io csv_text = ''' 시가총액,336조…

5개월 ago

텍스트 데이터 인코딩 (데이터 전처리)

데이터 전처리 — 텍스트 데이터 인코딩 대표적인 인코딩 ASCII EUC-KR CP949 UTF-8 ASCII American Standard Code for Information Interchange 0x00…

5개월 ago

NumPy

NumPy 라이브러리란? NumPy(넘파이, Numerical Python)는 파이썬에서 과학 계산 및 데이터 분석을 위한 대표적인 라이브러리입니다. 다차원 배열 객체인 ndarray를 제공하며, 수학…

5개월 ago

비닝과 회귀의 차이

비닝(Binning)과 회귀(Regression)의 차이 비닝(Binning)과 회귀(Regression)은 데이터 분석에서 자주 사용되는 기법이지만, 목적과 활용 방식이 다릅니다. 1. 비닝(Binning) 🔹 개념 비닝(Binning)은 연속형…

5개월 ago

68-95-99.7 규칙 (Three Sigma Rule)

68-95-99.7 규칙 (Three Sigma Rule) 68-95-99.7 규칙은 정규분포(Gaussian distribution)에서 평균(μ)과 표준편차(σ)를 기준으로 데이터가 분포하는 비율을 나타내는 경험적인 법칙입니다. 1. 규칙의…

5개월 ago

데이터 전처리 실습

데이터 준비 결측치 처리 결측치 처리: 개수 확인 # 결측치 개수 df.isnull().sum() # 결측치 개수 (전체) df.isnull().sum().sum() df.dropna() # df.dropna(axis=0)…

5개월 ago

FTP 패시브(Passive) 모드

FTP의 패시브(Passive) 모드는 클라이언트가 방화벽이나 NAT(Network Address Translation) 뒤에 있을 때 데이터 전송 문제를 해결하기 위해 사용됩니다. 기본적으로, FTP는 액티브(Active)…

5개월 ago

IQR(Interquartile Range, 사분위 범위)

IQR(Interquartile Range, 사분위 범위)는 데이터에서 이상치를 탐지하고 변동성을 측정하는 데 사용되는 통계적 지표입니다. 📌 IQR의 정의 IQR은 데이터의 1사분위수(Q1)와 3사분위수(Q3)의…

5개월 ago

데이터 전처리 개요

데이터 전처리 데이터 분석에 적합하게 데이터를 가공하는 작업 전처리가 분석 결과에 직접적인 영향 데이터 분석의 단계 중 가장 많은 시간이…

5개월 ago

프롬프트 엔지니어링 (Prompt Engineering)

1. 프롬프트 엔지니어링이란? 프롬프트 엔지니어링(Prompt Engineering)은 AI 모델, 특히 대형 언어 모델(LLM)이나 생성형 AI에게 원하는 결과를 얻기 위해 입력(프롬프트)을 최적화하는…

5개월 ago