웹 크롤링

5개월 ago

웹 크롤링이란? 자동화된 방법으로 웹을 탐색하고 데이터를 수집하는 작업 크롬 개발자 도구 (Chrome Developer Tools) 크롬에 기본 탑재된 웹 개발…

마켓 데이터 개요

5개월 ago

마켓 데이터에 대한 질문들 내가 원하는 데이터를 충분히 얻으려면 비용은 얼마나 드나? 어디서 어떤 데이터를 얼마나 얻을 수 있나? 개인과…

테스트 타임 컴퓨팅(Test-Time Compute, TTC)

5개월 ago

테스트 타임 컴퓨팅(Test-Time Compute, TTC) 개요 1. 테스트 타임 컴퓨팅(TTC)이란? 테스트 타임 컴퓨팅(Test-Time Compute, TTC)은 머신 러닝 및 딥 러닝…

자주 사용하는 전처리 (데이터 전처리)

5개월 ago

데이터 전처리 - 자주 사용하는 전처리 (금융데이터) 데이터 준비 https://finance.naver.com/item/main.nhn?code=005930 import pandas as pd import io csv_text = ''' 시가총액,336조…

텍스트 데이터 인코딩 (데이터 전처리)

5개월 ago

데이터 전처리 — 텍스트 데이터 인코딩 대표적인 인코딩 ASCII EUC-KR CP949 UTF-8 ASCII American Standard Code for Information Interchange 0x00…

NumPy

5개월 ago

NumPy 라이브러리란? NumPy(넘파이, Numerical Python)는 파이썬에서 과학 계산 및 데이터 분석을 위한 대표적인 라이브러리입니다. 다차원 배열 객체인 ndarray를 제공하며, 수학…

비닝과 회귀의 차이

5개월 ago

비닝(Binning)과 회귀(Regression)의 차이 비닝(Binning)과 회귀(Regression)은 데이터 분석에서 자주 사용되는 기법이지만, 목적과 활용 방식이 다릅니다. 1. 비닝(Binning) 🔹 개념 비닝(Binning)은 연속형…

68-95-99.7 규칙 (Three Sigma Rule)

5개월 ago

68-95-99.7 규칙 (Three Sigma Rule) 68-95-99.7 규칙은 정규분포(Gaussian distribution)에서 평균(μ)과 표준편차(σ)를 기준으로 데이터가 분포하는 비율을 나타내는 경험적인 법칙입니다. 1. 규칙의…

데이터 전처리 실습

5개월 ago

데이터 준비 결측치 처리 결측치 처리: 개수 확인 # 결측치 개수 df.isnull().sum() # 결측치 개수 (전체) df.isnull().sum().sum() df.dropna() # df.dropna(axis=0)…

FTP 패시브(Passive) 모드

5개월 ago

FTP의 패시브(Passive) 모드는 클라이언트가 방화벽이나 NAT(Network Address Translation) 뒤에 있을 때 데이터 전송 문제를 해결하기 위해 사용됩니다. 기본적으로, FTP는 액티브(Active)…