빅데이터분석기사

NumPy (Numerical Python)

NumPy 라이브러리 개요 NumPy (Numerical Python)는 파이썬에서 행렬이나 대규모 다차원 배열을 쉽게 처리하는 등 강력한 수치 계산을 지원하는 파이썬 라이브러리입니다.…

4개월 ago

Colab (Google Colaboratory)

Colab(Google Colaboratory)은 Google에서 제공하는 클라우드 기반의 Jupyter Notebook 환경으로, 사용자가 별도의 환경 설정 없이 Python 코드를 실행하고 머신러닝 및 데이터…

4개월 ago

셀레니움 웹 크롤링 방법

셀레니움을 활용하여 finviz사이트의 S&P 500 Treemap을 가져오는 크롤링하는 방법을 알려드리겠습니다. 혹시 셀레니움이 뭔지 모르신다면 이전 포스팅을 먼저 읽어보고 오시는것을 추천드립니다.…

4개월 ago

SOM(Self-Organizing Map, 군집 분석 기법)

자기조직화 지도(SOM, Self-Organizing Map) 군집 분석 기법 1. SOM 개요 자기조직화 지도(SOM, Self-Organizing Map)는 인공신경망(Artificial Neural Network, ANN)의 한 종류로,…

4개월 ago

네이버 파이낸스 개별종목 재무제표 가져오기

네이버 파이낸스 개별종목 재무제표 네이버 증권의 개별종목 페이지에서 상세한 데이터를 제공합니다. https://finance.naver.com/item/coinfo.naver?code=005930&target=finsum_more 여기에는 개별종목의 재무데이터를 포함하고 있습니다. 이 재무제표를 엑셀에…

4개월 ago

텍스트 데이터 인코딩 (데이터 전처리)

데이터 전처리 — 텍스트 데이터 인코딩 대표적인 인코딩 ASCII EUC-KR CP949 UTF-8 ASCII American Standard Code for Information Interchange 0x00…

4개월 ago

비닝과 회귀의 차이

비닝(Binning)과 회귀(Regression)의 차이 비닝(Binning)과 회귀(Regression)은 데이터 분석에서 자주 사용되는 기법이지만, 목적과 활용 방식이 다릅니다. 1. 비닝(Binning) 🔹 개념 비닝(Binning)은 연속형…

4개월 ago

데이터 전처리 실습

데이터 준비 결측치 처리 결측치 처리: 개수 확인 # 결측치 개수 df.isnull().sum() # 결측치 개수 (전체) df.isnull().sum().sum() df.dropna() # df.dropna(axis=0)…

4개월 ago

데이터 전처리 개요

데이터 전처리 데이터 분석에 적합하게 데이터를 가공하는 작업 전처리가 분석 결과에 직접적인 영향 데이터 분석의 단계 중 가장 많은 시간이…

4개월 ago