Colab (Google Colaboratory)

Colab(Google Colaboratory)은 Google에서 제공하는 클라우드 기반의 Jupyter Notebook 환경으로, 사용자가 별도의 환경 설정 없이 Python 코드를 실행하고 머신러닝 및 데이터 과학 작업을 수행할 수 있도록 도와줍니다. Colab의 주요 특징 Colab … Read more

셀레니움 웹 크롤링 방법

셀레니움을 활용하여 finviz사이트의 S&P 500 Treemap을 가져오는 크롤링하는 방법을 알려드리겠습니다. 혹시 셀레니움이 뭔지 모르신다면 이전 포스팅을 먼저 읽어보고 오시는것을 추천드립니다. 셀레니움 포스팅 ☞ 바로가기 Anaconda 설치 후 주피터 노트북에서 실습하거나 … Read more

ipynb 파일의 유래

ipynb 파일 형식은 Jupyter Notebook에서 사용하는 파일 확장자입니다. 이 확장자의 유래는 다음과 같습니다. 정리 IPython 추가 정보 Python의 주요 특징 IPython의 역사 IPython과 Jupyter의 차이점 구분 IPython Jupyter 개념 대화형 … Read more

머클 트리(Merkle Tree)

머클 트리(Merkle Tree)는 블록체인 및 분산 시스템에서 데이터 무결성을 검증하는 데 사용되는 해시 트리(Hash Tree)의 한 종류입니다. 1. 머클 트리 개념 머클 트리는 리프(leaf) 노드에 원본 데이터의 해시 값을 저장하고, … Read more

네이버 파이낸스 개별종목 재무제표 가져오기

네이버 파이낸스 개별종목 재무제표 네이버 증권의 개별종목 페이지에서 상세한 데이터를 제공합니다. https://finance.naver.com/item/coinfo.naver?code=005930&target=finsum_more 여기에는 개별종목의 재무데이터를 포함하고 있습니다. 이 재무제표를 엑셀에 붙여넣거나 가공하기가 쉽지 않습니다. FinanceDataReader 를 활용하여 개별 종목의 재무제표 … Read more

웹 크롤링 예제(네이버 금융 시가총액 크롤링)

아래는 네이버 금융의 시가총액 순위 1위부터 500위까지 데이터를 가져와 엑셀로 저장하는 Python 코드입니다. 🔹 설명 ✅ Python 코드 import pandas as pdimport requestsfrom time import sleep# 저장할 엑셀 파일명excel_filename = … Read more

텍스트 데이터 인코딩 (데이터 전처리)

데이터 전처리 — 텍스트 데이터 인코딩 대표적인 인코딩 ASCII ISO 8859 UTF-8 : 유니코드 EUC-KR CP949 데이터 파일 다루기 master.csv rss_30100041.xml 윈도우에서는 인코딩을 지정해주어야 합니다 인코딩 감지 인코딩 변환 인코딩 … Read more

NumPy

NumPy 라이브러리란? NumPy(넘파이, Numerical Python)는 파이썬에서 과학 계산 및 데이터 분석을 위한 대표적인 라이브러리입니다. 다차원 배열 객체인 ndarray를 제공하며, 수학 연산 및 행렬 연산을 효율적으로 수행할 수 있도록 최적화되어 있습니다. … Read more

데이터 전처리 실습

데이터 준비 결측치 처리 결측치 처리: 개수 확인 결측치 처리: 데이터 혹은 컬럼 삭제 결측치 처리: 대체 (imputation) Outlier 탐지 3표준편차 와 IQR 방법 Outlier 처리: QR 이용하는 방법 Outlier … Read more