KoNLPy(Korean Natural Language Processing in Python)는 한국어 자연어 처리를 위한 파이썬 라이브러리입니다. 형태소 분석기(예: Mecab, Komoran, Kkma, Hannanum, Okt)를 지원하며,…
NLTK (Natural Language Toolkit)는 자연어 처리를 위한 파이썬 라이브러리로, 텍스트 분석, 토큰화, 형태소 분석, 품사 태깅, 구문 분석, 의미 분석…
일원분산분석(One-Way ANOVA, One-Way Analysis of Variance)은 한 개의 독립 변수(요인, Factor) 가 여러 그룹으로 나뉠 때, 각 그룹의 평균이 통계적으로…
Colab(Google Colaboratory)은 Google에서 제공하는 클라우드 기반의 Jupyter Notebook 환경으로, 사용자가 별도의 환경 설정 없이 Python 코드를 실행하고 머신러닝 및 데이터…
셀레니움을 활용하여 finviz사이트의 S&P 500 Treemap을 가져오는 크롤링하는 방법을 알려드리겠습니다. 혹시 셀레니움이 뭔지 모르신다면 이전 포스팅을 먼저 읽어보고 오시는것을 추천드립니다.…
ipynb 파일 형식은 Jupyter Notebook에서 사용하는 파일 확장자입니다. 이 확장자의 유래는 다음과 같습니다. iPython은 Interactive Python이라는 대화형 쉘(interactive shell) 기반의…
네이버 파이낸스 개별종목 재무제표 네이버 증권의 개별종목 페이지에서 상세한 데이터를 제공합니다. https://finance.naver.com/item/coinfo.naver?code=005930&target=finsum_more 여기에는 개별종목의 재무데이터를 포함하고 있습니다. 이 재무제표를 엑셀에…
아래는 네이버 금융의 시가총액 순위 1위부터 500위까지 데이터를 가져와 엑셀로 저장하는 Python 코드입니다. 🔹 설명 requests를 사용하여 네이버 금융 페이지의…
NumPy 라이브러리란? NumPy(넘파이, Numerical Python)는 파이썬에서 과학 계산 및 데이터 분석을 위한 대표적인 라이브러리입니다. 다차원 배열 객체인 ndarray를 제공하며, 수학…
데이터 준비 결측치 처리 결측치 처리: 개수 확인 # 결측치 개수 df.isnull().sum() # 결측치 개수 (전체) df.isnull().sum().sum() df.dropna() # df.dropna(axis=0)…