로지스틱 회귀(Logistic Regression)

1. 개요 로지스틱 회귀(Logistic Regression)는 종속 변수가 범주형(categorical)일 때 사용하는 지도 학습(Supervised Learning) 알고리즘입니다. 특히 이진 분류(Binary Classification) 문제에서 널리 사용됩니다. 예를 들면, 고객이 상품을 구매할지(1) 안 할지(0), 이메일이 스팸(1)인지 … Read more

Scikit-learn (사이킷런)

Scikit-learn은 파이썬에서 머신러닝을 위한 대표적인 라이브러리로, 다양한 머신러닝 알고리즘을 간편하게 활용할 수 있도록 지원합니다. 1. 특징 2. 주요 기능 ① 지도 학습 (Supervised Learning) ② 비지도 학습 (Unsupervised Learning) ③ … Read more

KoNLPy(Korean Natural Language Processing in Python)

KoNLPy(Korean Natural Language Processing in Python)는 한국어 자연어 처리를 위한 파이썬 라이브러리입니다. 형태소 분석기(예: Mecab, Komoran, Kkma, Hannanum, Okt)를 지원하며, 한국어 텍스트를 분석하는 데 유용합니다. 📌 주요 기능 📌 설치 … Read more

TF-IDF (Term Frequency – Inverse Document Frequency)

📌 TF-IDF (Term Frequency – Inverse Document Frequency)란? TF-IDF는 문서 내 단어의 중요도를 평가하는 대표적인 방법입니다. 특정 단어가 문서에서 얼마나 중요한지를 수치화하여, 문서 간 유사도를 측정하거나 검색 엔진에서 검색 결과를 … Read more

코사인 유사도 (Cosine Similarity)

📌 코사인 유사도 (Cosine Similarity) 코사인 유사도는 두 벡터 간의 각도를 기반으로 두 값이 얼마나 비슷한지 유사도를 측정하는 방법입니다. 값의 범위는 -1 ≤ cosine similarity ≤ 1이며, 값이 1에 가까울수록 … Read more

NLTK (Natural Language Toolkit)

NLTK (Natural Language Toolkit)는 자연어 처리를 위한 파이썬 라이브러리로, 텍스트 분석, 토큰화, 형태소 분석, 품사 태깅, 구문 분석, 의미 분석 등의 다양한 기능을 제공합니다. 다음과 같은 고유한 특징을 가지고 있습니다. … Read more

NLP (Natural Language Processing, 자연어 처리)

NLP – 자연어 처리 기술 개요 문서, 문단, 문장 문서 (document), 문단(paragraph), 문장(sentence) 문장, 어절, 형태소 문장(sentence), 어절(eojeol, word phrase), 형태소(morpheme) NLP 주요 용어 참고: 한국어 품사 https://goo.gl/s8W3hW NLP의 주요 연구 … Read more

일원분산분석(One-Way ANOVA, One-Way Analysis of Variance)

일원분산분석(One-Way ANOVA, One-Way Analysis of Variance)은 한 개의 독립 변수(요인, Factor) 가 여러 그룹으로 나뉠 때, 각 그룹의 평균이 통계적으로 유의미한 차이가 있는지를 검정하는 방법입니다. 📌 주요 개념 🎯 적용 … Read more

카이제곱 검정(Chi-Square Test)

카이제곱 검정(Chi-Square Test)란? 카이제곱(χ²) 검정은 범주형 데이터(categorical data)에서 기대값과 관측값 간의 차이를 분석하는 통계적 검정 방법입니다. 주로 데이터가 특정 분포를 따르는지, 변수 간의 독립성이 있는지를 확인할 때 사용됩니다. 1. 카이제곱 … Read more

NumPy (Numerical Python)

NumPy 라이브러리 개요 NumPy (Numerical Python)는 파이썬에서 행렬이나 대규모 다차원 배열을 쉽게 처리하는 등 강력한 수치 계산을 지원하는 파이썬 라이브러리입니다. 다차원 배열 객체인 ndarray를 중심으로 다양한 수학적 연산을 수행할 수 … Read more