KoNLPy(Korean Natural Language Processing in Python)는 한국어 자연어 처리를 위한 파이썬 라이브러리입니다. 형태소 분석기(예: Mecab, Komoran, Kkma, Hannanum, Okt)를 지원하며, 한국어 텍스트를 분석하는 데 유용합니다.
KoNLPy는 pip
으로 설치할 수 있습니다.
pip install konlpy
하지만 일부 형태소 분석기(Mecab 등)는 추가적인 설치 과정이 필요합니다.
from konlpy.tag import Okt
okt = Okt()
text = "KoNLPy를 이용한 한국어 자연어 처리 테스트입니다."
# 형태소 분석
print(okt.morphs(text)) # ['KoNLPy', '를', '이용한', '한국어', '자연어', '처리', '테스트', '입니다', '.']
# 품사 태깅
print(okt.pos(text))
# [('KoNLPy', 'Alpha'), ('를', 'Josa'), ('이용한', 'Verb'), ('한국어', 'Noun'), ('자연어', 'Noun'), ('처리', 'Noun'), ('테스트', 'Noun'), ('입니다', 'Adjective'), ('.', 'Punctuation')]
# 명사 추출
print(okt.nouns(text)) # ['한국어', '자연어', '처리', '테스트']
KoNLPy는 여러 형태소 분석기를 지원하며, 각각의 특성이 다릅니다.
분석기 | 특징 |
---|---|
Okt | 트위터에서 개발한 분석기, 신조어 및 인터넷 용어에 강함 |
Mecab | 속도가 빠르고 정확도가 높음 (Linux, Mac에서 사용 가능) |
Komoran | 대용량 데이터 처리에 적합 |
Kkma | 문장 분석 기능이 강함 |
Hannanum | 서울대학교에서 개발한 형태소 분석기 |
KoNLPy는 한국어 자연어 처리(NLP)를 다룰 때 매우 유용한 라이브러리로, 형태소 분석 및 텍스트 마이닝 작업에 널리 활용됩니다. 🚀
윈도우 운영체제의 노트북에서는 iPhone 유선 테더링이 잘 안되는 경우가 많습니다. 보통 iPhone의 드라이버가 설치가 안되있어서인…
안녕하세요, 혹시 이런 생각해 본 적 없으신가요? "내가 투자한 회사는 누가 감시하고, 어떻게 운영될까?" 오늘은…
1. Gemini CLI란 무엇인가요? Gemini CLI는 터미널 환경에서 직접 Gemini 모델과 상호작용할 수 있도록 만들어진…
과적합은 머신러닝에서 학습용데이터를 과하게 학습하여, 실제데이터를 예측하지 못하는 현상을 말합니다. 인공지능(AI)의 학습 방법은 우리가 시험공부를…