KoNLPy(Korean Natural Language Processing in Python)는 한국어 자연어 처리를 위한 파이썬 라이브러리입니다. 형태소 분석기(예: Mecab, Komoran, Kkma, Hannanum, Okt)를 지원하며, 한국어 텍스트를 분석하는 데 유용합니다.
KoNLPy는 pip으로 설치할 수 있습니다.
pip install konlpy 하지만 일부 형태소 분석기(Mecab 등)는 추가적인 설치 과정이 필요합니다.
from konlpy.tag import Okt
okt = Okt()
text = "KoNLPy를 이용한 한국어 자연어 처리 테스트입니다."
# 형태소 분석
print(okt.morphs(text)) # ['KoNLPy', '를', '이용한', '한국어', '자연어', '처리', '테스트', '입니다', '.']
# 품사 태깅
print(okt.pos(text))
# [('KoNLPy', 'Alpha'), ('를', 'Josa'), ('이용한', 'Verb'), ('한국어', 'Noun'), ('자연어', 'Noun'), ('처리', 'Noun'), ('테스트', 'Noun'), ('입니다', 'Adjective'), ('.', 'Punctuation')]
# 명사 추출
print(okt.nouns(text)) # ['한국어', '자연어', '처리', '테스트'] KoNLPy는 여러 형태소 분석기를 지원하며, 각각의 특성이 다릅니다.
| 분석기 | 특징 |
|---|---|
| Okt | 트위터에서 개발한 분석기, 신조어 및 인터넷 용어에 강함 |
| Mecab | 속도가 빠르고 정확도가 높음 (Linux, Mac에서 사용 가능) |
| Komoran | 대용량 데이터 처리에 적합 |
| Kkma | 문장 분석 기능이 강함 |
| Hannanum | 서울대학교에서 개발한 형태소 분석기 |
KoNLPy는 한국어 자연어 처리(NLP)를 다룰 때 매우 유용한 라이브러리로, 형태소 분석 및 텍스트 마이닝 작업에 널리 활용됩니다. 🚀
코스피 8% 폭락, 서킷브레이커 발동, SK텔레콤 Claude AI 차단까지. 한국의 AI 레버리지 버블이 단 하루…
SNS 사진 1장으로 30초 만에 딥페이크 영상이 완성됩니다. 당신의 얼굴이 이미 범죄에 악용되고 있을 수…
SNS 사진 1장으로 30초 만에 딥페이크 영상이 완성됩니다. 당신의 얼굴이 이미 범죄에 악용되고 있을 수…
달러/원 환율이 급등하는 이유와 실생활 영향을 정리했습니다. 지금 당장 활용할 수 있는 환전·투자 대응 전략까지…
미래에셋·미래에셋벤처투자·미래에셋생명이 동반 급등한 이유는 스페이스X 상장 기대감입니다. 세 회사가 스페이스X와 어떻게 연결되어 있는지 상세히 분석했습니다.
스페이스X 상장이 계속 미뤄지는 진짜 이유를 파헤쳤습니다. 화성 계획, 스타링크 분리, 국방 계약... 머스크가 절대…