KoNLPy(Korean Natural Language Processing in Python)는 한국어 자연어 처리를 위한 파이썬 라이브러리입니다. 형태소 분석기(예: Mecab, Komoran, Kkma, Hannanum, Okt)를 지원하며, 한국어 텍스트를 분석하는 데 유용합니다.
KoNLPy는 pip으로 설치할 수 있습니다.
pip install konlpy 하지만 일부 형태소 분석기(Mecab 등)는 추가적인 설치 과정이 필요합니다.
from konlpy.tag import Okt
okt = Okt()
text = "KoNLPy를 이용한 한국어 자연어 처리 테스트입니다."
# 형태소 분석
print(okt.morphs(text)) # ['KoNLPy', '를', '이용한', '한국어', '자연어', '처리', '테스트', '입니다', '.']
# 품사 태깅
print(okt.pos(text))
# [('KoNLPy', 'Alpha'), ('를', 'Josa'), ('이용한', 'Verb'), ('한국어', 'Noun'), ('자연어', 'Noun'), ('처리', 'Noun'), ('테스트', 'Noun'), ('입니다', 'Adjective'), ('.', 'Punctuation')]
# 명사 추출
print(okt.nouns(text)) # ['한국어', '자연어', '처리', '테스트'] KoNLPy는 여러 형태소 분석기를 지원하며, 각각의 특성이 다릅니다.
| 분석기 | 특징 |
|---|---|
| Okt | 트위터에서 개발한 분석기, 신조어 및 인터넷 용어에 강함 |
| Mecab | 속도가 빠르고 정확도가 높음 (Linux, Mac에서 사용 가능) |
| Komoran | 대용량 데이터 처리에 적합 |
| Kkma | 문장 분석 기능이 강함 |
| Hannanum | 서울대학교에서 개발한 형태소 분석기 |
KoNLPy는 한국어 자연어 처리(NLP)를 다룰 때 매우 유용한 라이브러리로, 형태소 분석 및 텍스트 마이닝 작업에 널리 활용됩니다. 🚀
요양원 선택 전 반드시 확인해야 할 체크리스트를 공개합니다. 공식 평가 자료 조회법, 방문 시 확인…
공공기관 채용 비리의 실태와 피해 지원자의 대응법을 정리했습니다. 채용 비리 신고 방법, 공익신고자 보호제도, 취준생…
주식 손실을 세금 절약에 활용하는 합법적 방법을 공개합니다. 해외주식 손익통산, ISA 계좌 활용, 연금계좌 절세까지…
배달이 예상 시간보다 크게 늦으면 취소·환불을 요청할 수 있습니다. 배달앱별 지연 취소 방법과 잘못 배달됐을…
통신비 절약의 핵심은 요금제 최적화입니다. 내 데이터 사용량 확인법, 알뜰폰 전환 비교, 위약금 없이 요금제…