본문 바로가기
6_ 그 밖에 아무거나

자연어 처리..

by 준환이형님_ 2011. 1. 10.
새로운 과제에 포함 될 기술. 임의의 문자열에서 주어, 동사, 명사 요런걸 분리하기 위해 자연어 처리를 찾던 중. 예상대로 "루씬"이라는 잘 만들어진 공개 소스 라이브러리 같은 것이 있다는 걸 알았냈다. 아아 살았다. 애당초 자연어처리를 내 손으로 짠다는 무모한 생각은 처음부터 하진 않았어. 이것은 다행인지 불행인지 자바로 만들어져 있으며 본래, 영어가 아닌 한글 형태소 분석은 지원되지 않았으나 고맙게도 어떤 클럽(http://cafe.naver.com/korlucene.cafe)에서 라이브러리를 개발 해 주고 있었다. 근데 문제는 임폴트 자체가 어렵다는 점.  며칠째 설명을 봐도 뭐가 쉽지가 않다..

어쩌나.. ㅠ 나는 그냥 std::cout 처럼 편하게 좀 썼으면 싶은데요..