1 |
1
텍스트 코퍼스와 그 텍스트에 대한 형태소 품사 태깅된 DB를 이용하여 형태소 및 키워드 간에 순서정보를 가진 상호 정보를 구축하는 상호 정보 구축부와,
상기 구축된 상호 정보와, 형태소 해석을 위한 형태소 사전과 품사 접속 정보 및 품사 태깅을 위한 품사 n-gram 정보가 저장되어 있는 데이터 저장부와,
품사 태깅을 수행할 문장을 입력 받는 문장 입력부와,
상기 입력 받은 문장을 상기 데이터 저장부의 형태소 사전과 품사 접속 정보를 이용하여 분석 가능한 형태소들의 리스트를 출력하는 형태소 해석부와,
상기 형태소들의 리스트에 대해 형태소 및 키워드 간의 상호 정보를 구하는 상호 정보 계산부와,
상기 데이터 저장부의 품사 n-gram 정보를 이용하여 상기 형태소들의 리스트에 대해 품사 천이 확률값을 계산하는 n-gram 계산부와,
상기 상호 정보 계산부의 결과와 n-gram 계산부의 결과를 토대로 판단되는 형태소 해석 결과를 선택하는 품사 태깅부
를 포함하는 상호 정보를 이용한 형태소 품사 태깅 장치
|
2 |
2
제 1항에 있어서,
상기 품사 태깅 장치는,
상기 품사 태깅 결과를 출력하는 품사 태깅 결과 출력부를 더 포함하는 것을 특징으로 하는 상호 정보를 이용한 형태소 품사 태깅 장치
|
3 |
3
제 1항에 있어서,
상기 상호 정보 구축부는,
상기 텍스트 코퍼스에 대해 형태소 해석을 한 리스트들을 출력하여, 출력된 형태소 리스트들에 대해서 인접한 형태소들에 대한 리스트를 추출하고,
상기 형태소 리스트들에서 키워드들을 찾아, 키워드와 다음 키워드의 형태소에 대해서도 리스트를 추출하고,
각각의 추출된 리스트를 합하여 상기 형태소 품사 태깅된 DB의 빈도를 토대로 상기 상호 정보를 구축하는 것을 특징으로 하는 상호 정보를 이용한 형태소 품사 태깅 장치
|
4 |
4
제 3항에 있어서,
상기 상호 정보는,
단어 x와 단어 y가 같이 나올 확률에 단어 x와 단어 y가 독립으로 나올 확률로 나눈 것으로서, 상기 단어 x와 단어 y가 같이 나올 확률은 단어 x와 단어 y가 순차적으로 같이 나오는 경우인 것을 특징으로 하는 상호 정보를 이용한 형태소 품사 태깅 장치
|
5 |
5
제 1항에 있어서,
상기 상호 정보 계산부는,
상기 형태소들의 리스트에 대해 인접한 형태소 간의 상호 정보를 계산하고,
상기 형태소들의 리스트에 대해 인접 키워드 간의 상호 정보를 계산하
는 것을 특징으로 하는 상호 정보를 이용한 형태소 품사 태깅 장치
|
6 |
6
텍스트 코퍼스와 그 텍스트에 대한 형태소 품사 태깅된 DB를 이용하여 형태소 및 키워드 간에 순서정보를 가진 상호 정보를 구축하는 과정과,
품사 태깅을 수행할 문장을 입력 받는 과정과,
상기 입력 받은 문장을 상기 구축된 상호 정보와, 형태소 해석을 위한 형태소 사전과 품사 접속 정보 및 품사 태깅을 위한 품사 n-gram 정보가 저장되어 있는 데이터 저장부의 형태소 사전과 품사 접속 정보를 이용하여 분석 가능한 형태소들의 리스트를 출력하는 과정과,
상기 형태소들의 리스트에 대해 형태소 및 키워드 간의 상호 정보를 구하는 과정과,
상기 데이터 저장부의 품사 n-gram 정보를 이용하여 상기 형태소들의 리스트에 대해 품사 천이 확률값을 계산하는 과정과,
상기 구해진 상호 정보와 상기 계산된 품사 천이 확률값을 토대로 판단되는 형태소 해석 결과를 선택하는 과정
을 포함하는 상호 정보를 이용한 형태소 품사 태깅 방법
|
7 |
7
제 6항에 있어서,
상기 품사 태깅 방법은,
상기 품사 태깅 결과를 출력 장치로 출력하는 과정
을 더 포함하는 것을 특징으로 하는 상호 정보를 이용한 형태소 품사 태깅 방법
|
8 |
8
제 6항에 있어서,
상기 상호 정보의 구축 과정은,
상기 텍스트 코퍼스에 대해 형태소 해석을 한 리스트들을 출력하여, 출력된 형태소 리스트들에 대해서 인접한 형태소들에 대한 리스트를 추출하는 과정과,
상기 형태소 리스트들에서 키워드들을 찾아, 키워드와 다음 키워드의 형태소에 대해서도 리스트를 추출하는 과정과,
각각의 추출된 리스트를 합하여 상기 형태소 품사 태깅된 DB의 빈도 정보를 통해 상기 상호 정보를 구축하는 과정
을 포함하는 것을 특징으로 하는 상호 정보를 이용한 형태소 품사 태깅 방법
|
9 |
9
제 8항에 있어서,
상기 상호 정보는,
단어 x와 단어 y가 같이 나올 확률에 단어 x와 단어 y가 독립으로 나올 확률로 나눈 것으로서, 상기 단어 x와 단어 y가 같이 나올 확률은 단어 x와 단어 y가 순차적으로 같이 나오는 경우인 것을 특징으로 하는 상호 정보를 이용한 형태소 품사 태깅 방법
|
10 |
10
제 6항에 있어서,
상기 형태소 간의 상호 정보를 구하는 과정은,
상기 형태소들의 리스트에 대해 인접한 형태소 간의 상호 정보를 계산하는 과정과,
상기 형태소들의 리스트에 대해 인접 키워드 간의 상호 정보를 계산하는 과정
을 포함하는 것을 특징으로 하는 상호 정보를 이용한 형태소 품사 태깅 방법
|