1 |
1
품사 태깅을 수행할 문장을 입력받는 문장 입력부;어절별로 미리 형태소 분석된 정보가 포함되어 있는 어절 전처리 사전과, 형태소 사전과, 형태소들간의 접속가능 여부에 대한 정보인 품사 접속 정보와, 어절내의 형태소 결합 오류 제거를 위한 어절내 형태소 결합 오류 리스트와, 품사 트라이그램(trigram) 정보와, 어절간 형태소 결합 오류 제거를 위한 어절간 형태소 결합 오류 리스트가 저장되어 있는 데이터 저장부;상기 문장 입력부를 통해 입력받은 문장을 어절로 분리하여 분리된 어절이 상기 어절 전처리 사전에 존재하는지를 확인하여 형태소 해석을 수행한 후, 상기 형태소 해석 결과에 대하여 상기 품사 접속 정보를 이용하여 형태소들간의 결합이 가능한가를 확인하고, 상기 어절내 형태소 결합 오류 리스트를 이용하여 상기 형태소 해석 결과에서 오류를 제거하는 형태소 해석부; 및상기 품사 트라이그램 정보를 이용하여 상기 형태소 해석 결과중에서 최적으로 판단되는 형태소 해석 결과를 선택하여 품사 태깅하고, 상기 어절간 형태소 결합 오류 리스트를 이용하여 상기 품사 태깅 결과에서 오류를 제거하는 품사 태깅부를 포함하는 것을 특징으로 하는 품사 태깅 장치
|
2 |
2
제 1항에 있어서, 상기 품사 태깅부의 품사 태깅 결과를 출력 장치로 출력하는 품사 태깅 결과 출력부를 더 포함하는 것을 특징으로 하는 품사 태깅 장치
|
3 |
3
제 1항에 있어서, 상기 형태소 해석부는,상기 분리된 어절이 상기 어절 전처리 사전에 존재하지 않는 것으로 확인되면, 해당 어절을 음절로 분리한 다음 그 음절이 상기 형태소 사전에 존재하는지, 또는 음절과 다른 음절과의 조합이 상기 형태소 사전에 존재하는지를 확인하여 형태소 해석을 수행하는 것을 특징으로 하는 품사 태깅 장치
|
4 |
4
제 1항에 있어서, 상기 품사 태깅부는,품사 태깅시 상기 입력 문장의 최초 어절 내부에서는 상기 형태소 해석 결과를 모두 사용하여 품사를 결정하고, 그 다음 어절은 상기 품사 트라이그램 정보를 이용하여 이전 어절의 품사 통계 정보와 트라이그램값을 기초로 품사를 결정하는 것을 특징으로 하는 품사 태깅 장치
|
5 |
5
(a) 품사 태깅을 수행할 문장을 입력받는 단계;(b) 상기 입력받은 문장을 어절로 분리하여, 상기 분리된 어절이 어절별로 미리 형태소 분석된 정보가 기록되어 있는 어절 전처리 사전에 존재하는지를 확인하여 형태소 해석을 수행하는 단계;(c) 상기 형태소 해석 결과에 대하여 품사 접속 정보를 이용하여 형태소들간의 결합이 가능한가를 확인하는 단계;(d) 어절내 형태소 결합 오류 리스트를 이용하여 상기 형태소 해석 결과에서 오류를 제거하는 단계;(e) 품사 트라이그램 정보를 이용하여 상기 형태소 해석 결과중에서 최적으로 판단되는 형태소 해석 결과를 선택하여 품사 태깅하는 단계; 및(f) 어절간 형태소 결합 오류 리스트를 이용하여 상기 품사 태깅 결과에서 오류를 제거하는 단계를 포함하는 것을 특징으로 하는 품사 태깅 방법
|
6 |
6
제 5항에 있어서, (g) 상기 품사 태깅 결과를 출력 장치로 출력하는 단계를 더 포함하는 것을 특징으로 하는 품사 태깅 방법
|
7 |
7
제 5항에 있어서, 상기 (a) 단계는,텍스트 파일 형식의 문장을 입력받거나 또는 키보드를 통해 사용자로부터 문장을 직접 입력받는 단계를 포함하는 것을 특징으로 하는 품사 태깅 방법
|
8 |
8
제 5항에 있어서, 상기 (b) 단계는,상기 분리된 어절이 상기 어절 전처리 사전에 존재하지 않는 것으로 확인된 경우, 해당 어절을 음절로 분리한 다음 그 음절이 형태소 사전에 존재하는지, 또는 음절과 다른 음절과의 조합이 형태소 사전에 존재하는지를 확인하여 형태소 해석을 수행하는 단계를 포함하는 것을 특징으로 하는 품사 태깅 방법
|
9 |
9
제 5항에 있어서, 상기 (e) 단계는,품사 태깅시 상기 입력 문장의 최초 어절 내부에서는 상기 형태소 해석 결과를 모두 사용하여 품사를 결정하고, 그 다음 어절은 상기 품사 트라이그램 정보를 이용하여 이전 어절의 품사 통계 정보와 트라이그램값을 기초로 품사를 결정하는 단계를 포함하는 것을 특징으로 하는 품사 태깅 방법
|