1 |
1
원시 언어 태그드 코퍼스와 목표 언어 태그드 코퍼스를 이용하여 원시 언어 및 목표 언어에 각각 공기하는 각 공기 어휘를 추출하고, 이들의 대역 관계를 대역어 사전에 매핑시켜 대역어 후보를 추출하는 어휘 정렬부와,
상기 추출된 대역어 후보에 대해 대역 관계 오류를 필터링하여 대표 대역어를 결정하는 오류 필터링부와,
상기 결정된 대표 대역어를 상기 대역어 사전에 반영하는 대역어 사전 반영부
를 포함하는 대역어 사전 특화 장치
|
2 |
2
제 1 항에 있어서,
상기 어휘 정렬부는,
상기 원시 언어 태그드 코퍼스에서 모호성 어휘를 추출하고, 상기 추출된 모호성 어휘에 대한 제 1 공기 어휘를 추출하는 제 1 공기 어휘 추출부와,
상기 추출된 제 1 공기 어휘에 대해 상호 정보를 통해 필터링하는 제 1 공기 어휘 필터링부와,
상기 원시 언어의 대역어들이 상기 목표 언어 태그드 코퍼스에 나타나면 이에 공기하는 제 2 공기 어휘를 추출하는 제 2 공기 어휘 추출부와,
상기 추출된 제 2 공기 어휘에 대해 상기 상호 정보를 통해 필터링하는 제 2 공기 어휘 필터링부와,
상기 필터링된 제 1 공기 어휘 및 제 2 공기 어휘에 대한 상기 대역 관계를 상기 대역어 사전에 매핑시키는 대역 관계 매핑부와,
상기 대역 관계 매핑부의 매핑 결과에 따라 원시 어휘 및 목표 어휘를 포함하는 상기 대역어 후보를 추출하는 대역어 후보 추출부
를 포함하는 대역어 사전 특화 장치
|
3 |
3
제 1 항 또는 제 2 항에 있어서,
상기 오류 필터링부는, 상기 대역어 후보에 대해 코퍼스 발생 빈도가 기 설정된 범위 내의 발생 빈도를 갖는 경우 상기 대역어 후보를 상기 대표 대역어로 결정하는 대역어 사전 특화 장치
|
4 |
4
제 3 항에 있어서,
상기 원시 언어 태그드 코퍼스는, 원시 언어 코퍼스를 형태소별로 태깅하여 획득되는 대역어 사전 특화 장치
|
5 |
5
제 3 항에 있어서,
상기 목표 언어 태그드 코퍼스는, 목표 언어 코퍼스를 형태소별로 태깅하여 획득되는 대역어 사전 특화 장치
|
6 |
6
원시 언어 태그드 코퍼스를 이용하여 원시 언어에 공기하는 제 1 공기 어휘를 추출하는 단계와,
목표 언어 태그드 코퍼스를 이용하여 목표 언어에 공기하는 제 2 공기 어휘를 추출하는 단계와,
상기 추출된 제 1 공기 어휘 및 제 2 공기 어휘의 대역 관계를 대역어 사전에 매핑시켜 대역어 후보를 추출하는 단계와,
상기 추출된 대역어 후보에 대해 대역 관계 오류를 필터링하여 대표 대역어를 결정하는 단계와,
상기 결정된 대표 대역어를 상기 대역어 사전에 반영하는 단계
를 포함하는 대역어 사전 특화 방법
|
7 |
7
제 6 항에 있어서,
상기 제 1 공기 어휘를 추출하는 단계는, 상기 원시 언어 태그드 코퍼스에서 모호성 어휘를 추출하고, 상기 추출된 모호성 어휘에 대한 상기 제 1 공기 어휘를 추출하는 대역어 사전 특화 방법
|
8 |
8
제 6 항에 있어서,
상기 제 2 공기 어휘를 추출하는 단계는, 상기 원시 언어의 대역어들이 상기 목표 언어 태그드 코퍼스에 나타나면 이에 공기하는 상기 제 2 공기 어휘를 추출하는 대역어 사전 특화 방법
|
9 |
9
제 6 항에 있어서,
상기 대표 대역어를 결정하는 단계는, 상기 대역어 후보에 대해 코퍼스 발생 빈도가 기 설정된 범위 내의 발생 빈도를 갖는 경우 상기 대역어 후보를 상기 대표 대역어로 결정하는 대역어 사전 특화 방법
|
10 |
10
제 6 항 내지 제 9 항 중 어느 한 항에 있어서,
상기 원시 언어 태그드 코퍼스는, 원시 언어 코퍼스를 형태소별로 태깅하여 획득되는 대역어 사전 특화 방법
|
11 |
11
제 6 항 내지 제 9 항 중 어느 한 항에 있어서,
상기 목표 언어 태그드 코퍼스는, 목표 언어 코퍼스를 형태소별로 태깅하여 획득되는 대역어 사전 특화 방법
|