1 |
1
양국어 병렬 말뭉치에서의 원언어에 대하여 구문분석을 실행하는 원언어 구문 분석부;상기 양국어 병렬 말뭉치로부터 구단위 정렬 테이블을 생성하는 단어 및 구단위 정렬부;구문분석 결과에 따라 상기 구단위 정렬 테이블에서 원언어 구단위 제약에 맞는 구만 추출한 후, 일반화 및 정렬 보정하여 패턴 후보를 생성하는 패턴 일반화 및 정렬 보정부;상기 패턴 후보에 대한 점수를 책정하여 신뢰도가 낮거나 서로 충돌 또는 중복되는 패턴 후보는 필터링하는 패턴 점수화 및 필터링부; 및 상기 필터링된 패턴 후보 중 시스템의 기존 패턴과 충돌 및 중복되지 않는 패턴 후보를 필요 패턴으로 선택하는 필요 패턴 출력부를 포함하며,상기 패턴 일반화 및 정렬 보정부는,정렬 오류를 고려하여 일부 정렬은 무시하고, 일부 정렬은 유보하고, 일부 정렬은 인정하여 일반화하여 처리하는 구단위 패턴 구축 장치
|
2 |
2
제 1 항에 있어서,상기 양국어 병렬 말뭉치는 원언어와 목적언어가 품사 태깅되고, 문장 단위로 정렬된 것을 특징으로 하는 구단위 패턴 구축 장치
|
3 |
3
삭제
|
4 |
4
제 1 항에 있어서,상기 패턴 일반화 및 정렬 보정부는,통계기반 구 단위 정렬에서 정렬 구에 포함되었으나, 단어 정렬에는 실패한 일부 단어를 품사 정보와 문맥 정보에 따라 원언어 명사에 규칙 기반으로 추가 정렬 보정하는 것을 특징으로 하는 구단위 패턴 구축 장치
|
5 |
5
제 1 항에 있어서,상기 패턴 일반화 및 정렬 보정부는,일반화 및 정렬 보정을 두 번 이상 반복 실행하는 것을 특징으로 하는 구단위 패턴 구축 장치
|
6 |
6
제 1 항에 있어서,상기 패턴 점수화 및 필터링부는,패턴의 내부 구성과 일반화된 논항 개수 및 동사 대역어 품사에 따라 패턴에 점수를 부여하는 것을 특징으로 하는 구단위 패턴 구축 장치
|
7 |
7
제 6 항에 있어서,상기 패턴 점수화 및 필터링부는,동일한 원어부를 가진 두 패턴이 동일한 목적어 용언을 가질 경우, 최고 점수를 받은 최적의 목적어부만 남기고, 일정 임계값 이하 점수를 받은 패턴은 필터링하는 것을 특징으로 하는 구단위 패턴 구축 장치
|
8 |
8
제 1 항에 있어서,상기 필요 패턴 출력부는,목적어 패턴부의 용언에 용언 마크를 추가하고, 주격이 결여된 패턴에는 주격을 추가하며, 어휘와 일반화 논항으로 구성된 패턴을 품사 레벨, 의미 레벨 및 어휘 레벨을 포함하는 세 개의 레벨로 생성하는 것을 특징으로 하는 구단위 패턴 구축 장치
|
9 |
9
제 8 항에 있어서,상기 필요 패턴 출력부는,충돌 패턴에 대해서는 하나의 최적 목적어 패턴부를 선택하고, 중복 패턴에 대해서는 상위 패턴과 동일한 목적어부를 가진 하위 패턴은 삭제한 후, 기존 패턴과의 비교를 통해 시스템에 없는 패턴만 선택하는 것을 특징으로 하는 구단위 패턴 구축 장치
|