1 |
1
번역 지식 구축 장치에서 번역 지식을 구축하는 방법에 있어서,
소스언어 문장과 상기 소스언어 문장의 번역 문장에 대응하는 타겟언어 문장을 입력 받는 단계;
상기 소스언어 문장 및 상기 타겟언어 문장을 통사, 구문 정보가 표현된 형태로 변환하는 단계;
상기 변환된 소스언어 문장과 상기 변환된 타겟언어 문장의 단어 정렬과 구문 정렬을 수행하는 단계; 및
상기 단어 정렬 결과와 상기 구문 정렬 결과에서 의존관계정보를 이용하여 이중언어 용언 하위범주 번역 지식을 추출하는 단계를 포함하는 번역 지식 구축 방법
|
2 |
2
제1항에 있어서
상기 변환된 소스언어 문장과 상기 변환된 타겟언어 문장을 구성하는 형태소를 형태소 고유 식별 번호로 대체하는 단계를 더 포함하며
상기 수행하는 단계는 상기 형태소 고유 식별 번호로 대체된 소스언어 문장과 타겟언어 문장의 단어 정렬과 구문 정렬을 수행하는 번역 지식 구축 방법
|
3 |
3
제1항에 있어서
상기 단어 정렬 결과와 상기 구문 정렬 결과에서 단어 구문 번역 지식을 추출하는 단계; 및
상기 단어 정렬 결과와 상기 구문 정렬 결과에서 이중언어 문형 번역 지식을 추출하는 단계를 더 포함하는 번역 지식 구축 방법
|
4 |
4
제3항에 있어서,
상기 이중언어 문형 번역 지식을 추출하는 단계는,
상기 단어 정렬 결과와 상기 구문 정렬 결과에서 소스언어의 각 단어 및 구문에 대한 타겟 언어의 단어 및 구문 생산성을 통계적으로 분석하는 단계: 및
소스언어 문장과 타켓언어 문장 쌍 중에서 평균 분포 이상의 생산성을 보인 단어 및 구문을 포함하는 소스언어 문장과 타겟언어 문장 쌍으로부터 상기 이중언어 문형 번역 지식을 추출하여 저장하는 단계를 포함하는 번역 지식 구축 방법
|
5 |
5
제1항에 있어서,
입력되는 상기 소스언어 문장과 상기 타겟언어 문장은 형태소 분석, 품사 태깅 및 구문 분석이 되어 있는 번역지식 구축 방법
|
6 |
6
제1항에 있어서,
상기 변환하는 단계는,
상기 소스언어 문장의 각 형태소에 형태소의 원형, 형태소의 품사, 기본구 내에서의 형태소의 상대적 위치 정보 및 구문 정보를 부착하는 단계; 및
상기 타겟언어 문장의 각 형태소에 형태소의 원형, 품사, 기본구 내에서의 상대적 위치 정보 및 구문 정보를 부착하는 단계를 포함하는 번역 지식 구축 방법
|
7 |
7
제1항에 있어서,
상기 정렬을 수행하는 단계는,
상기 변환된 소스언어 문장과 상기 변환된 타겟언어 문장을 형태소의 표층형, 형태소의 원형, 형태소의 품사 중 적어도 하나를 사용하여 문장을 재구성한 복수의 재구성된 문장 쌍을 생성하는 단계;
상기 복수의 재구성된 문장 쌍 각각에 대해 소스언어 문장과 타겟언어 문장에서 서로 대응되는 단어를 찾아내어 복수의 단어 정렬 결과를 출력하는 단계;
기 보유하고 있던 대역 사전을 활용하여 상기 복수의 단어 정렬 결과를 보정하는 단계;
상기 복수의 단어 정렬 결과들에 대해 보정된 단어 정렬 결과를 제외하고 교집합을 취하여 동시에 일치하는 단어 정렬을 올바른 단어 정렬 결과로 결정하는 후처리 단계; 및
상기 올바른 단어 정렬 결과와 소스언어의 의존관계 정보를 이용하여 구문 정렬을 수행하는 단계를 포함하는 번역 지식 구축 방법
|
8 |
8
제1항에 있어서,
상기 이중언어 용언 하위범주 번역 지식을 추출하는 단계는,
상기 소스언어 문장 내에서의 의존관계 정보를 이용하여 문장의 중심어인 용언을 찾는 단계:
상기 용언과 의존관계에 있는 단어와 구문을 추적하여, 상기 소스언어 문장 에서 상기 용언의 하위범주 관계 틀을 형성하는 단계:
상기 타겟언어 문장 내에서 상기 소스언어 문장의 각 단어 및 구문에 대한 단어 및 구문 대역을 찾는 단계:
상기 용언의 하위범주 관계 틀에 상기 단어 및 구문 대역을 연결하여 상기 용언 하위범주 번역 지식을 추출하는 단계를 포함하는 번역 지식 구축 방법
|
9 |
9
제8항에 있어서,
상기 단어 및 구문 대역은 자질 구조 형태로 표현되어 있는 번역 지식 구축 방법
|
10 |
10
소스언어 문장과 상기 소스언어 문장의 번역 문장에 대응하는 타겟언어 문장을 입력 받아 상기 소스언어 문장 및 상기 타겟언어 문장의 각 형태소에 원형, 품사, 기본구 내에서의 상대적 위치 정보 및 구문정보를 부착하여 상기 소스언어 문장 및 상기 타겟언어 문장을 변환하는 소스언어 및 타겟언어 문장 변환기;
기 보유 대역사전과 자율 학습 알고리즘을 적용하여 단어와 구문을 정렬하는 단어 구문 정렬 수단; 및
상기 단어 구문 정렬 수단의 단어 구문 정렬 결과에 기반하여 단어 구문 번역 지식, 이중언어 용언 하위범주 번역 지식, 이중언어 문형 번역 지식을 획득하는 번역 지식 획득 수단을 포함하는 번역 지식 구축 장치
|
11 |
11
제10항에 있어서,
입력되는 상기 소스언어 문장과 상기 타겟언어 문장은 형태소 분석, 품사 태깅 및 구문 분석이 되어 있는 번역지식 구축 장치
|
12 |
12
제10항에 있어서,
상기 변환한 소스언어 문장과 상기 변환된 타겟언어 문장을 구성하는 형태소를 형태소 고유 식별 번호로 대체하는 이중언어 문장 맵 생성기를 더 포함하는 번역 지식 구축 장치
|
13 |
13
제10항에 있어서,
상기 단어 구문 정렬 수단은,
상기 변환한 소스언어 문장과 상기 변환된 타겟언어 문장을 형태소의 표층형, 원형, 품사 중 적어도 하나를 사용하여 문장을 재구성한 복수의 재구성된 문장 쌍을 생성한 후, 상기 복수의 재구성된 문장 쌍 각각에 대해 소스언어 문장과 타겟언어 문장에서 서로 대응되는 단어를 찾아내어 복수의 단어 정렬 결과를 출력하는 단어 정렬기;
기 보유 대역 사전을 이용하여 상기 복수의 단어 정렬 결과의 오류를 보정하고, 상기 복수의 단어 정렬 결과에 대해 보정된 단어 정렬 결과를 제외하고 교집합을 취하여 동시에 일치하는 단어 정렬을 올바른 단어 정렬 결과로 결정하는 단어 정렬 후처리기; 및
상기 올바른 단어 정렬 결과와 구문 의존 관계 정보를 이용하여 구문 정렬을 수행하는 구문 정렬기를 포함하는 번역 지식 구축 장치,
|
14 |
14
제10항에 있어서,
상기 번역 지식 획득 수단은,
상기 단어 구문 정렬 수단의 단어 구문 정렬 결과를 입력 받아 단어와 구문들의 번역 정보를 추출하여 저장하는 단어 구문 번역 지식 추출기;
상기 소스언어 문장 내에서의 의존관계 정보를 이용하여 문장의 중심어인 용언을 찾고, 상기 용언과 의존관계에 있는 단어와 구문을 추적하여, 상기 소스언어 문장에서 용언의 하위범주 관계 틀을 형성한 후, 상기 타겟언어 문장 내에서 상기 소스언어 문장의 각 단어 및 구문에 대한 단어 및 구문 대역을 찾아 상기 용언의 하위범주 관계 틀에 상기 단어 및 구문 대역을 연결하여 용언 하위범주 번역 지식을 추출하는 이중언어 용언 하위범주 번역 지식 추출기; 및
관용적, 숙어적 표현을 사용한 문장을 대상으로 번역 패턴을 추출하여 저장하는 이중언어 문형 번역 지식 추출기를 포함하는 번역 지식 구축 장치
|