1 |
1
제 1 언어 문장 및 번역 전문가에 의해 번역된 상기 제 1 언어 문장의 번역문인 제 2 언어 문장으로 구성된 도메인별 병렬 말뭉치를 다수의 클러스터 서버에 분산하는 말뭉치 분산기;
상기 분산된 각 병렬 말뭉치의 상기 제 1 언어 문장에 출현하는 표제어를 추출하고, 상기 추출된 표제어에 검증 대상인 번역 지식을 병합한 다수의 램마 인덱스된 병렬 말뭉치를 생성하여 상기 다수의 클러스터 서버에 다시 분산하는 램마 인덱서;
상기 램마 인덱스된 병렬 말뭉치를 기존에 구축된 번역 지식을 이용하여 자동 번역하는 기준 번역기;
상기 램마 인덱스된 병렬 말뭉치를 상기 검증 대상인 번역 지식을 이용하여 자동 번역하는 평가 번역기; 및
상기 기준 번역기의 기준 번역 결과와 상기 평가 번역기의 평가 번역 결과를 상기 제 2 언어 문장과 각각 비교하고, 비교 결과에 근거하여 상기 기준 번역 결과의 번역 성능과 상기 평가 번역 결과의 번역 성능의 차이를 비교하는 자동 평가부
를 포함하는 것인 도메인에 특화된 번역 지식 검증 장치
|
2 |
2
제1항에 있어서,
상기 자동 평가부는 상기 번역 성능의 차이가 존재하는 문장만을 평가하는 것인 도메인에 특화된 번역 지식 검증 장치
|
3 |
3
제1항에 있어서,
상기 자동 평가부는 상기 비교 결과에 근거하여 상기 검증 대상인 번역 지식을 성능 향상 엔트리과 성능 하락 엔트리로 분류하는 것인 도메인에 특화된 번역 지식 검증 장치
|
4 |
4
제1항에 있어서,
상기 말뭉치 분산기는 상기 도메인별 병렬 말뭉치를 상기 다수의 클러스터 서버에 균일하게 분산시키는 것인 도메인에 특화된 번역 지식 검증 장치
|
5 |
5
제1항에 있어서, 상기 램마 인덱서(Lemma Indexer)는,
상기 다수의 클러스터 서버별로 분산된 각 병렬 말뭉치의 상기 제 1 언어 문장에서 표제어를 추출하는 램마 추출기
상기 검증 대상인 번역 지식과 추출된 상기 표제어가 병합된 다수의 병합된 말뭉치를 생성하는 평가 엔트리 병합기;
각 병합된 말뭉치를 표제어별로 다시 정렬하여 램마 목록을 생성하는 램마 목록 생성기;
상기 정렬된 램마 목록에서 동일한 표제어를 태그로 분류한 다수의 태깅된 램마 말뭉치를 각각 생성하는 다수의 램마 태거(lemma tagger);
상기 다수의 태깅된 램마 말뭉치를 상기 태그를 기준으로 상기 다수의 클러스터 서버로 분산시키는 태깅된 말뭉치 분산기; 및
상기 분산된 태깅된 램마 말뭉치들에서 태그를 제거한 상기 다수의 램마 인덱스된 병렬 말뭉치를 생성하는 다수의 태그 제거기
를 포함하는 것인 도메인에 특화된 번역 지식 검증 장치
|
6 |
6
제 1 언어 문장 및 번역 전문가에 의해 번역된 상기 제 1 언어 문장의 번역문인 제 2 언어 문장으로 구성된 도메인별 병렬 말뭉치를 다수의 클러스터 서버에 분산하는 단계;
상기 분산된 각 병렬 말뭉치의 상기 제 1 언어 문장에 출현하는 표제어를 추출하고, 상기 추출된 표제어에 검증 대상인 번역 지식을 병합한 다수의 램마 인덱스된 병렬 말뭉치를 생성하여 상기 다수의 클러스터 서버에 다시 분산하는 단계;
상기 램마 인덱스된 병렬 말뭉치를 기존에 구축된 번역 지식을 이용하여 자동 번역하는 단계;
상기 램마 인덱스된 병렬 말뭉치를 상기 검증 대상인 번역 지식을 이용하여 자동 번역하는 단계 및
상기 기준 번역기의 기준 번역 결과와 상기 평가 번역기의 평가 번역 결과를 상기 제 2 언어 문장과 각각 비교하고, 비교 결과에 근거하여 상기 기준 번역 결과의 번역 성능과 상기 평가 번역 결과의 번역 성능의 차이를 비교하는 단계
를 포함하는 것인 도메인에 특화된 번역 지식 검증 방법
|
7 |
7
제6항에 있어서, 상기 번역 성능의 차이를 비교하는 단계는,
상기 비교 결과에 근거하여 상기 검증 대상인 번역 지식을 성능 향상 엔트리 및 성능 하락 엔트리로 자동 분류하는 단계를 더 포함하는 것인 도메인에 특화된 번역 지식 검증 방법
|
8 |
8
제6항에 있어서, 다수의 클러스터 서버에 분산하는 단계는,
상기 도메인별 병렬 말뭉치를 상기 다수의 클러스터 서버에 균일하게 분산시키는 것인 도메인에 특화된 번역 지식 검증 방법
|
9 |
9
제6항에 있어서, 상기 다수의 클러스터 서버에 다시 분산하는 단계는,
상기 다수의 클러스터 서버별로 분산된 각 병렬 말뭉치의 상기 제 1 언어 문장에서 표제어를 추출하는 단계;
상기 검증 대상인 번역 지식과 추출된 상기 표제어가 병합된 다수의 병합된 말뭉치를 생성하는 단계;
각 병합된 말뭉치를 표제어별로 다시 정렬하여 램마 목록을 생성하는 단계;
상기 정렬된 램마 목록에서 동일한 표제어를 태그로 분류한 다수의 태깅된 램마 말뭉치를 각각 생성하는 단계;
상기 다수의 태깅된 램마 말뭉치를 상기 태그를 기준으로 상기 다수의 클러스터 서버로 분산시키는 단계; 및
상기 분산된 태깅된 램마 말뭉치들에서 태그를 제거한 상기 다수의 램마 인덱스된 병렬 말뭉치를 생성하는 단계
를 포함하는 것인 도메인에 특화된 번역 지식 검증 방법
|