1 |
1
통계 기반의 기계 번역을 수행하는 통계 기반 기계 번역(Statistical Machine Translation) 시스템에 있어서,기계 번역의 전처리 과정으로, 번역 대상의 제1 원문을 입력받아서 어순 조정을 명시한 계층 구조(Reordering Tree)를 사용하여 어순 조정된 제2 원문을 생성하여 출력하는 어순 조정부; 및상기 어순 조정부에서 출력되는 제2 원문에 대한 통계 기반의 기계 번역을 수행하여 상기 제1 원문에 대응되는 번역문을 생성하여 출력하는 통계 기반 기계 번역부를 포함하고,상기 어순 조정을 명시한 계층 구조는,상기 제1 원문의 단어 집합의 순열을 나타내는 복수의 노드; 및상기 복수의 노드간 부모 및 자식간의 관계를 나타내는 간선으로 이루어지며,상기 계층 구조에는 두 자식의 어순이 유지(straight)되거나 반전(inverted)되는 것이 명시되어 있는 것을 특징으로 하는 통계 기반 기계 번역 시스템
|
2 |
2
제1항에 있어서,상기 어순 조정부는,어순 조정을 명시한 계층 구조내 자질을 추출하기 위한 메타 정보를 포함하는 판별 모델(Discriminative Model); 및상기 제1 원문을 입력받아서 상기 판별 모델을 사용하여 상기 제1 원문에 대한 어순을 분석하여 어순 조정을 명시한 계층 구조를 생성하고, 생성되는 상기 어순 조정을 명시한 계층 구조를 통해 상기 제1 원문을 상기 제2 원문으로 어순 조정하여 상기 통계 기반 기계 번역부로 출력하는 어순 조정 분석기를 포함하는 통계 기반 기계 번역 시스템
|
3 |
3
제2항에 있어서,상기 통계 기반 기계 번역부는,가능한 원문의 언어에 대응하는 번역문 언어 쌍들의 개연성(probability)을 제공하는 모델인 번역 모델; 단어 시퀀스의 개연성(probability)을 제공하는 모델인 언어 모델; 및 상기 번역 모델과 상기 언어 모델을 사용하여 상기 어순 조정부로부터 출력되는 상기 제2 원문에 대한 통계 기반의 기계 번역을 수행하여 상기 번역문을 생성하여 출력하는 기계 번역부를 포함하는 통계 기반 기계 번역 시스템
|
4 |
4
삭제
|
5 |
5
제3항에 있어서,상기 두 자식의 어순이 유지되는 것을 나타내기 위해 상기 간선을 점선으로 표시하거나 또는 상기 두 자식의 부모 노드에 어순이 유지됨(straight)을 나타내는 기호(ST)를 표시하는 것을 특징으로 하는 통계 기반 기계 번역 시스템
|
6 |
6
제5항에 있어서,상기 두 자식의 어순이 반전되는 것을 나타내기 위해 상기 간선을 실선으로 표시하거나 또는 상기 두 자식의 부모 노드에 어순이 반전됨(inverted)을 나타내는 기호(IV)를 표시하는 것을 특징으로 하는 통계 기반 기계 번역 시스템
|
7 |
7
제6항에 있어서,상기 판별 모델은,복수의 단어 또는 문장에 대해 어순 조정을 위한 분석에 필요한 자질 및 가중치를 포함하고,상기 자질은 어순이 유지됨 또는 어순이 반전됨을 나타내는 표시를 포함하고 있는것을 특징으로 하는 통계 기반 기계 번역 시스템
|
8 |
8
제7항에 있어서,상기 판별 모델은 다수의 원문과 이에 대응되어 번역된 다수의 번역문을 포함하는 병렬 말뭉치를 이용한 학습을 통해 판별 모델 생성 장치가 생성하는 것을 특징으로 하는 통계 기반 기계 번역 시스템
|
9 |
9
제8항에 있어서,상기 판별 모델 생성 장치가,원문과 원문이 번역된 번역문을 다수 포함하고 있는 병렬 말뭉치에서 상기 원문과 상기 번역문에 대해 번역 전후 문장의 어순 조정을 나타내는 순열을 파악하기 위한 단어 정렬을 수행하는 단어 정렬부;상기 단어 정렬부를 통해 단어 정렬된 자료에 대해 어순 조정을 명시한 계층 구조에 적용될 자질을 추출하는 자질 추출부;상기 자질 추출부에 의해 추출된 자질에 대한 가중치를 설정하는 가중치 설정부; 및상기 단어 정렬부, 상기 자질 추출부 및 상기 가중치 설정부를 제어하여 상기 병렬 말뭉치에 기반하여 어순 조정을 명시한 계층 구조에 적용될 판별 모델을 학습하여 생성하는 학습 제어부를 포함하는 것을 특징으로 하는 통계 기반 기계 번역 시스템
|
10 |
10
제9항에 있어서,상기 번역 모델은 상기 병렬 말뭉치의 원문이 어순 조정된 원문과 상기 병렬 말뭉치의 번역문에 기반한 학습을 통해 생성되며, 상기 번역 모델을 생성하는 장치는,상기 병렬 말뭉치의 원문을 입력받아서 상기 판별 모델을 사용하여 상기 병렬 말뭉치의 원문에 대한 어순 조정을 행하여 어순 조정된 원문을 생성하여 출력하는 분석기; 및상기 분석기에서 출력되는 어순 조정된 원문과 상기 병렬 말뭉치의 번역문을 사용하여 상기 번역 모델을 생성하는 번역 모델 생성부를 포함하는 것을 특징으로 하는 통계 기반 기계 번역 시스템
|
11 |
11
통계 기반의 기계 번역의 전처리 과정으로, 번역 대상의 제1 원문을 입력받아서 어순 조정을 명시한 계층 구조를 사용하여 어순 조정된 제2 원문을 생성하는 단계; 및상기 제2 원문에 대한 통계 기반의 기계 번역을 수행하여 상기 제1 원문에 대응되는 번역문을 생성하여 출력하는 단계를 포함하고,상기 어순 조정을 명시한 계층 구조는,상기 제1 원문의 단어 집합의 순열을 나타내는 복수의 노드; 및상기 복수의 노드간 부모 및 자식간의 관계를 나타내는 간선으로 이루어지며,상기 계층 구조에는 두 자식의 어순이 유지(straight)되거나 반전(inverted)되는 것이 명시되어 있는 것을 특징으로 하는 통계 기반 기계 번역 방법
|
12 |
12
제11항에 있어서,상기 제2 원문을 생성하는 단계는,상기 제1 원문을 입력받아서 판별 모델―여기서 판별 모델은 어순 조정을 명시한 계층 구조내 자질을 추출하기 위한 메타 정보를 포함함―을 사용하여 상기 제1 원문에 대한 어순을 분석하여 어순 조정을 명시한 계층 구조를 생성하는 단계; 및상기 어순 조정을 명시한 계층 구조를 사용하여 상기 제1 원문을 어순 조정하여 상기 제2 원문을 생성하는 단계를 포함하는 통계 기반 기계 번역 방법
|
13 |
13
제11항에 있어서,상기 번역문을 생성하여 출력하는 단계는,상기 제2 원문에 대해 번역 모델―여기서 번역 모델은 가능한 원문의 언어에 대응하는 번역문 언어 쌍들의 개연성을 제공하는 모델임―과 언어 모델―여기서 언어 모델은 단어 시퀀스의 개연성을 제공하는 모델임―을 사용하여 통계 기반의 기계 번역을 수행하여 대응되는 번역문을 생성하여 출력하는 것을 특징으로 하는 통계 기반 기계 번역 방법
|
14 |
14
삭제
|
15 |
15
제12항에 있어서,상기 판별 모델은 다수의 원문과 이에 대응되어 번역된 다수의 번역문을 포함하는 병렬 말뭉치를 이용한 학습을 통해 생성되는 것을 특징으로 하는 통계 기반 기계 번역 방법
|
16 |
16
제13항에 있어서,상기 번역 모델은 다수의 원문과 이에 대응되어 번역된 다수의 번역문을 포함하는 병렬 말뭉치의 원문이 어순 조정된 원문과 상기 병렬 말뭉치의 번역문에 기반한 학습을 통해 생성되는 것을 특징으로 하는 통계 기반 기계 번역 방법
|
17 |
17
통계 기반의 기계 번역을 수행하는 통계 기반 기계 번역 시스템에 있어서,기계 번역의 전처리 과정으로, 번역 대상의 제1 원문을 입력받아서 어순 조정과 형태소 차이를 명시한 계층 구조(Intermediate Tree)를 사용하여 어순 조정되고 형태소 생성 정보를 포함하는 제2 원문을 생성하여 출력하는 어순 조정 및 형태소 차이 반영부; 및상기 어순 조정 및 형태소 차이 반영부에서 출력되는 제2 원문에 대한 통계 기반의 기계 번역을 수행하여 상기 제1 원문에 대응되는 번역문을 생성하여 출력하는 통계 기반 기계 번역부를 포함하는 통계 기반 기계 번역 시스템
|
18 |
18
제17항에 있어서,상기 어순 조정 및 형태소 차이 반영부는,어순 조정 및 형태소 차이를 명시한 계층 구조내 자질을 추출하기 위한 메타 정보를 포함하는 판별 모델; 및상기 제1 원문을 입력받아서 상기 판별 모델을 사용하여 상기 제1 원문에 대한 어순을 분석하여 어순 조정을 명시함과 동시에 형태소 차이를 반영하여 형태소를 삭제하거나 또는 생성을 나타내는 정보를 포함하는 계층 구조를 생성하고, 생성되는 상기 어순 조정 및 형태소 차이를 명시한 계층 구조를 통해 상기 제1 원문을 상기 제2 원문으로 생성하여 상기 통계 기반 기계 번역부로 출력하는 어순 조정 및 형태소 차이 분석기를 포함하는 통계 기반 기계 번역 시스템
|
19 |
19
제17항 또는 제18항에 있어서,상기 어순 조정과 형태소 차이를 명시한 계층 구조는,상기 제1 원문의 단어 집합의 순열을 나타내는 복수의 노드; 및상기 복수의 노드간 부모 및 자식간의 관계를 나타내는 간선으로 이루어지며,상기 계층 구조에는 두 자식의 어순이 유지(straight)되거나 반전(inverted)되는 것이 명시되어 있는 동시에, 상기 두 자식 중 하나의 형태소가 삭제되어야 하거나 또는 형태소가 삽입되어야 하는 정보가 명시되어 있는것을 특징으로 하는 통계 기반 기계 번역 시스템
|
20 |
20
제19항에 있어서,상기 형태소의 삭제 또는 삽입 정보는 상기 두 자식 중 왼쪽의 자식을 삭제하는 것을 나타내는 기호(Delete Left:DL), 상기 두 자식 중 오른쪽의 자식을 삭제하는 것을 나타내는 기호(Dlelte Right:DL), 상기 두 자식 중 왼쪽의 자식의 앞에 형태소가 삽입되어야 함을 나타내는 기호(Insert Left:IL) 및 상기 두 자식 중 왼쪽의 자식의 뒤에 형태소가 삽입되어야 함을 나타내는 기호(Insert Right:IR)를 통해 표시되는 것을 특징으로 하는 통계 기반 기계 번역 시스템
|
21 |
21
제18항에 있어서,상기 판별 모델은,복수의 단어 또는 문장에 대해 어순 조정 및 형태소 삭제 또는 생성을 위한 분석에 필요한 자질 및 가중치를 포함하고,상기 자질은 어순이 유지됨 또는 어순이 반전됨을 나타내는 표시와, 형태소가 삭제 또는 생성됨을 나타내는 표시를 포함하고 있는것을 특징으로 하는 통계 기반 기계 번역 시스템
|
22 |
22
제21항에 있어서,상기 판별 모델은 다수의 원문과 이에 대응되어 번역된 다수의 번역문을 포함하는 병렬 말뭉치를 이용한 학습을 통해 판별 모델 생성 장치가 생성되며,상기 판별 모델 생성 장치는,원문과 원문이 번역된 번역문을 다수 포함하고 있는 병렬 말뭉치에서 상기 원문과 상기 번역문에 대해 번역 전후 문장의 어순 조정을 나타내는 순열을 파악하기 위한 단어 정렬을 수행하는 단어 정렬부;상기 단어 정렬부를 통해 단어 정렬된 자료에 대해 어순 조정을 명시한 계층 구조에 적용될 자질과 형태소 차이를 반영하여 형태소 삭제 또는 생성을 명시한 계층 구조에 적용될 자질을 추출하는 어순 조정 및 형태소 자질 추출부;상기 어순 조정 및 형태소 자질 추출부에 의해 추출된 자질에 대한 가중치를 설정하는 가중치 설정부; 및상기 단어 정렬부, 상기 어순 조정 및 형태소 자질 추출부 및 상기 가중치 설정부를 제어하여 상기 병렬 말뭉치에 기반하여 어순 조정 및 형태소 삭제 및 생성 정보를 명시한 계층 구조에 적용될 판별 모델을 학습하여 생성하는 학습 제어부를 포함하는것을 특징으로 하는 통계 기반 기계 번역 시스템
|
23 |
23
통계 기반의 기계 번역의 전처리 과정으로, 번역 대상의 제1 원문을 입력받아서 어순 조정과 형태소 차이를 명시한 계층 구조를 사용하여 어순 조정되고 형태소 생성 정보를 포함하는 제2 원문을 생성하는 단계; 및상기 제2 원문에 대한 통계 기반의 기계 번역을 수행하여 상기 제1 원문에 대응되는 번역문을 생성하여 출력하는 단계를 포함하는 통계 기반 기계 번역 방법
|
24 |
24
제23항에 있어서,상기 제2 원문을 생성하는 단계는,상기 제1 원문을 입력받아서 판별 모델―여기서 판별 모델은 어순 조정 및 형태소 차이를 명시한 계층 구조내 자질을 추출하기 위한 메타 정보를 포함함―을 사용하여 상기 제1 원문에 대한 어순을 분석하여 어순 조정을 명시하고 형태소 차이를 반영하여 형태소를 삭제하거나 또는 생성을 나타내는 정보를 명시한 계층 구조를 생성하는 단계; 및상기 어순 조정 및 형태소 차이를 명시한 계층 구조를 사용하여 상기 제1 원문에 대해 어순 조정을 수행함과 동시에 형태소 차이를 반영하여 형태소를 삭제하거나 또는 생성을 나타내는 정보를 포함하는 상기 제2 원문을 생성하는 단계를 포함하는 통계 기반 기계 번역 방법
|
25 |
25
제23항 또는 제24항에 있어서,상기 어순 조정과 형태서 차이를 명시한 계층 구조는,상기 제1 원문의 단어 집합의 순열을 나타내는 복수의 노드; 및상기 복수의 노드간 부모 및 자식간의 관계를 나타내는 간선으로 이루어지며,상기 계층 구조에는 두 자식의 어순이 유지(straight)되거나 반전(inverted)되는 것이 명시되어 있는 동시에, 상기 두 자식 중 하나의 형태소가 삭제되어야 하거나 또는 형태소가 삽입되어야 하는 정보가 명시되어 있는것을 특징으로 하는 통계 기반 기계 번역 방법
|