1 |
1
기계 번역을 위한 문장 분할 방법에 있어서,
중문 분리의 예제를 데이터베이스로 구축하기 위해 중문 원문을 수집하는 단계;
상기 수집된 중문 원문을 접속패턴을 중심으로 앞부분 문장과 뒷부분 문장으로 분리(분할)하여 데이터베이스화하는 단계;
상기 앞부분 문장과 뒷부분 문장에 대해 형태소 분석을 하는 단계;를 포함하는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
|
2 |
2
제1항에 있어서,
상기 중문 분리의 예제로부터 다시쓰기 규칙과 접속 패턴에 관한 정보를 획득하는 단계를 포함하고,
상기 다시쓰기 규칙은 원문과 중문 분할 결과로 생성된 문장들을 비교하여 달라진 부분으로부터 추출하고, 달라진 부분 중 원문 쪽의 패턴을 분할 결과 쪽의 패턴으로 바꿔 쓰는 규칙이 되는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
|
3 |
3
제1항 또는 제2항에 있어서,
상기 수집된 중문 원문에서 상기 다시쓰기 규칙의 원문 쪽 패턴이 나타나는 것으로 정의되는 유발 환경을 이용하고,
상기 다시쓰기 규칙 및 유발 환경을 분할된 예제에 반영하여 각각의 예제로부터 하나씩의 초기 변환을 획득하는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
|
4 |
4
제3항에 있어서,
상기 수집된 중문 원문은 각각 분할된 후 상기 데이터베이스에 저장되어 있는 예제와 비교하여 오류가 있는지를 확인하고, 오류가 없으면 다음 원문으로 넘어가고 오류가 있다면 상기 초기 변환이 오류를 발생하지 않을 때까지 상기 유발 환경을 확장하는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
|
5 |
5
제4항에 있어서,
상기 유발 환경의 확장은 상기 초기 변환에서 설정된 패턴에서부터 그 패턴을 조금씩 늘려 나가는 것으로 진행되며, 상기 패턴은 다시 형태소 패턴과 품사 태그 패턴으로 나뉘어 관리되는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
|
6 |
6
제5항에 있어서,
상기 유발 환경의 확장은 한 번에 한 단계씩 일어나며 각 단계마다 형태소 패턴을 앞으로 확장, 형태소 패턴을 뒤로 확장, 품사태그 패턴을 앞으로 확장, 품사태그 패턴을 뒤로 확장하는 4가지 확장 방식 중 한 가지가 선택되는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
|
7 |
7
제3항에 있어서,
상기 원문의 문장에 적용되는 변환들에 대해 우선순위를 정하는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
|
8 |
8
제1항에 있어서,
상기 앞부분의 문장과 뒷부분의 문장은 각각 종결어미로 종결되는 형태를 취하는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
|
9 |
9
제1항에 있어서,
상기 형태소 분석을 통해 상기 원문의 형태소 분석 정보, 분리 후 생성된 앞부분 문장과 뒷부분 문장의 형태소 분석 정보, 분리 후 생성된 문장들 사이의 접속패턴 정보 및 상기 원문의 분리가능 여부 정보를 획득하는 단계를 포함하는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
|
10 |
10
제9항에 있어서,
상기 원문이 분리 가능하지 않은 경우에는 상기 원문 분리 후 얻어지는 정보들인 상기 앞부분 문장과 뒷부분 문장의 형태소 분석 정보 및 상기 접속패턴 정보가 존재하지 않게 되는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
|