1 |
1
(a) 대상 언어 코퍼스로부터 통계적으로 순서 정보를 생성하여 저장하는 단계; (b) 대역 사전 데이터베이스를 구비하는 단계; (c) 원시 언어 문장을 입력받아 형태소를 분석하는 단계; (d) 상기 형태소별로 구분된 상기 원시 언어 문장을 구성하는 소정의 제1품사들에 해당하는 단어들을 변수화하고 소정의 제2품사들에 해당하는 단어들은 은닉한 후 형태소가 태깅된 문장으로 구성하는 단계; (e) 상기 태깅된 문장을 입력받아 상기 대역 사전 데이터베이스로부터 해당되는 형태소별로 대상 언어 단어로 교체하고, 상기 대상 언어로 교체된 문장의 단어를 상기 순서 정보를 기초로 배열하는 단계; (f) 상기 변수화된 품사의 원래의 단어를 복구하여 상기 교체된 대상 언어에 삽입하고 상기 은닉된 단어들을 복원하는 단계; 및 (g) 상기 태깅을 제거한 후 상기 원시 언어 문장 및 대상 언어의 특성에 따른 생성정보를 기초로 번역문을 출력하는 단계;를 포함하는 것을 특징으로 하는 번역문 생성 방법
|
2 |
2
제1항에 있어서, 상기 (a)단계는 (a1) 상기 대상 언어 코퍼스로부터 문장을 입력받아 형태소를 분석하는 단계; (a2) 상기 형태소별로 태깅을 한 후 소정의 제1품사들에 해당하는 단어들을 변수화하고 소정의 제2품사들에 해당하는 단어들은 은닉한 후 형태소가 태깅된 문장으로 구성하는 단계; (a3) 변수화되고 형태소별로 태깅된 상기 입력문장을 구성하는 단어의 순서정보를 추출한 후 저장하는 단계;를 포함하는 것을 특징으로 하는 번역문 생성 방법
|
3 |
3
제2항에 있어서, 상기 (a3)단계는 상기 단어간의 트라이그램, 바이그램, 그리고 모노그램의 빈도수에 기초한 확률값을 저장하는 단계;를 포함하는 것을 특징으로 하는 번역문 생성 방법
|
4 |
4
제1항에 있어서, 상기 (e)단계는 (e1) 상기 대상 언어 단어가 하나 이상인 경우에는 각 단어가 삽입된 문장에 대하여 배열한 후 상기 (a)단계에서 저장된 확률값에 기초하여 그 중 하나를 선택하는 것을 특징으로 하는 번역문 생성 방법
|
5 |
5
제4항에 있어서, 상기 (e1)단계는 상기 각 단어가 배열된 문장에 대하여 대치된 단어의 의미를 반영하고, 상기 저장된 순서정보에서 트라이그램, 바이그램, 그리고 모노그램값을 추출하여 각 배열의 값을 구한 후 가장 최대값을 선택하는 것을 특징으로 하는 번역문 생성 방법
|
6 |
6
대역 사전 데이터베이스; 대상 언어 코퍼스로부터 통계적으로 순서 정보가 저장된 훈련모듈; 원시 언어 문장을 입력받아 형태소를 분석하는 형태소분석부; 상기 형태소별로 구분된 상기 원시 언어 문장을 구성하는 소정의 제1품사들에 해당하는 단어들을 변수화하고 소정의 제2품사들에 해당하는 단어들은 은닉한 후 형태소가 태깅된 문장으로 구성하는 변수화부; 상기 태깅된 문장을 입력받아 상기 대역 사전 데이터베이스로부터 해당되는 형태소별로 대상 언어 단어로 교체하고, 상기 대상 언어로 교체된 문장의 단어를 상기 순서 정보를 기초로 배열하는 단어배열부; 상기 변수화된 품사의 원래의 단어를 복구하여 상기 교체된 대상 언어에 삽입하고 상기 은닉된 단어들을 복원하는 복구부; 및 상기 태깅을 제거한 후 상기 원시 언어 문장 및 대상 언어의 특성에 따른 생성정보를 기초로 번역문을 출력하는 후처리부;를 포함하는 것을 특징으로 하는 번역문 생성 장치
|
7 |
7
제6항에 있어서, 상기 훈련모듈은 상기 대상 언어 코퍼스를 문장단위로 입력받아 형태소를 분석하는 형태소추출부; 상기 형태소별로 태깅을 한 후 소정의 품사들에 대하여 변수화하는 변수부; 변수화되고 형태소별로 태깅된 상기 입력문장을 구성하는 단어의 순서정보를 추출하는 순서정보추출부; 상기 순서정보를 저장하는 저장부;를 포함하는 것을 특징으로 하는 번역문 생성 장치
|
8 |
8
제6항에 있어서, 상기 저장부는 상기 단어간의 트라이그램, 바이그램, 그리고 모노그램의 빈도수에 기초한 확률값을 저장하는 것을 특징으로 하는 번역문 생성 장치
|
9 |
9
제6항에 있어서, 상기 단어배열부는 상기 대상 언어 단어가 하나 이상인 경우에는 각 단어가 삽입된 문장에 대하여 상기 훈련모듈의 저장부에 기록된 확률값에 기초하여 배열하는 것을 특징으로 하는 번역문 생성 장치
|
10 |
10
제9항에 있어서, 상기 단어배열부는 상기 순서정보를 생성하는 과정에서 출현하지 않는 바이그램 리스트를 작성하여 상기 리스트에 해당되는 바이그램은 제외하는 것을 특징으로 하는 번역문 생성 장치
|
11 |
11
제1항의 단계를 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|
12 |
11
제1항의 단계를 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|