1 |
1
(a) 영한 병렬 코퍼스와 영어 모노링궐(monolingual) 코퍼스 및 워드넷에 기반한 의미코드를 기초로 동사구 패턴 데이터베이스를 구축하는 단계;(b) 원문과 대역문의 쌍으로 이루어지는 병렬 코퍼스내의 각 문장 쌍에 대하여 어휘 정렬을 수행한 후 의미벡터 및 한국어 국소 문맥 정보를 구축하는 단계;(c) 입력되는 문장을 단문 단위로 분할하여 상기 동사구 패턴 데이터베이스를 참조하여 상기 단문에 적용할 동사구 패턴을 검색하는 단계;(d) 상기 검색에 성공하면 검색된 동사구 패턴을 기초로 동사의 대역어와 각 논항의 명사 의미코드를 결정하는 단계;(e) 상기 검색에 실패하고 상기 동사구 패턴이 적용되지 않는 경우에는 소정의 디폴트 동사구 패턴을 적용하여 기본적인 동사 대역어를 선정하는 단계; 및(f) 상기 검색에 실패하고 상기 동사의 논항이 명사구이면 영어 공기 어휘를 이용하여 의미코드를 결정하는 단계;를 포함하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
|
2 |
2
제1항에 있어서, 상기 (a)단계는(a1) 동사를 중심으로 해당 동사가 취하는 논항 정보를 추출하는 단계;(a2) 상기 추출된 논항 정보에 대하여 워드넷을 기초로 의미 정보를 태깅하는 단계;(a3) 상기 동사의 하위범주 정보에 대한 한국어 대역 정보를 구축하는 단계;를 포함하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
|
3 |
3
제1항에 있어서, 상기 (b)단계는(b1) 상기 병렬 코퍼스로부터 영어 및 한국어 문장들의 형태소를 분석하고 태깅하는 단계; 및(b2) 상기 태깅된 각 문장쌍에 대한 어휘레벨을 소정의 영한 전자 사전을 참조하여 정렬한 후 상기 의미벡터를 구축하는 단계;를 포함하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
|
4 |
4
제3항에 있어서, 상기 의미벡터는영어 명사들과 각 영어명사와 공기하는 어휘들의 가중치값을 나타내는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
|
5 |
5
제1항에 있어서, 상기 (d)단계는한국어 대역어가 2 이상 존재하면 상기 한국어 국소 문맥 정보 데이터베이스를 참조하여 최적의 대역어를 선정하는 단계;를 더 포함하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
|
6 |
6
제1항에 있어서, 상기 제(f)단계는(f1) 각 어휘에 대하여 소정의 테스트 벡터를 구성하는 단계;(f2) 상기 테스트 벡터와 의미벡터간의 유사도를 계산하여 의미코드를 결정하는 단계; 및(f3) 의미코드가 결정된 명사가 대역어를 2개 이상 가질 경우에는 상기 한국어 국소 문맥 데이터베이스를 참조하여 최적 대역어를 선정하는 단계;를 포함하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
|
7 |
7
제6항에 있어서, 상기 테스트 벡터는상기 입력되는 문장에 포함된 각 영어 명사에 대한 공기 어휘가 해당 영어 명사 어휘의 의미벡터의 구성요소이면 1의 값을 가지고, 그렇지 아니한 경우에는 0의 값을 가지는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
|
8 |
8
제6항에 있어서, 상기 (f2)단계는상기 테스트 벡터와 의미 벡터와의 유사도를 코사인 메져(cosine measure)를 이용하여 구하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
|
9 |
9
제5항 혹은 제6항 중 어느 하나의 항에 있어서, 상기 한국어 국소 문맥 정보를 참조하여 최적의 대역어를 선정하는 단계는 상기 한국어 국소 문맥 정보 데이터베이스를 참조하여 인접하는 명사 혹은 형용사와 의미상 가장 근접한 대역어의 확률적 최고치를 가지는 대역어를 선택하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
|
10 |
10
문장을 입력 받아 단문 단위로 분할하는 단문분할부;동사구 패턴 데이터베이스를 참조하여 상기 단문에 적용가능한 동사구 패턴을 검색하는 동사구패턴적용부;상기 검색이 성공하면 상기 동사구패턴적용부에서 검색한 동사구 패턴을 입력받아 동사의 대역어와 명사의 의미코드를 결정하는 동사대역어결정부;상기 동사구패턴적용부에서의 검색이 실패하면 의미벡터 데이터 베이스와 한국어 국소 문맥 데이터 베이스를 참조하여 대역어를 확률적으로 선택하여 출력하는 대역어 선택부;를 포함하는 것을 특징으로 하는 영한 자동 번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 장치
|
11 |
11
제10항에 있어서, 상기 대역어 선택부는각 어휘에 대하여 소정의 테스트 벡터를 생성하는 테스트벡터구성부;상기 의미벡터 데이터 베이스를 참조하여 상기 테스트 벡터와 의미벡터간의 유사도를 결정하는 유사도계산부;상기 유사도에 따라 명사의 의미코드를 결정하여 출력하는 명사의미코드결정부; 및상기 명사의미코드결정부가 결정한 명사의 의미코드를 2이상 가지는 명사에대하여 상기 한국어 국소문맥 정보 데이터베이스를 참조하여 최적대역어를 출력하는 명사대역어선택부;를 포함하는 것을 특징으로 하는 영한 자동 번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 장치
|
12 |
12
제11항에 있어서, 상기 테스트벡터구성부는상기 입력되는 문장에 포함된 각 영어 명사에 대한 공기 어휘가 해당 영어 명사 어휘의 의미벡터의 구성요소이면 1의 값을 가지고, 그렇지 아니한 경우에는 0의 값을 가지도록 상기 테스트벡터를 생성하는 것을 특징으로 하는 영한 자동 번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 장치
|
13 |
13
제11항에 있어서, 상기 의미벡터 데이터베이스에 구축되는 의미벡터는영어 명사들과 각 영어명사와 공기하는 어휘들의 가중치값을 나타내는 것을 특징으로 하는 영한 자동 번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 장치
|
14 |
14
제11항에 있어서, 상기 명사대역어선택부는인접하는 명사 혹은 형용사와 의미상 가장 근접한 대역어를 확률적으로 계산하여 상기 최적의 대역어를 결정하는 것을 특징으로 하는 영한 자동 번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 장치
|
15 |
15
(a) 영한 병렬 코퍼스와 영어 모노링궐(monolingual) 코퍼스 및 워드넷에 기반한 의미코드를 기초로 동사구 패턴 데이터베이스를 구축하는 단계;(b) 원문과 대역문의 쌍으로 이루어지는 병렬 코퍼스내의 각 문장 쌍에 대하여 어휘 정렬을 수행한 후 의미벡터 및 한국어 국소 문맥 정보를 구축하는 단계;(c) 입력되는 문장을 단문 단위로 분할하여 상기 동사구 패턴 데이터베이스를 참조하여 상기 단문에 적용할 동사구 패턴을 검색하는 단계;(d) 상기 검색에 성공하면 검색된 동사구 패턴을 기초로 동사의 대역어와 각 논항의 명사 의미코드를 결정하는 단계;(e) 상기 검색에 실패하고 상기 동사구 패턴이 적용되지 않는 경우에는 소정의 디폴트 동사구 패턴을 적용하여 기본적인 동사 대역어를 선정하는 단계; 및(f) 상기 검색에 실패하고 상기 동사의 논항이 명사구이면 영어 공기 어휘를 이용하여 의미코드를 결정하는 단계;를 포함하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법을 컴퓨터에서 실행시킬 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|