맞춤기술찾기

이전대상기술

영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법

  • 기술번호 : KST2015087658
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명에 의한 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법은 영한 병렬 코퍼스와 영어 모노링궐(monolingual) 코퍼스 및 워드넷에 기반한 의미코드를 기초로 동사구 패턴 데이터베이스를 구축하는 단계; 원문과 대역문의 쌍으로 이루어지는 병렬 코퍼스내의 각 문장 쌍에 대하여 어휘 정렬을 수행한 후 의미벡터 및 한국어 국소 문맥 정보를 구축하는 단계; 입력되는 문장을 단문 단위로 분할하여 상기 동사구 패턴 데이터베이스를 참조하여 상기 단문에 적용할 동사구 패턴을 검색하는 단계; 상기 검색에 성공하면 검색된 동사구 패턴을 기초로 동사의 대역어와 각 논항의 명사 의미코드를 결정하는 단계; 상기 검색에 실패하고 상기 동사구 패턴이 적용되지 않는 경우에는 소정의 디폴트 동사구 패턴을 적용하여 기본적인 동사 대역어를 선정하는 단계; 및 상기 검색에 실패하고 상기 동사의 논항이 명사구이면 영어 공기 어휘를 이용하여 의미코드를 결정하는 단계;를 포함하는 것을 특징으로 하며, 동사구 패턴에 의해 동사와 헤드 명사에 대한 대역어를 선택하고, 또한 공기 정보에 의해 헤드 명사가 아닌 기타 명사에 대한 대역어 선택도 가능하다.기계번역, 자동번역, 대역어 선택, 의미 벡터, 동사구 패턴
Int. CL G06F 17/28 (2006.01)
CPC G06F 17/289(2013.01) G06F 17/289(2013.01) G06F 17/289(2013.01) G06F 17/289(2013.01)
출원번호/일자 1020050018746 (2005.03.07)
출원인 한국전자통신연구원
등록번호/일자 10-0617319-0000 (2006.08.22)
공개번호/일자 10-2006-0067073 (2006.06.19) 문서열기
공고번호/일자 (20060830) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020040105412   |   2004.12.14
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2005.03.07)
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이기영 대한민국 대전 서구
2 최승권 대한민국 대전 유성구
3 노윤형 대한민국 대전 유성구
4 권오욱 대한민국 대전 서구
5 김영길 대한민국 대전 중구
6 김창현 대한민국 서울 용산구
7 홍문표 대한민국 대전 유성구
8 양성일 대한민국 대전 유성구
9 류철 대한민국 대전 서구
10 서영애 대한민국 대전 유성구
11 박상규 대한민국 대전 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 리앤목특허법인 대한민국 서울 강남구 언주로 **길 **, *층, **층, **층, **층(도곡동, 대림아크로텔)
2 이해영 대한민국 서울 강남구 언주로 **길 **, *층, **층, **층, **층(도곡동, 대림아크로텔)(리앤목특허법인)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2005.03.07 수리 (Accepted) 1-1-2005-0120452-70
2 등록결정서
Decision to grant
2006.07.24 발송처리완료 (Completion of Transmission) 9-5-2006-0419731-18
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
(a) 영한 병렬 코퍼스와 영어 모노링궐(monolingual) 코퍼스 및 워드넷에 기반한 의미코드를 기초로 동사구 패턴 데이터베이스를 구축하는 단계;(b) 원문과 대역문의 쌍으로 이루어지는 병렬 코퍼스내의 각 문장 쌍에 대하여 어휘 정렬을 수행한 후 의미벡터 및 한국어 국소 문맥 정보를 구축하는 단계;(c) 입력되는 문장을 단문 단위로 분할하여 상기 동사구 패턴 데이터베이스를 참조하여 상기 단문에 적용할 동사구 패턴을 검색하는 단계;(d) 상기 검색에 성공하면 검색된 동사구 패턴을 기초로 동사의 대역어와 각 논항의 명사 의미코드를 결정하는 단계;(e) 상기 검색에 실패하고 상기 동사구 패턴이 적용되지 않는 경우에는 소정의 디폴트 동사구 패턴을 적용하여 기본적인 동사 대역어를 선정하는 단계; 및(f) 상기 검색에 실패하고 상기 동사의 논항이 명사구이면 영어 공기 어휘를 이용하여 의미코드를 결정하는 단계;를 포함하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
2 2
제1항에 있어서, 상기 (a)단계는(a1) 동사를 중심으로 해당 동사가 취하는 논항 정보를 추출하는 단계;(a2) 상기 추출된 논항 정보에 대하여 워드넷을 기초로 의미 정보를 태깅하는 단계;(a3) 상기 동사의 하위범주 정보에 대한 한국어 대역 정보를 구축하는 단계;를 포함하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
3 3
제1항에 있어서, 상기 (b)단계는(b1) 상기 병렬 코퍼스로부터 영어 및 한국어 문장들의 형태소를 분석하고 태깅하는 단계; 및(b2) 상기 태깅된 각 문장쌍에 대한 어휘레벨을 소정의 영한 전자 사전을 참조하여 정렬한 후 상기 의미벡터를 구축하는 단계;를 포함하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
4 4
제3항에 있어서, 상기 의미벡터는영어 명사들과 각 영어명사와 공기하는 어휘들의 가중치값을 나타내는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
5 5
제1항에 있어서, 상기 (d)단계는한국어 대역어가 2 이상 존재하면 상기 한국어 국소 문맥 정보 데이터베이스를 참조하여 최적의 대역어를 선정하는 단계;를 더 포함하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
6 6
제1항에 있어서, 상기 제(f)단계는(f1) 각 어휘에 대하여 소정의 테스트 벡터를 구성하는 단계;(f2) 상기 테스트 벡터와 의미벡터간의 유사도를 계산하여 의미코드를 결정하는 단계; 및(f3) 의미코드가 결정된 명사가 대역어를 2개 이상 가질 경우에는 상기 한국어 국소 문맥 데이터베이스를 참조하여 최적 대역어를 선정하는 단계;를 포함하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
7 7
제6항에 있어서, 상기 테스트 벡터는상기 입력되는 문장에 포함된 각 영어 명사에 대한 공기 어휘가 해당 영어 명사 어휘의 의미벡터의 구성요소이면 1의 값을 가지고, 그렇지 아니한 경우에는 0의 값을 가지는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
8 8
제6항에 있어서, 상기 (f2)단계는상기 테스트 벡터와 의미 벡터와의 유사도를 코사인 메져(cosine measure)를 이용하여 구하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
9 9
제5항 혹은 제6항 중 어느 하나의 항에 있어서, 상기 한국어 국소 문맥 정보를 참조하여 최적의 대역어를 선정하는 단계는 상기 한국어 국소 문맥 정보 데이터베이스를 참조하여 인접하는 명사 혹은 형용사와 의미상 가장 근접한 대역어의 확률적 최고치를 가지는 대역어를 선택하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법
10 10
문장을 입력 받아 단문 단위로 분할하는 단문분할부;동사구 패턴 데이터베이스를 참조하여 상기 단문에 적용가능한 동사구 패턴을 검색하는 동사구패턴적용부;상기 검색이 성공하면 상기 동사구패턴적용부에서 검색한 동사구 패턴을 입력받아 동사의 대역어와 명사의 의미코드를 결정하는 동사대역어결정부;상기 동사구패턴적용부에서의 검색이 실패하면 의미벡터 데이터 베이스와 한국어 국소 문맥 데이터 베이스를 참조하여 대역어를 확률적으로 선택하여 출력하는 대역어 선택부;를 포함하는 것을 특징으로 하는 영한 자동 번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 장치
11 11
제10항에 있어서, 상기 대역어 선택부는각 어휘에 대하여 소정의 테스트 벡터를 생성하는 테스트벡터구성부;상기 의미벡터 데이터 베이스를 참조하여 상기 테스트 벡터와 의미벡터간의 유사도를 결정하는 유사도계산부;상기 유사도에 따라 명사의 의미코드를 결정하여 출력하는 명사의미코드결정부; 및상기 명사의미코드결정부가 결정한 명사의 의미코드를 2이상 가지는 명사에대하여 상기 한국어 국소문맥 정보 데이터베이스를 참조하여 최적대역어를 출력하는 명사대역어선택부;를 포함하는 것을 특징으로 하는 영한 자동 번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 장치
12 12
제11항에 있어서, 상기 테스트벡터구성부는상기 입력되는 문장에 포함된 각 영어 명사에 대한 공기 어휘가 해당 영어 명사 어휘의 의미벡터의 구성요소이면 1의 값을 가지고, 그렇지 아니한 경우에는 0의 값을 가지도록 상기 테스트벡터를 생성하는 것을 특징으로 하는 영한 자동 번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 장치
13 13
제11항에 있어서, 상기 의미벡터 데이터베이스에 구축되는 의미벡터는영어 명사들과 각 영어명사와 공기하는 어휘들의 가중치값을 나타내는 것을 특징으로 하는 영한 자동 번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 장치
14 14
제11항에 있어서, 상기 명사대역어선택부는인접하는 명사 혹은 형용사와 의미상 가장 근접한 대역어를 확률적으로 계산하여 상기 최적의 대역어를 결정하는 것을 특징으로 하는 영한 자동 번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 장치
15 15
(a) 영한 병렬 코퍼스와 영어 모노링궐(monolingual) 코퍼스 및 워드넷에 기반한 의미코드를 기초로 동사구 패턴 데이터베이스를 구축하는 단계;(b) 원문과 대역문의 쌍으로 이루어지는 병렬 코퍼스내의 각 문장 쌍에 대하여 어휘 정렬을 수행한 후 의미벡터 및 한국어 국소 문맥 정보를 구축하는 단계;(c) 입력되는 문장을 단문 단위로 분할하여 상기 동사구 패턴 데이터베이스를 참조하여 상기 단문에 적용할 동사구 패턴을 검색하는 단계;(d) 상기 검색에 성공하면 검색된 동사구 패턴을 기초로 동사의 대역어와 각 논항의 명사 의미코드를 결정하는 단계;(e) 상기 검색에 실패하고 상기 동사구 패턴이 적용되지 않는 경우에는 소정의 디폴트 동사구 패턴을 적용하여 기본적인 동사 대역어를 선정하는 단계; 및(f) 상기 검색에 실패하고 상기 동사의 논항이 명사구이면 영어 공기 어휘를 이용하여 의미코드를 결정하는 단계;를 포함하는 것을 특징으로 하는 영한 자동번역에서 동사구 패턴, 의미 벡터 및 한국어 국소 문맥 정보를 사용한 영어 동사/명사 대역어 선택 방법을 컴퓨터에서 실행시킬 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.