맞춤기술찾기

이전대상기술

통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법

  • 기술번호 : KST2015099956
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명에 따른, 통계적 기계번역 시스템에서 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 장치는 형태소-구문 분석된 소스 언어 문장을 수신하고, 상기 형태-구문 분석된 소스 언어 문장을 형태-구문적 특징 정보를 부착한 토큰화된 소스 언어 문장으로 변화시키는 소스 언어 문장 전처리기와, 형태소-구문 분석된 타겟 언어 문장을 수신하고, 상기 형태-구문 분석된 타겟 언어 문장을 형태-구문적 특징 정보를 부착한 토큰화된 타겟 언어 문장으로 변화시키는 타겟 언어 문장 전처리기와, 상기 토큰화된 소스 언어 문장 및 상기 토큰화된 타겟 언어 문장을 수신하여, 상기 토큰화된 소스 언어 문장 및 상기 토큰화된 타겟 언어 문장쌍에 대한 단어 정렬 및 구문 정렬을 수행하는 자율 학습기와, 상기 자율 학습기의 상기 단어 정렬 및 구문 정렬 수행을 반복시키기 위한 학습 종료 조건 검사기를 포함한다. 형태-구문 특징 정보, 단어 정렬, 구문 정렬, 반복 자율 학습, 단어 대역 사전, 구문 대역 사전
Int. CL G06F 17/28 (2006.01)
CPC G06F 17/2818(2013.01) G06F 17/2818(2013.01)
출원번호/일자 1020070076140 (2007.07.30)
출원인 한국전자통신연구원
등록번호/일자 10-0911372-0000 (2009.08.03)
공개번호/일자 10-2008-0052282 (2008.06.11) 문서열기
공고번호/일자 (20090810) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020060122292   |   2006.12.05
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2007.07.30)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 황영숙 대한민국 서울 구
2 박상규 대한민국 대전 유성구
3 김영길 대한민국 대전 중구
4 김창현 대한민국 대전 유성구
5 양성일 대한민국 대전 유성구
6 서영애 대한민국 대전 유성구
7 홍문표 대한민국 대전 유성구
8 윤창호 미국 대전 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 신영무 대한민국 서울특별시 강남구 영동대로 ***(대치동) KT&G타워 *층(에스앤엘파트너스)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2007.07.30 수리 (Accepted) 1-1-2007-0552243-79
2 선행기술조사의뢰서
Request for Prior Art Search
2008.06.11 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2008.07.15 수리 (Accepted) 9-1-2008-0045012-79
4 의견제출통지서
Notification of reason for refusal
2009.05.20 발송처리완료 (Completion of Transmission) 9-5-2009-0210800-95
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2009.07.01 수리 (Accepted) 1-1-2009-0401362-76
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2009.07.01 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2009-0401378-06
7 등록결정서
Decision to grant
2009.07.23 발송처리완료 (Completion of Transmission) 9-5-2009-0307074-95
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
통계적 기계번역 시스템에서 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 장치에 있어서, 형태-구문 분석된 소스 언어 문장을 수신하고, 상기 형태-구문 분석된 소스 언어 문장을 형태-구문적 특징 정보를 부착한 토큰화된 소스 언어 문장으로 변화시키는 소스 언어 문장 전처리기와, 형태-구문 분석된 타겟 언어 문장을 수신하고, 상기 형태-구문 분석된 타겟 언어 문장을 형태-구문적 특징 정보를 부착한 토큰화된 타겟 언어 문장으로 변화시키는 타겟 언어 문장 전처리기와, 상기 토큰화된 소스 언어 문장 및 상기 토큰화된 타겟 언어 문장을 수신하여, 상기 토큰화된 소스 언어 문장 및 상기 토큰화된 타겟 언어 문장의 쌍에 대한 단어 정렬 및 구문 정렬을 수행하는 자율 학습기와, 상기 자율 학습기의 상기 단어 정렬 및 구문 정렬 수행을 반복시키기 위한 학습 종료 조건 검사기 를 포함하며, 상기 형태-구문적 특징 정보는 형태소 또는 단어의 원형, 품사, 기본구 내에서의 상대적 위치정보, 구문 정보를 포함하는, 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 장치
2 2
제1항에 있어서, 소스 언어는 한국어이고 타겟 언어는 영어 또는 중국어인, 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 장치
3 3
제1항에 있어서, 상기 자율 학습기는, 상기 토큰화된 소스 언어 문장의 단어를 상기 토큰화된 타겟 언어 문장의 단어로 정렬하고 상기 토큰화된 타겟 언어 문장의 단어를 상기 토큰화된 소스 언어 문장의 단어로 정렬하여, 소스 언어에 적용된 형태-구문 특징 정보와 타겟 언어에 적용된 형태-구문 특징 정보에 따라 문장단위로 다수의 단어 정렬 집합을 획득하는 단어 정렬기를 포함하는, 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 장치
4 4
제3항에 있어서, 상기 자율 학습기는, 상기 다수의 단어 정렬 집합이 공통적으로 갖는 단어 정렬 결과를 초기 정렬값으로 취하여 구문 정렬(phrase alignment)을 수행하고 정렬되지 않은 소스와 타겟 언어의 구문의 내용어(content word)들을 대상으로 대역 스코어를 계산하고 가장 높은 대역 스코어를 갖는 단어를 선택하여 단어를 재정렬하는 단어 재정렬기를 더 포함하는, 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 장치
5 5
제4항에 있어서, 상기 자율 학습기는, 상기 구문 정보를 활용하여 하나 이상의 소스 구문과 하나 이상의 타겟 구문을 대역 구문으로 정렬하는 구문 정렬기를 더 포함하는, 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 장치
6 6
제5항에 있어서, 상기 자율 학습기는 상기 단어 재정렬 결과 및 상기 구문 정렬 결과로부터 단어 및 구문 대역 사전을 생성하는 대역 사전 생성기를 더 포함하는, 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 장치
7 7
제6항에 있어서, 상기 대역 사전 생성기는 신뢰도 측정을 통한 필터링 과정을 거쳐 임계 신뢰도 이상의 대역쌍들만을 상기 단어 및 구문 대역 사전에 존재시키고 임계 신뢰도 미만의 대역쌍은 상기 단어 및 구문 대역 사전에서 제거하는, 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 장치
8 8
제7항에 있어서, 상기 학습 종료 조건 검사기는 상기 단어 및 구문 대역 사전에 더 이상 변화가 없게 될 때까지 상기 자율 학습기의 단어 정렬, 단어 재정렬, 구문 정렬, 단어 및 구문 대역 사전 생성 과정을 반복시키는, 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 장치
9 9
제1항에 있어서, 상기 자율 학습기에 의한 상기 단어 정렬 결과 및 상기 구문 정렬 결과로부터 통계 기반의 번역 모델을 위한 파라미터를 추출하는, 통계적 기계번역 모델 파라미터 추출기를 더 포함하는, 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 장치
10 10
통계적 기계번역 시스템에서 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 방법에 있어서, (a) 형태-구문 분석된 소스 언어 문장 및 형태-구문 분석된 타겟 언어 문장을 수신하는 단계와, (b) 상기 형태-구문 분석된 소스 언어 문장 및 상기 형태-구문 분석된 타겟 언어 문장 각각을 형태소 또는 단어 단위로 나누고 각 형태소 또는 단어에 형태-구문적 특징 정보를 부착하고, 상기 형태-구문적 특징 정보가 부착된 형태소 또는 단어를 번역의 기본단위로 하는 토큰화된 소스 언어 문장 및 토큰화된 타겟 언어 문장을 구성하는 단계와, (c) 상기 토큰화된 소스 언어 문장 및 상기 토큰화된 타겟 언어 문장의 쌍에 대한 단어 정렬 및 구문 정렬을 수행하는 단계와, (d) 상기 단어 정렬 결과 및 상기 구문 정렬 결과로부터 단어 및 구문 대역 사전을 생성하는 단계 를 포함하는, 통계적 기계번역 시스템에서 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 방법
11 11
삭제
12 12
제10항에 있어서, 상기 (c)단계는, 상기 토큰화된 소스 언어 문장의 단어를 토큰화된 상기 타겟 언어 문장의 단어로 정렬하고 상기 토큰화된 타겟 언어 문장의 단어를 상기 토큰화된 소스 언어 문장의 단어로 정렬하여, 소스 언어에 적용된 형태-구문 특징 정보와 타겟 언어에 적용된 형태-구문 특징 정보에 따라 문장단위로 다수의 단어 정렬 집합을 획득하는 단계와, 상기 다수의 단어 정렬 집합이 공통적으로 갖는 단어 정렬 결과를 초기 정렬값으로 취하여 구문 정렬(phrase alignment)을 수행하고 정렬되지 않은 소스와 타겟 언어의 구문의 내용어(content word)들을 대상으로 대역 스코어를 계산하고 가장 높은 대역 스코어를 갖는 단어를 선택하여 단어를 재정렬하는 단계와, 구문 정보를 활용하여 하나 이상의 소스 구문과 하나 이상의 타겟 구문을 대역 구문으로 정렬하는 단계 를 포함하는, 통계적 기계번역 시스템에서 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 방법
13 13
제12항에 있어서, 상기 (d)단계는, 임계 신뢰도 이상의 대역쌍들만을 상기 단어 및 구문 대역 사전에 존재시키고 임계 신뢰도 미만의 대역쌍은 상기 단어 및 구문 대역 사전에서 제거하는 단계를 포함하는, 통계적 기계번역 시스템에서 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 방법
14 14
제13항에 있어서, 상기 단어 및 구문 대역 사전에 더 이상 변화가 없게 될 때까지 상기 (c) 및 (d) 단계를 반복하는 단계를 더 포함하는, 통계적 기계번역 시스템에서 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.