맞춤기술찾기

이전대상기술

제한적인 도메인의 문서를 대상으로 특화된 자동 번역 장치및 방법

  • 기술번호 : KST2015081802
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 특허 문서를 번역 대상으로 하여 특허 도메인에 특화된(customized) 번역 지식(translation knowledge)을 추출하고 이렇게 추출된 특화된 지식을 사용하여 특허 문서를 자동 번역하는 방법 및 그 장치에 관한 것으로, 특허 문서로부터 전문용어를 대량으로 추출하고 추출된 전문용어에 대하여 대역어를 할당하며, 일반 도메인의 문서가 아닌 특허 문서에서 고빈도로 사용되는 표현들을 추출하고 해당 표현들에 대한 대역 표현을 구축하며, 이렇게 구축된 번역 지식을 사용하고, 또한 특허문서에서의 과대하게 긴 문장들에 대해 문형패턴 적용, 병렬구조 인식 및 구문단서에 의한 문장분할 등을 수행하여, 파싱 가능한 번역 단위를 추출하여 구조분석을 수행하는 특허 문서를 자동으로 번역하는 장치 및 방법을 제공하는데 있다.기계번역, 자동번역, 지식추출, 특허번역
Int. CL G06F 17/27 (2006.01) G06F 17/28 (2006.01)
CPC
출원번호/일자 1020060056203 (2006.06.22)
출원인 한국전자통신연구원
등록번호/일자 10-0792204-0000 (2007.12.31)
공개번호/일자 10-2007-0058950 (2007.06.11) 문서열기
공고번호/일자 (20080108) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020050117691   |   2005.12.05
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2006.06.22)
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이기영 대한민국 대전 서구
2 노윤형 대한민국 대전 유성구
3 최승권 대한민국 대전 유성구
4 권오욱 대한민국 대전 서구
5 박상규 대한민국 대전 유성구
6 김영길 대한민국 대전 중구
7 김창현 대한민국 대전 유성구
8 서영애 대한민국 대전 유성구
9 양성일 대한민국 대전 유성구
10 류철 대한민국 대전 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 신영무 대한민국 서울특별시 강남구 영동대로 ***(대치동) KT&G타워 *층(에스앤엘파트너스)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2006.06.22 수리 (Accepted) 1-1-2006-0440302-92
2 선행기술조사의뢰서
Request for Prior Art Search
2007.05.07 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2007.06.12 수리 (Accepted) 9-1-2007-0032264-28
4 의견제출통지서
Notification of reason for refusal
2007.06.27 발송처리완료 (Completion of Transmission) 9-5-2007-0352911-71
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2007.08.24 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2007-0614119-58
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2007.08.24 수리 (Accepted) 1-1-2007-0614102-83
7 등록결정서
Decision to grant
2007.12.27 발송처리완료 (Completion of Transmission) 9-5-2007-0703293-96
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
형태소 분석과 태깅을 통해 제한된 도메인의 문서에 따른 해당 코퍼스를 구축하여 전문용어를 추출 및 구축하는 전문용어 구축부와, 가중치를 적용하여 최장우선 방식의 고빈도 표현을 추출하여 문형/구 패턴을 정제하고, 상기 구축된 전문용어에 대해서 대역어를 구축하는 대역어 구축 및 정제부와,상기 해당 코퍼스에 기반해서 고빈도 중복 어휘 문자열 및 용례에 따른 해당 도메인의 구문 번역 패턴 및 문장 번역 패턴을 구축하는 문장/구 패턴 구축부를 포함하며 제한된 도메인의 문서를 구성하는 문장들의 번역에 필요한 번역 지식을 추출하는 지식추출부와,상기 추출된 번역 지식이 적용된 사전 및 변환 패턴에 기반하여 입력되는 문장에 대한 번역문을 생성하는 번역부를 포함하는 자동 번역 장치
2 2
삭제
3 3
제 1 항에 있어서,상기 가중치는 제한된 도메인에 따른 어휘별 빈도 및 공기 어휘와의 밀접성에 상응하여 적용되는 것을 특징으로 하는 자동 번역 장치
4 4
제 1 항에 있어서, 상기 번역부는입력되는 문장을 분리하고, 분리한 문장에 나타나는 어휘를 토큰(token)으로 분리하여 기호, 수식 및 단어로 구분하는 전처리부와,상기 토큰의 형태소를 분석하고 상기 지식추출부를 통해 어휘 변환된 HMM(Lexicalized Hidden Markov Model)을 이용하여 통계적 품사 태깅하는 형태소 분석 및 태깅부와, 상기 형태소 분석 및 태깅된 문장에 대해 문형패턴 및 구문패턴에 의한 문장분할 적용하여 패턴의 각 노드에 대해 파싱하여 최종 구문 분석결과를 생성하는 구조분석부와,상기 지식추출부의 추출된 번역 지식에 따른 변환 패턴을 사용하여 상기 생성된 구문 분석결과에 대한 구조 변환을 수행하여 목표 언어의 구조로 변환하고, 사전을 이용하여 각 개별 어휘 변환을 수행하는 구조 및 어휘 변환부와,상기 구조 및 어휘 변환부에서 출력되는 변환된 구조 및 어휘를 통해 최종적인 목표 언어 문장을 생성하는 생성부를 포함하는 자동 번역 장치
5 5
(a) 원시언어로 작성된 문서들로부터 형태소 분석과 태깅 과정을 통해 제한된 도메인에 따른 특정 코퍼스를 구축하여 전문용어를 추출하는 단계와,(b) 제한된 도메인에 따른 가중치를 적용하여 최장우선 방식의 고빈도 표현을 추출하여 문형/구 패턴을 정제하고, 상기 구축된 전문용어에 대해서 대역어를 구축하는 단계와,(c) 상기 (a) 단계에서 구축된 특정 코퍼스에 기반하여 구문 번역 패턴 및 문장 번역 패턴을 구축하는 단계와,(d) 형태소 분석 및 태깅된 문장에 대해 문형 패턴에 의한 문장분할을 적용하고 문형패턴의 각 노드에 대해 파싱하여 구문 분석결과를 생성하는 단계와,(e) 상기 (c) 단계에서 구축된 구문 및 문장 번역 패턴을 사용하여 상기 생성된 구문 분석결과에 대한 구조 변환을 통한 목표 언어의 구조 변환과 각 개별 어휘 변환을 수행하는 단계와,(f) 상기 변환된 구조 및 어휘를 통해 목표 언어 문장을 생성하는 단계를 포함하는 자동 번역 방법
6 6
제 5 항에 있어서, 상기 (a) 단계는 (a1) 원시언어로 작성된 문서들로부터 구축된 대량의 문서 코퍼스를 입력으로 각 문장으로 분리하고, 상기 분리된 문장의 어휘를 토큰(token)으로 분리하는 단계와,(a2) 형태소를 분석하여 상기 각 토큰에 가능한 모든 품사를 부착하는 단계와,(a3) 기 정의된 어휘품사문맥 확률 정보 및 어휘확률 정보를 이용하여 각 단어에 특정 품사를 할당하는 통계적 품사 태깅을 수행하여 특정 품사가 할당된 특정 코퍼스를 구축하는 단계와,(a4) 상기 구축된 특정 코퍼스에서 전문용어를 추출하는 단계를 포함하는 자동 번역 방법
7 7
제 6 항에 있어서,상기 (a1) 단계는 입력되는 문서가 장문일 경우에는 장문 분리 규칙에 의해서 장문을 몇 개의 문장으로 분리하는 단계를 포함하는 것을 특징으로 하는 자동 번역 방법
8 8
제 6 항에 있어서,상기 (a1) 단계의 토큰은 기호, 수식, 단어 중 어느 하나로 정의되는 것을 특징으로 하는 자동 번역 방법
9 9
제 6 항에 있어서, 상기 (a4) 단계는 이하의 조건 중 적어도 하나에 만족하는 것을 특징으로 하는 자동 번역 방법
10 10
제 5 항에 있어서, 상기 (b) 단계는 (b1) 상기 구축된 특정 코퍼스로부터 사전 각 엔트리의 각 대역어에 대한 발생 빈도를 계산하는 단계와,(b2) 상기 각 대역어와 함께 공기하는(co-occurring) 어휘들을 추출하고 각 어휘들 간의 상호 정보(Mutual Information)를 계산하는 단계와,(b3) 상기 어휘 빈도 및 공기 어휘를 통해 얻어진 값들을 사용하여 각 대역어의 사용 가중치를 계산하는 단계와, (b4) 상기 대역어 사용 가중치를 적용하여 사전 엔트리의 각 대역어를 특정 도메인에서의 사용 중요도에 따라 정제하는 단계와,(b3) 상기 정제된 문형/구 패턴 및 정의된 가중치에 기반하여 상기 구축된 전문용어에 대해서 대역어를 구축하는 단계를 포함하는 자동 번역 방법
11 11
제 5 항에 있어서,상기 (b) 단계의 가중치는 제한된 도메인에 따른 어휘별 빈도 및 공기 어휘와의 밀접성에 상응하는 값인 것을 특징으로 하는 자동 번역 방법
12 12
제 5 항에 있어서, 상기 (c) 단계는(c1) 상기 (a) 단계에서 구축된 특정 코퍼스 중 가장 빈도수가 높은 문자열을 추출하고, 이 추출된 문자열을 통해 고빈도 중복 어휘 문자열 및 용례를 생성하는 단계와, (c2) 상기 생성된 고빈도 중복 어휘 문자열 및 용례에 대해 구문 패턴 후보 또는 문형 패턴 후보의 가능성을 판단하는 단계와,(c3) 상기 판단결과 구문 패턴 후보로 판단되면, 구의 시작/끝 노드인지, 또는 품사 노드인지 체크하여 특정 구문 번역 패턴을 구축하는 단계와,(c4) 상기 판단결과 문형 패턴 후보로 판단되면, 문장 전체에 대해 특정 문장 번역 패턴으로 구축하는 단계를 포함하는 자동 번역 방법
13 13
제 5 항에 있어서, 상기 (d) 단계는(d1) 상기 형태소 분석 및 태깅된 문장에 대해 패턴을 판단하는 단계와,(d2) 상기 판단 결과 구문패턴으로 판단되면, 병렬구조를 인식하고 병렬 노드 파싱을 통해 문장분할을 수행하여 구문 노드 파싱을 수행하는 단계와,(d3) 상기 판단 결과 문형패턴으로 판단되면, 문형패턴의 각 노드에 대해 구문 노드 파싱을 수행하는 단계와,(d4) 상기 구문 노드 파싱된 결과를 하나의 챠트로 취급하여 전체 문장을 다시 파싱함으로써 최종 구조분석결과를 생성하는 단계를 포함하는 자동 번역 방법
14 14
제 13항에 있어서, 상기 병렬구조 인식은 상기 판단 결과 구문 노드 파싱해야 할 부분문장의 크기가 특정길이 이상이면, 구문패턴에 의한 병렬 구조 후보를 생성하는 단계와, 상기 병력 구조의 각 후보에 대한 병렬노드 인식 수단 및 구문노드 제약을 통한 병렬구조를 선택하는 단계를 포함하는 자동 번역 방법
15 15
제 5 항에 있어서, 상기 (e) 단계는(e1) 상기 (c) 단계에서 구축된 구문 및 문장 번역 패턴을 사용하여 입력되는 원시 언어 문서의 구조적 변환을 수행하여 목표 언어의 문장 구조로 변환하는 단계와,(e2) 단일어 및 복합명사 사전을 사용하여 원시 언어 문서에 따른 각 원시 어휘에 대한 최적의 대역어를 선택하여 어휘 레벨에서의 변환을 수행하는 단계와, (e3) 상기의 구조 변환 및 어휘 변환 결과들을 바탕으로 변환 자료 구조를 생성하는 단계를 포함하는 자동 번역 방법
16 16
제 15 항에 있어서,상기 (e1) 단계의 구조적 변환은 문장 단위, 절 단위, 구 단위로 수행되는 것을 특징으로 하는 자동 번역 방법
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US07747427 US 미국 FAMILY
2 US20070150260 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2007150260 US 미국 DOCDBFAMILY
2 US7747427 US 미국 DOCDBFAMILY
국가 R&D 정보가 없습니다.