맞춤기술찾기

이전대상기술

단어레벨의 통계적 방법을 이용한 번역문 생성 방법 및 그장치

  • 기술번호 : KST2015078789
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명에 의한 단어레벨의 통계적 방법을 이용한 번역문 생성 방법 및 그 장치는 대상 언어 코퍼스로부터 통계적으로 순서 정보를 생성하여 저장하는 단계; 대역 사전 데이터베이스를 구비하는 단계; 원시 언어 문장을 입력받아 형태소를 분석하는 단계; 상기 형태소별로 구분된 상기 원시 언어 문장을 구성하는 소정의 제1품사들에 해당하는 단어들을 변수화하고 소정의 제2품사들에 해당하는 단어들은 은닉한 후 형태소가 태깅된 문장으로 구성하는 단계; 상기 태깅된 문장을 입력받아 상기 대역 사전 데이터베이스로부터 해당되는 형태소별로 대상 언어 단어로 교체하고, 상기 대상 언어로 교체된 문장의 단어를 상기 순서 정보를 기초로 배열하는 단계; 상기 변수화된 품사의 원래의 단어를 복구하여 상기 교체된 대상 언어에 삽입하고 상기 은닉된 단어들을 복원하는 단계; 및 상기 태깅을 제거한 후 상기 원시 언어 문장 및 대상 언어의 특성에 따른 생성정보를 기초로 번역문을 출력하는 단계;를 포함하는 것을 특징으로 하며, 대화체 영역에서 대규모 대상 언어 코퍼스를 이용하여 통계적 방식으로 추출한 순서정보 데이터 베이스를 구성한 후 이용하여 번역문을 생성함으로써 고품질 및 고속의 번역문 생성이 가능하다. 자동번역, 통계적 번역 방법, 번역문, 코퍼스
Int. CL G06F 17/28 (2006.01)
CPC G06F 17/2818(2013.01) G06F 17/2818(2013.01)
출원번호/일자 1020020079265 (2002.12.12)
출원인 한국전자통신연구원
등록번호/일자 10-0487716-0000 (2005.04.27)
공개번호/일자 10-2004-0051351 (2004.06.18) 문서열기
공고번호/일자 (20050503) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2002.12.12)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 최미란 대한민국 대전광역시유성구
2 박준 대한민국 대전광역시유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이영필 대한민국 서울 강남구 언주로 **길 **, *층, **층, **층, **층(도곡동, 대림아크로텔)(리앤목특허법인)
2 이해영 대한민국 서울 강남구 언주로 **길 **, *층, **층, **층, **층(도곡동, 대림아크로텔)(리앤목특허법인)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2002.12.12 수리 (Accepted) 1-1-2002-0413400-97
2 선행기술조사의뢰서
Request for Prior Art Search
2004.06.09 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2004.07.14 수리 (Accepted) 9-1-2004-0043654-75
4 의견제출통지서
Notification of reason for refusal
2004.10.13 발송처리완료 (Completion of Transmission) 9-5-2004-0426765-55
5 지정기간연장신청서
Request for Extension of Designated Period
2004.12.10 수리 (Accepted) 1-1-2004-0582513-35
6 의견서
Written Opinion
2005.01.13 수리 (Accepted) 1-1-2005-0019189-18
7 등록결정서
Decision to grant
2005.04.04 발송처리완료 (Completion of Transmission) 9-5-2005-0155491-06
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
(a) 대상 언어 코퍼스로부터 통계적으로 순서 정보를 생성하여 저장하는 단계; (b) 대역 사전 데이터베이스를 구비하는 단계; (c) 원시 언어 문장을 입력받아 형태소를 분석하는 단계; (d) 상기 형태소별로 구분된 상기 원시 언어 문장을 구성하는 소정의 제1품사들에 해당하는 단어들을 변수화하고 소정의 제2품사들에 해당하는 단어들은 은닉한 후 형태소가 태깅된 문장으로 구성하는 단계; (e) 상기 태깅된 문장을 입력받아 상기 대역 사전 데이터베이스로부터 해당되는 형태소별로 대상 언어 단어로 교체하고, 상기 대상 언어로 교체된 문장의 단어를 상기 순서 정보를 기초로 배열하는 단계; (f) 상기 변수화된 품사의 원래의 단어를 복구하여 상기 교체된 대상 언어에 삽입하고 상기 은닉된 단어들을 복원하는 단계; 및 (g) 상기 태깅을 제거한 후 상기 원시 언어 문장 및 대상 언어의 특성에 따른 생성정보를 기초로 번역문을 출력하는 단계;를 포함하는 것을 특징으로 하는 번역문 생성 방법
2 2
제1항에 있어서, 상기 (a)단계는 (a1) 상기 대상 언어 코퍼스로부터 문장을 입력받아 형태소를 분석하는 단계; (a2) 상기 형태소별로 태깅을 한 후 소정의 제1품사들에 해당하는 단어들을 변수화하고 소정의 제2품사들에 해당하는 단어들은 은닉한 후 형태소가 태깅된 문장으로 구성하는 단계; (a3) 변수화되고 형태소별로 태깅된 상기 입력문장을 구성하는 단어의 순서정보를 추출한 후 저장하는 단계;를 포함하는 것을 특징으로 하는 번역문 생성 방법
3 3
제2항에 있어서, 상기 (a3)단계는 상기 단어간의 트라이그램, 바이그램, 그리고 모노그램의 빈도수에 기초한 확률값을 저장하는 단계;를 포함하는 것을 특징으로 하는 번역문 생성 방법
4 4
제1항에 있어서, 상기 (e)단계는 (e1) 상기 대상 언어 단어가 하나 이상인 경우에는 각 단어가 삽입된 문장에 대하여 배열한 후 상기 (a)단계에서 저장된 확률값에 기초하여 그 중 하나를 선택하는 것을 특징으로 하는 번역문 생성 방법
5 5
제4항에 있어서, 상기 (e1)단계는 상기 각 단어가 배열된 문장에 대하여 대치된 단어의 의미를 반영하고, 상기 저장된 순서정보에서 트라이그램, 바이그램, 그리고 모노그램값을 추출하여 각 배열의 값을 구한 후 가장 최대값을 선택하는 것을 특징으로 하는 번역문 생성 방법
6 6
대역 사전 데이터베이스; 대상 언어 코퍼스로부터 통계적으로 순서 정보가 저장된 훈련모듈; 원시 언어 문장을 입력받아 형태소를 분석하는 형태소분석부; 상기 형태소별로 구분된 상기 원시 언어 문장을 구성하는 소정의 제1품사들에 해당하는 단어들을 변수화하고 소정의 제2품사들에 해당하는 단어들은 은닉한 후 형태소가 태깅된 문장으로 구성하는 변수화부; 상기 태깅된 문장을 입력받아 상기 대역 사전 데이터베이스로부터 해당되는 형태소별로 대상 언어 단어로 교체하고, 상기 대상 언어로 교체된 문장의 단어를 상기 순서 정보를 기초로 배열하는 단어배열부; 상기 변수화된 품사의 원래의 단어를 복구하여 상기 교체된 대상 언어에 삽입하고 상기 은닉된 단어들을 복원하는 복구부; 및 상기 태깅을 제거한 후 상기 원시 언어 문장 및 대상 언어의 특성에 따른 생성정보를 기초로 번역문을 출력하는 후처리부;를 포함하는 것을 특징으로 하는 번역문 생성 장치
7 7
제6항에 있어서, 상기 훈련모듈은 상기 대상 언어 코퍼스를 문장단위로 입력받아 형태소를 분석하는 형태소추출부; 상기 형태소별로 태깅을 한 후 소정의 품사들에 대하여 변수화하는 변수부; 변수화되고 형태소별로 태깅된 상기 입력문장을 구성하는 단어의 순서정보를 추출하는 순서정보추출부; 상기 순서정보를 저장하는 저장부;를 포함하는 것을 특징으로 하는 번역문 생성 장치
8 8
제6항에 있어서, 상기 저장부는 상기 단어간의 트라이그램, 바이그램, 그리고 모노그램의 빈도수에 기초한 확률값을 저장하는 것을 특징으로 하는 번역문 생성 장치
9 9
제6항에 있어서, 상기 단어배열부는 상기 대상 언어 단어가 하나 이상인 경우에는 각 단어가 삽입된 문장에 대하여 상기 훈련모듈의 저장부에 기록된 확률값에 기초하여 배열하는 것을 특징으로 하는 번역문 생성 장치
10 10
제9항에 있어서, 상기 단어배열부는 상기 순서정보를 생성하는 과정에서 출현하지 않는 바이그램 리스트를 작성하여 상기 리스트에 해당되는 바이그램은 제외하는 것을 특징으로 하는 번역문 생성 장치
11 11
제1항의 단계를 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
12 11
제1항의 단계를 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.