맞춤기술찾기

이전대상기술

기계 번역을 위한 문장 분할 방법

  • 기술번호 : KST2015169138
  • 담당센터 : 대구기술혁신센터
  • 전화번호 : 053-550-1450
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 통계적 기계 번역 기술에 기반한 음성 자동 통역 시스템에서 입력 문장이 길어짐에 따라 번역의 질이 떨어지는 현상을 개선하기 위한 기계 번역을 위한 문장 분할 방법에 관한 것이다. 본 발명에 따른 중문 분할 기술은 통계적 기계 번역기에 입력으로 들어오는 문장들 중 중문에 적용되어 그 문장들을 2개 이상의 짧은 문장으로 나누어 줌으로써 한 번에 번역되는 입력 문장의 길이를 줄임으로써 전체적인 번역 성능을 향상시킬 수 있다. 본 발명에서 문장 분할은 변환 기반(transformation-based) 방법론에 의해 이루어지며 이에 필요한 각 변환(transformation)들은 미리 분리된 문장 예제로부터 자동적으로 학습된다. 기계, 번역, 문장, 분할, 중문, 자동, 유발, 환경, 다시쓰기
Int. CL G06F 17/27 (2006.01)
CPC G06F 17/289(2013.01) G06F 17/289(2013.01) G06F 17/289(2013.01)
출원번호/일자 1020070112310 (2007.11.05)
출원인 포항공과대학교 산학협력단
등록번호/일자
공개번호/일자 10-2009-0046280 (2009.05.11) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 거절
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2007.11.05)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 포항공과대학교 산학협력단 대한민국 경상북도 포항시 남구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이종훈 대한민국 경북 포항시 남구
2 이근배 대한민국 경북 포항시 남구
3 이동현 대한민국 경북 포항시 남구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 리앤목특허법인 대한민국 서울 강남구 언주로 **길 **, *층, **층, **층, **층(도곡동, 대림아크로텔)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2007.11.05 수리 (Accepted) 1-1-2007-0794085-60
2 [전자문서첨부서류]전자문서첨부서류등 물건제출서
[Attachment to Electronic Document] Submission of Object such as Attachment to Electronic Document
2007.11.06 수리 (Accepted) 1-1-2007-5089127-81
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2007.12.28 수리 (Accepted) 4-1-2007-5195152-79
4 선행기술조사의뢰서
Request for Prior Art Search
2008.06.11 수리 (Accepted) 9-1-9999-9999999-89
5 선행기술조사보고서
Report of Prior Art Search
2008.07.14 수리 (Accepted) 9-1-2008-0042862-35
6 의견제출통지서
Notification of reason for refusal
2009.01.30 발송처리완료 (Completion of Transmission) 9-5-2009-0043932-39
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2009.03.24 수리 (Accepted) 1-1-2009-0176711-95
8 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2009.03.24 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2009-0176712-30
9 거절결정서
Decision to Refuse a Patent
2009.07.31 발송처리완료 (Completion of Transmission) 9-5-2009-0320481-14
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.06.13 수리 (Accepted) 4-1-2013-0025573-58
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.02.25 수리 (Accepted) 4-1-2014-5024386-11
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.11.20 수리 (Accepted) 4-1-2019-5243581-27
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.11.22 수리 (Accepted) 4-1-2019-5245997-53
14 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.11.25 수리 (Accepted) 4-1-2019-5247115-68
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
기계 번역을 위한 문장 분할 방법에 있어서, 중문 분리의 예제를 데이터베이스로 구축하기 위해 중문 원문을 수집하는 단계; 상기 수집된 중문 원문을 접속패턴을 중심으로 앞부분 문장과 뒷부분 문장으로 분리(분할)하여 데이터베이스화하는 단계; 상기 앞부분 문장과 뒷부분 문장에 대해 형태소 분석을 하는 단계;를 포함하는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
2 2
제1항에 있어서, 상기 중문 분리의 예제로부터 다시쓰기 규칙과 접속 패턴에 관한 정보를 획득하는 단계를 포함하고, 상기 다시쓰기 규칙은 원문과 중문 분할 결과로 생성된 문장들을 비교하여 달라진 부분으로부터 추출하고, 달라진 부분 중 원문 쪽의 패턴을 분할 결과 쪽의 패턴으로 바꿔 쓰는 규칙이 되는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
3 3
제1항 또는 제2항에 있어서, 상기 수집된 중문 원문에서 상기 다시쓰기 규칙의 원문 쪽 패턴이 나타나는 것으로 정의되는 유발 환경을 이용하고, 상기 다시쓰기 규칙 및 유발 환경을 분할된 예제에 반영하여 각각의 예제로부터 하나씩의 초기 변환을 획득하는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
4 4
제3항에 있어서, 상기 수집된 중문 원문은 각각 분할된 후 상기 데이터베이스에 저장되어 있는 예제와 비교하여 오류가 있는지를 확인하고, 오류가 없으면 다음 원문으로 넘어가고 오류가 있다면 상기 초기 변환이 오류를 발생하지 않을 때까지 상기 유발 환경을 확장하는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
5 5
제4항에 있어서, 상기 유발 환경의 확장은 상기 초기 변환에서 설정된 패턴에서부터 그 패턴을 조금씩 늘려 나가는 것으로 진행되며, 상기 패턴은 다시 형태소 패턴과 품사 태그 패턴으로 나뉘어 관리되는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
6 6
제5항에 있어서, 상기 유발 환경의 확장은 한 번에 한 단계씩 일어나며 각 단계마다 형태소 패턴을 앞으로 확장, 형태소 패턴을 뒤로 확장, 품사태그 패턴을 앞으로 확장, 품사태그 패턴을 뒤로 확장하는 4가지 확장 방식 중 한 가지가 선택되는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
7 7
제3항에 있어서, 상기 원문의 문장에 적용되는 변환들에 대해 우선순위를 정하는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
8 8
제1항에 있어서, 상기 앞부분의 문장과 뒷부분의 문장은 각각 종결어미로 종결되는 형태를 취하는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
9 9
제1항에 있어서, 상기 형태소 분석을 통해 상기 원문의 형태소 분석 정보, 분리 후 생성된 앞부분 문장과 뒷부분 문장의 형태소 분석 정보, 분리 후 생성된 문장들 사이의 접속패턴 정보 및 상기 원문의 분리가능 여부 정보를 획득하는 단계를 포함하는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
10 10
제9항에 있어서, 상기 원문이 분리 가능하지 않은 경우에는 상기 원문 분리 후 얻어지는 정보들인 상기 앞부분 문장과 뒷부분 문장의 형태소 분석 정보 및 상기 접속패턴 정보가 존재하지 않게 되는 것을 특징으로 하는 기계 번역을 위한 문장 분할 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.