맞춤기술찾기

이전대상기술

병렬 말뭉치를 이용한 중국어 단어분리 성능 향상 방법 및 장치

  • 기술번호 : KST2015098594
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 중국어 단어분리 성능 향상 방법 및 그 장치에 관한 것으로써, 보다 구체적으로는 중국어 단어분리기에 자주 나타나는 미등록어 오류와 모호성 오류를 줄이기 위해 중국어의 단어 분리 오류를 단어의 경계가 명확한 병렬 말뭉치의 타언어, 예를 들어 영어나 한국어 문장으로부터 그 단어의 정확한 경계를 자동 인식하여 처리함으로써 단어분리 성능을 개선하고자 하는 방법 및 장치에 관한 것이다. 본 발명에 의하여, 중국어 문장의 단어분리 시에 처리하기 힘든 미등록어 오류와 모호성 오류에 대하여 병렬 말뭉치를 통해 지속적으로 추출하고 정정된 단어분리 정보를 저장함으로써, 대량의 인력, 시간을 소모하여 단어분리 결과에서 오류를 확인하는 한계를 극복할 수 있다.
Int. CL G06F 17/27 (2006.01) G06F 17/20 (2006.01)
CPC G06F 40/00(2013.01) G06F 40/00(2013.01) G06F 40/00(2013.01)
출원번호/일자 1020120125764 (2012.11.08)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2014-0059877 (2014.05.19) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2015.09.25)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김운 중국 대전 유성구
2 김창현 대한민국 대전 유성구
3 양성일 대한민국 대전 유성구
4 황금하 중국 대전 유성구
5 신종훈 대한민국 대전 유성구
6 나승훈 대한민국 대전광역시 유성구
7 권오욱 대한민국 대전 서구
8 노윤형 대한민국 대전 유성구
9 이기영 대한민국 대전 서구
10 최승권 대한민국 대전 유성구
11 박은진 대한민국 대전 유성구
12 정상근 대한민국 대전광역시 중구
13 서영애 대한민국 대전 유성구
14 김영길 대한민국 대전 서구
15 박상규 대한민국 대전 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인지명 대한민국 서울특별시 강남구 남부순환로**** 차우빌딩*층

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2012.11.08 수리 (Accepted) 1-1-2012-0916608-30
2 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2013.09.03 수리 (Accepted) 1-1-2013-0805883-33
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
4 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2015.09.25 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2015-0938279-20
5 [심사청구]심사청구(우선심사신청)서
[Request for Examination] Request for Examination (Request for Preferential Examination)
2015.09.25 수리 (Accepted) 1-1-2015-0938281-12
6 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2016.09.27 수리 (Accepted) 1-1-2016-0937903-80
7 의견제출통지서
Notification of reason for refusal
2016.10.20 발송처리완료 (Completion of Transmission) 9-5-2016-0755919-32
8 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2016.12.19 수리 (Accepted) 1-1-2016-1244190-91
9 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2016.12.19 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2016-1244189-44
10 등록결정서
Decision to grant
2017.04.28 발송처리완료 (Completion of Transmission) 9-5-2017-0308779-19
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
중국어 단어분리 장치에 있어서,적어도 하나의 단어를 포함하는 중국어 단어 조합을 입력 받고, 상기 입력된 중국어 단어 조합을 기 설정된 제1기준에 따라 단어 단위로 분리한 중국어 문자열을 획득하는 중국어 단어 분리부;상기 중국어 단어 조합에 대응하는 번역문인 타언어 단어 조합을 이용하여, 상기 입력된 중국어 단어 조합에 포함된 각 단어의 형태소 정보를 획득하는 형태소 분석부;상기 타언어 단어조합에 포함된 각 단어의 형태소 정보를 이용하여, 상기 단어 단위로 분리된 중국어 문자열에 포함된 오류 정보를 탐지하는 오류 탐지부;상기 오류 정보를 고려하여 상기 중국어 문자열을 정정하는 정정부; 및상기 오류 정보 및 상기 정정된 중국어 문자열을 이용하여 상기 제1기준을 갱신하는 개선부를 포함하는 병렬말뭉치를 이용한 중국어 단어분리 장치
2 2
제1항에 있어서,상기 오류탐지부는 상기 단어 단위로 분리된 중국어 문자열에서 연속된 한 글자 단어로 분리된 문자열에 대응하는 타언어의 단어 조합이 하나의 단어인 경우에, 상기 연속된 한 글자 단어로 분리된 문자열 및 해당 문자열에 대응하는 타언어 단어 조합을 상기 오류정보로 탐지하는 것을 특징으로 하는 병렬말뭉치를 이용한 중국어 단어분리 장치
3 3
제1항에 있어서,상기 오류탐지부는 중국어 순차 및 역차 최장일치 기법을 이용하여 상기 단어 단위로 분리된 중국어 문자열을 다시 단어 분리 수행하여 상기 순차 및 역차 최장일치 기법에 따른 각각의 단어단위로 분리된 중국어 문자열을 얻고 상기 각각의 문자열을 비교하여 서로 다른 문자열이 존재하는 경우에, 상기 서로 다른 중국어 문자열 및 상기 문자열에 대응하는 타언어 단어조합을 상기 오류 정보로 탐지하는 것을 특징으로 하는 병렬말뭉치를 이용한 중국어 단어분리 장치
4 4
제1항에 있어서,상기 오류탐지부는 상기 단어 단위로 분리된 중국어 문자열에 고빈도 기능어가 포함되는 경우에, 상기 고빈도 기능어가 포함된 중국어 문자열 및 상기 문자열에 대응하는 타언어 단어 조합을 상기 오류 정보로 탐지하는 것을 특징으로 하는 병렬말뭉치를 이용한 중국어 단어분리 장치
5 5
제1항에 있어서,상기 정정부는 상기 단어 단위로 분리된 중국어 문자열에서 연속된 한 글자 단어로 분리된 문자열과 해당 문자열에 대응하는 타언어 단어 조합의 음역 유사성 비교 혹은 웹 검색을 통해 상기 연속된 한 글자 단어로 분리된 중국어 문자열을 정정하는 것을 특징으로 하는 병렬말뭉치를 이용한 중국어 단어분리 장치
6 6
제1항에 있어서,상기 정정부는 상기 오류정보를 포함하는 중국어 문자열에 대응하는 타언어 단어조합이 상기 번역문에 등장하는 빈도를 고려하여 상기 중국어 문자열을 정정하는 것을 특징으로 하는 병렬말뭉치를 이용한 중국어 단어분리 장치
7 7
중국어 단어분리 방법에 있어서,적어도 하나의 단어를 포함하는 중국어 단어 조합을 입력 받고, 상기 입력된 중국어 단어 조합을 기 설정된 제1기준에 따라 단어 단위로 분리한 중국어 문자열을 획득하는 단계; 상기 중국어 단어 조합에 대응하는 번역문인 타언어 단어 조합을 이용하여, 상기 입력된 중국어 단어 조합에 포함된 각 단어의 형태소 정보를 획득하는 단계; 상기 타언어 단어 조합에 포함된 각 단어의 형태소 정보를 이용하여, 상기 단어 단위로 분리된 중국어 문자열의 오류 정보를 탐지하는 단계; 상기 오류 정보를 고려하여 상기 중국어 문자열을 정정하는 단계; 및 상기 오류 정보 및 정정된 중국어 문자열을 이용하여 상기 제1기준을 갱신하는 단계를 포함하는 병렬말뭉치를 이용한 중국어 단어분리 방법
8 8
제7항에 있어서,상기 오류 정보를 탐지하는 단계에서, 상기 단어 단위로 분리된 중국어 문자열에서 연속된 한 글자 단어로 분리된 문자열에 대응하는 타언어의 단어 조합이 하나의 단어인 경우에, 상기 연속된 한 글자 단어로 분리된 문자열 및 상기 문자열에 대응하는 타언어 단어 조합을 상기 오류정보로 탐지하는 것을 특징으로 하는 병렬말뭉치를 이용한 중국어 단어분리 방법
9 9
제7항에 있어서,상기 오류 정보를 탐지하는 단계에서, 중국어 순차 및 역차 최장일치 기법을 이용하여 상기 단어 단위로 분리된 중국어 문자열을 다시 단어 분리 수행하여 상기 순차 및 역차 최장일치 기법에 따른 각각의 단어단위로 분리된 중국어 문자열을 얻고 상기 각각의 문자열을 비교하여 서로 다른 문자열이 존재하는 경우에, 상기 서로 다른 중국어 문자열 및 상기 문자열에 대응하는 타언어 단어조합을 상기 오류 정보로 탐지하는 것을 특징으로 하는 병렬말뭉치를 이용한 중국어 단어분리 방법
10 10
제7항에 있어서,상기 오류 정보를 탐지하는 단계에서, 상기 단어 단위로 분리된 중국어 문자열에 고빈도 기능어가 포함되는 경우에, 상기 고빈도 기능어가 포함된 중국어 문자열 및 상기 문자열에 대응하는 타언어 단어 조합을 상기 오류 정보로 탐지하는 것을 특징으로 하는 병렬말뭉치를 이용한 중국어 단어분리 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 지경부 ETRI 산업융합원천기술개발사업(정보통신) 지식학습 기반의 다국어 확장이 용이한 관광/국제행사 통역률 90%급 자동 통번역 소프트웨어 원천 기술 개발