맞춤기술찾기

이전대상기술

커널 RDR을 이용한 태깅 말뭉치 오류 자동수정방법

  • 기술번호 : KST2019035704
  • 담당센터 : 부산기술혁신센터
  • 전화번호 : 051-606-6561
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 자연어 처리에서 기계학습을 위한 학습 말뭉치 내의 오류를 자동으로 수정하는 방법에 관한 것으로, 본 발명에 따르면, 자연어처리에서 인식 및 분류기 모델을 생성하기 위해 필요한 학습 말뭉치를 사람이 직접 작성함으로 인해 오류의 패턴이 불규칙하여 오류 수정을 위한 규칙을 작성하는데 어려움이 있었던 종래기술의 말뭉치 오류수정방법들의 문제점을 해결하기 위해, RDR(Ripple-Down Rule)을 이용하여 오류 말뭉치와 정답 말뭉치에서 태깅된 문서의 특성을 반영한 수정규칙을 자동으로 생성하고, 기계학습을 위한 학습 말뭉치 내의 오류를 인식하여 형태소 분석 말뭉치와 개체명 말뭉치의 오류를 수정하여 대량의 말뭉치 제작시 오류를 최소화할 수 있으며, 또한, 형태소 단위로 동작하여 한국어 말뭉치의 특성을 적용 가능한 동시에, RDR 시스템에 커널이 동작하도록 구성됨으로써 커널 교체만으로 다양한 태그 말뭉치에 적용할 수 있도록 구성되는 커널 RDR을 이용한 태깅 말뭉치 오류 자동수정방법이 제공된다.
Int. CL G06F 17/27 (2006.01.01)
CPC G06F 40/205(2013.01) G06F 40/205(2013.01)
출원번호/일자 1020160104123 (2016.08.17)
출원인 창원대학교 산학협력단
등록번호/일자 10-1813683-0000 (2017.12.22)
공개번호/일자
공고번호/일자 (20171229) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2016.08.17)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 창원대학교 산학협력단 대한민국 경상남도 창원시 의창구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 차정원 경상남도 창원시 성산구
2 박태호 대전시 서구
3 신창욱 경상남도 김해시 가락로 ***
4 박다솔 경상남도 김해시
5 박성재 경상남도 창원시 의창구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김정수 대한민국 서울시 송파구 올림픽로 ***(방이동) *층(이수국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 창원대학교 산학협력단 경상남도 창원시 의창구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.08.17 수리 (Accepted) 1-1-2016-0796010-15
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2016.11.11 수리 (Accepted) 4-1-2016-5164273-80
3 의견제출통지서
Notification of reason for refusal
2017.06.21 발송처리완료 (Completion of Transmission) 9-5-2017-0431853-42
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2017.08.18 수리 (Accepted) 1-1-2017-0800419-59
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2017.08.18 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2017-0800420-06
6 [출원서등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2017.12.07 수리 (Accepted) 1-1-2017-1218794-37
7 등록결정서
Decision to grant
2017.12.13 발송처리완료 (Completion of Transmission) 9-5-2017-0875409-85
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.11.04 수리 (Accepted) 4-1-2019-5229792-25
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.03.30 수리 (Accepted) 4-1-2020-5073723-40
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
자연어처리를 위한 학습 말뭉치를 사람이 직접 작성함으로 인해 오류의 패턴이 불규칙하여 오류수정을 위한 규칙을 작성하는데 어려움이 있었던 종래기술의 말뭉치 오류수정방법들의 문제점을 해결하기 위한 일련의 처리과정이 컴퓨터나 전용의 하드웨어에 의해 자동으로 수행되도록 구성되는 커널(kernel) RDR(Ripple-Down Rules)을 이용한 태깅 말뭉치 오류 자동수정방법에 있어서, 상기 컴퓨터나 상기 전용의 하드웨어의 입력수단을 통하여, 학습대상이 되는 문장 또는 문서가 입력되는 입력단계; 상기 컴퓨터나 상기 전용의 하드웨어의 처리수단을 통하여, 상기 입력단계에서 입력된 문장이나 문서 전체에 대한 오류 및 정답에 대한 학습이 수행되는 학습단계; 상기 컴퓨터나 상기 전용의 하드웨어의 처리수단을 통하여, 상기 학습단계의 학습결과에 근거하여 미리 정해진 임계값과 커널에 따라 오류 패턴을 분석하고 오류 수정을 위한 규칙(Rules)을 생성하는 처리가 수행되는 규칙생성단계; 및 상기 컴퓨터나 상기 전용의 하드웨어의 처리수단을 통하여, 상기 규칙생성단계에서 생성된 규칙을 이용하여 오류수정 대상이 되는 문장이나 문서의 오류를 수정하고 상기 컴퓨터나 상기 전용의 하드웨어의 표시수단을 통하여 수정된 결과를 표시하는 처리가 수행되는 오류수정단계를 포함하여 구성되고, 상기 학습단계는, 한국어 형태소 품사 태깅과 개체명 태깅에서 나타나는 특징을 학습할 수 있도록 잘못 분석된 형태소로 인해 오류 문장과 정답 문장간의 형태소가 다를 경우 해당 문장의 형태소를 정답 문장의 형태로 변형하여 학습하고, 생성된 규칙이 단어에 상관없이 같은 유형의 오류에 적용될 수 있도록 의미형태소를 삭제하고 품사태그만을 이용하여 학습을 수행하는 처리가 수행되도록 구성되는 것을 특징으로 하는 커널 RDR을 이용한 태깅 말뭉치 오류 자동수정방법
2 2
제 1항에 있어서, 상기 학습단계는, SCRDR(Single Classification Ripple Down Rules)을 이용하여, 사용자에 의해 입력된 임계값에 따라 상기 입력단계에서 입력된 문장이나 문서 전체에 대하여 초벌 코퍼스(Initial Corpus)와 정답 코퍼스(Gold Corpus)를 각각 학습하는 처리가 수행되도록 구성되는 것을 특징으로 하는 커널 RDR을 이용한 태깅 말뭉치 오류 자동수정방법
3 3
삭제
4 4
제 2항에 있어서, 상기 방법은, 동일한 형태소에 다른 품사가 부착된 개체명 태깅 오류 유형에 대하여, 개체명 의미인식 오류와 개체명 인식범위 오류는 제외하고, 잘못된 개체명 태그를 부착한 오류와 개체명이 아닌 단어를 개체명으로 인식한 오류만을 학습하고 오류를 수정하는 처리가 수행되도록 구성되는 것을 특징으로 하는 커널 RDR을 이용한 태깅 말뭉치 오류 자동수정방법
5 5
제 4항에 있어서, 상기 규칙생성단계는, 사용자에 의해 입력되는 상기 임계값과 미리 생성된 상기 커널을 바탕으로 하여 상기 SCRDR로 학습된 정보를 'Rule' 파일로 생성하는 처리가 수행되도록 구성되는 것을 특징으로 하는 커널 RDR을 이용한 태깅 말뭉치 오류 자동수정방법
6 6
제 5항에 있어서, 상기 커널은, 학습 말뭉치에 따라 변경이 가능하도록 형태소 단위와 어절 단위 모두를 기준으로 하여 각각의 유형별로 구성되는 형태소 품사 태그 커널 및 개체명 태크 커널을 포함하여 구성되고, 상기 형태소 품사 태그 커널은, 형태소는 이전 어절의 첫 형태소와 품사 및 마지막 형태소와 다음 어절의 첫 형태소 및 마지막 형태소를 사용하며, 어절을 무시하고 이전의 3개 형태소와 다음의 3개 형태소를 사용하고, 품사는 상기 형태소와 동일하게 사용하여 생성되며, 상기 개체명 태그 커널은, 이전 어절의 형태소와 다음 어절의 형태소를 사용하고, 어절을 무시하고 이전의 2개의 형태소와 다음의 2개의 형태소를 사용하여 생성되는 것을 특징으로 하는 커널 RDR을 이용한 태깅 말뭉치 오류 자동수정방법
7 7
제 6항에 있어서, 상기 오류수정단계는, 상기 규칙생성단계에서 생성된 상기 'Rule' 파일을 읽어들여 오류수정 대상이 되는 문서에 적용하고, 오류로 판단된 태그를 학습된 정답 태그로 변경하는 처리가 수행되도록 구성되는 것을 특징으로 하는 커널 RDR을 이용한 태깅 말뭉치 오류 자동수정방법
8 8
청구항 1항, 청구항 2항, 청구항 4항 내지 청구항 7항 중 어느 한 항에 기재된 커널 RDR을 이용한 태깅 말뭉치 오류 자동수정방법을 컴퓨터에 실행시키도록 구성되는 프로그램이 기록된 컴퓨터에서 판독 가능한 기록매체
9 9
입력된 문장이나 문서의 오류를 자동으로 수정하도록 구성되는 자동 말뭉치 오류 수정시스템에 있어서, 사용자가 각종 정보를 입력하기 위한 입력부; 상기 입력부를 통해 입력된 문서의 오류를 수정하는 처리부; 및 상기 처리부의 처리 결과를 사용자에게 표시하는 출력부를 포함하여 구성되고, 상기 처리부는, 청구항 1항, 청구항 2항, 청구항 4항 내지 청구항 7항 중 어느 한 항에 기재된 커널 RDR을 이용한 태깅 말뭉치 오류 자동수정방법을 이용하여 입력된 문서의 오류를 수정하는 처리가 수행되도록 구성되는 것을 특징으로 하는 자동 말뭉치 오류 수정시스템
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 WO2018034426 WO 세계지적재산권기구(WIPO) FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 WO2018034426 WO 세계지적재산권기구(WIPO) DOCDBFAMILY
국가 R&D 정보가 없습니다.