맞춤기술찾기

이전대상기술

형태소 분석기를 위한 미등록 명사 추정 장치 및 방법

  • 기술번호 : KST2015016781
  • 담당센터 :
  • 전화번호 :
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 형태소 분석기를 위한 미등록 명사 추정 장치 및 방법에 관한 것으로, 상세하게는, 미리 형태소들을 등록하고 등록된 정보를 이용하여 형태소 분석을 수행할 때 등록되지 않은 미등록어의 경우에는 정상적으로 분석하지 못하는 문제점을 해결하기 위하여, 미등록 명사가 포함된 어절의 경우에 좌측부분L과 우측부분R로 나누고 우측부분R이 기분석 사전에 존재하면 좌측부분의 길이, 우측부분의 길이 및 제안된 수학식을 이용하여 좌측부분의 빈도 점수를 계산하며, 기분석 사전에서 검색된 우측부분이 빈도, 계산된 좌측부분의 빈도 점수, 및 좌측부분과 우측부분 간 조합 가능성 정도를 곱하여 후보 점수를 계산함으로써 가장 높은 점수의 미등록 명사 추정 후보를 미등록 명사로 추정하는 형태소 분석기를 위한 미등록 명사 추정 장치 및 방법을 개시한다.
Int. CL G06F 17/27 (2006.01) G06F 17/28 (2006.01)
CPC G06F 40/20(2013.01) G06F 40/20(2013.01) G06F 40/20(2013.01)
출원번호/일자 1020140170717 (2014.12.02)
출원인 울산대학교 산학협력단
등록번호/일자 10-1630082-0000 (2016.06.07)
공개번호/일자 10-2016-0066387 (2016.06.10) 문서열기
공고번호/일자 (20160613) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2014.12.02)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 울산대학교 산학협력단 대한민국 울산광역시 남구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 옥철영 대한민국 울산광역시 남구
2 신준철 대한민국 울산광역시 남구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김종선 대한민국 서울특별시 강남구 역삼로*길 **, 광성빌딩 **층 (역삼동)(케이엘피특허법률사무소)
2 이형석 대한민국 서울특별시 강남구 역삼로*길 **, 광성빌딩 **층 (역삼동)(케이엘피특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 울산대학교 산학협력단 대한민국 울산광역시 남구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2014.12.02 수리 (Accepted) 1-1-2014-1173509-49
2 선행기술조사의뢰서
Request for Prior Art Search
2015.04.10 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2015.06.10 수리 (Accepted) 9-1-2015-0039572-60
4 의견제출통지서
Notification of reason for refusal
2015.11.20 발송처리완료 (Completion of Transmission) 9-5-2015-0807718-81
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2015.12.18 수리 (Accepted) 1-1-2015-1247120-96
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2015.12.18 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2015-1247121-31
7 등록결정서
Decision to grant
2016.05.31 발송처리완료 (Completion of Transmission) 9-5-2016-0397130-28
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2016.06.20 수리 (Accepted) 4-1-2016-5080807-13
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.07.10 수리 (Accepted) 4-1-2020-5154267-54
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
미리 형태소들이 등록되어 있는 기분석사전을 이용하여 형태소 분석을 수행하는 형태소 분석기에 의해서 계산된 형태소 분석 대상 어절의 모든 후보의 점수가 추정 임계치 g이하이면, 미등록 명사가 포함된 추정 대상 어절이라고 판단하고 추정 대상 어절을 어절 길이의 경우의 수만큼 좌측부분과 우측부분으로 나누어 각 좌측부분 및 우측부분에 대하여 미등록 명사 추정 후보의 점수를 계산하며, 가장 높은 점수의 미등록 명사 추정 후보를 미등록 명사로 추정하고 추정된 미등록 명사를 수집하는 미등록 명사 추정/수집부; 및 상기 형태소 분석 대상 어절에 대해 분석된 형태소를 태깅하고 상기 추정 대상 어절에 대해 추정된 미등록 명사를 태깅하는 태깅부;를 포함하는 형태소 분석기를 위한 미등록 명사 추정 장치
2 2
제 1 항에 있어서, 추정 대상 어절을 출력하는 디스플레이부; 및 상기 출력된 추정 대상 어절을 확인한 사용자로부터 미등록 명사 여부를 결정하는 결정 신호를 입력받는 입력부를 더 포함하며,상기 미등록 명사 추정/수집부는, 상기 미등록 명사 추정 후보의 가장 높은 점수가 반자동 임계치 이하이면 상기 추정 대상 어절의 출력 및 수집을 결정하고 상기 입력부로부터 입력된 사용자의 결정 신호가 미등록 명사를 나타내는 경우에 상기 추정 대상 어절이 미등록 명사임을 결정하는, 형태소 분석기를 위한 미등록 명사 추정 장치
3 3
제 1 항 또는 제 2 항에 있어서, 상기 미등록 명사 추정/수집부는, 상기 추정 대상 어절을 어절 길이의 경우의 수만큼 좌측부분과 우측부분으로 나누어 각 좌측부분 및 그의 우측부분에 대하여 미등록 명사 추정 후보의 점수를 계산하되,좌측부분에 대응되는 우측부분이 기분석 사전에 존재하는지를 확인하고, 기분석 사전에 존재하는 우측부분의 길이, 상기 좌측부분의 길이 및 수학식을 이용하여 상기 좌측부분의 빈도 점수를 계산하며,상기 계산된 좌측부분의 빈도 점수, 기분석 사전에 존재하는 우측부분의 빈도로부터 수정된 빈도값, 상기 좌측부분 및 상기 우측부분의 조합 가능성 정도를 곱하여 미등록 명사 추정 후보의 점수를 계산하는, 형태소 분석기를 위한 미등록 명사 추정 장치
4 4
제 3항에 있어서, 상기 좌측부분의 빈도 점수를 계산하기 위한 상기 수학식은, 이고, l은 미등록 명사 부분 점수이며, sr은 우측부분인 조사부분의 길이, sl은 좌측부분인 미등록 명사 부분의 길이, 그리고 a,b,c,d,e는 상수이며,상기 기분석 사전에 존재하는 우측부분의 빈도로부터 수정된 빈도값은, r'=rf이고, r은 우측부분인 조사부분의 기분석 사전에 존재하는 빈도이며, r'는 수정된 빈도값이고, f는 상수인 것을 특징으로 하는 형태소 분석기를 위한 미등록 명사 추정 장치
5 5
형태소 분석시 미등록 명사를 추정 또는 인식하는 장치에 있어서,형태소 분석 대상 어절의 모든 후보의 점수가 추정 임계치 g 이하이면, 형태소 분석 대상 어절이 미등록 명사가 포함된 추정 대상 어절이라고 판단하여 미등록 명사 추정을 시도하는 제 1 단계;추정 대상 어절을 어절 길이의 경우의 수만큼 좌측부분과 우측부분으로 나누어 각 좌측부분 및 우측부분에 대하여 미등록 명사 추정 후보의 점수를 계산하는 제 2 단계; 및 가장 높은 점수의 미등록 명사 추정 후보를 미등록 명사로 추정하는 제 3 단계;를 포함하는 형태소 분석기를 위한 미등록 명사 추정 방법
6 6
제 5항에 있어서, 상기 미등록 명사 추정 후보들의 가장 높은 점수가 반자동 임계치 이하이면 상기 추정 대상 어절을 출력하는 단계; 및상기 추정 대상 어절을 확인한 사용자로부터 미등록 명사 여부를 결정하는 결정 신호를 입력받아 미등록 명사 여부를 결정하는 단계를 더 포함하는 형태소 분석기를 위한 미등록 명사 추정 방법
7 7
제 5 항 또는 제 6 항에 있어서, 상기 제 2 단계는,좌측부분에 대응되는 우측부분이 기분석 사전에 존재하는지를 확인하는 단계;기분석 사전에 존재하는 우측부분의 길이, 상기 좌측부분의 길이 및 수학식을 이용하여 상기 좌측부분의 빈도 점수를 계산하는 단계; 및상기 계산된 좌측부분의 빈도 점수, 기분석 사전에 존재하는 우측부분의 빈도로부터 수정된 빈도값, 상기 좌측부분 및 상기 우측부분의 조합 가능성 정도를 곱하여 미등록 명사 추정 후보의 점수를 계산하는 단계를 포함하는 형태소 분석기를 위한 미등록 명사 추정 방법
8 8
제 7 항에 있어서, 상기 좌측부분의 빈도 점수를 계산하기 위한 상기 수학식은, 상기 우측부분의 길이가 길수록 점수가 높아지고 상기 좌측부분의 길이가 길수록 점수가 낮아지게 계산되도록 형성되며,상기 기분석 사전에 존재하는 우측부분의 빈도로부터 수정된 빈도값은,상기 기분석 사전에 존재하는 조사 부분의 길이가 짧을수록 후보 점수가 높아지는 성향을, 길이가 길수록 점수가 높아지도록 보상하기 위하여 수정된 값인 것을 특징으로 하는 형태소 분석기를 위한 미등록 명사 추정 방법
9 9
제 7 항에 있어서, 상기 좌측부분의 빈도 점수를 계산하기 위한 상기 수학식은, 이고, l은 미등록 명사 부분 점수이며, sr은 우측부분인 조사부분의 길이, sl은 좌측부분인 미등록 명사 부분의 길이, 그리고 a,b,c,d,e는 상수이며,상기 기분석 사전에 존재하는 우측부분의 빈도로부터 수정된 빈도값은, r'=rf이고, r은 우측부분인 조사부분의 기분석 사전에 존재하는 빈도이며, r'는 수정된 빈도값이고, f는 상수인 것을 특징으로 하는 형태소 분석기를 위한 미등록 명사 추정 방법
10 10
제 5 항 또는 제 6 항에 있어서, 상기 제 2 단계는,좌측부분의 길이가 1개인 경우부터 어절 전체 길이인 경우까지 순차적으로 반복 수행되는 것을 특징으로 하는 형태소 분석기를 위한 미등록 명사 추정 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 포항공과대학교산학협력단 SW컴퓨팅산업원천기술개발 비기호적 기법 기반 인간모사형 자가학습 지능 원천기술 개발
2 교육과학기술부 울산대학교산학협력단 일반연구자지원사업(리서치/지역대학) 기계학습 기반 형태소 분석기의 도메인 최적화와 개체명 인식 기능