맞춤기술찾기

이전대상기술

문장 유사도 기반 다의어 데이터베이스 확장장치 및 그 방법(Sentence similarity-based polysemy database expansion apparatus and method therefor)

  • 기술번호 : KST2017010530
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 다의어 데이터베이스에 다의어의 용례를 확장하는 장치 및 기술에 관한 것으로써, 문서 수집부, 다의어 인식부, 다의어 검증부, 데이터베이스 확장부를 포함할 수 있으며, 단어 의미 중의성 해소를 위하여 사용되는 지식 데이터베이스를 자동 또는 수동으로 쉽고 빠르게 확장함으로써 다양한 분야에 적합한 다의어 인식기를 개발할 수 있도록 문장 유사도 방법에 기반해서 대상 문장과 기존 사전 용례와의 유사도를 측정해서 유사도가 높으면 자동으로 사전 용례로 추가하고, 유사도가 특정 값보다 낮으면 수작업으로 적합한 의미의 용례로 추가하여 자동 또는 수동으로 확장하는 문장 유사도 기반 다의어 데이터베이스 확장장치 및 그 방법을 제공하는데 그 목적이 있다.
Int. CL G06F 16/00 (2019.01.01) G06F 17/27 (2006.01.01)
CPC G06F 16/3334(2013.01) G06F 16/3334(2013.01) G06F 16/3334(2013.01) G06F 16/3334(2013.01) G06F 16/3334(2013.01) G06F 16/3334(2013.01) G06F 16/3334(2013.01) G06F 16/3334(2013.01)
출원번호/일자 1020150182158 (2015.12.18)
출원인 한국전자통신연구원
등록번호/일자 10-1991486-0000 (2019.06.14)
공개번호/일자 10-2017-0073354 (2017.06.28) 문서열기
공고번호/일자 (20190620) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2017.08.03)
심사청구항수 14

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이충희 대한민국 대전광역시 유성구
2 김현기 대한민국 대전광역시 유성구
3 배용진 대한민국 대전광역시 서구
4 이형직 대한민국 대전광역시 유성구
5 임수종 대한민국 대전광역시 유성구
6 임준호 대한민국 대전광역시 동구
7 장명길 대한민국 대전광역시 유성구
8 최미란 대한민국 대전광역시 유성구
9 허 정 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인지명 대한민국 서울특별시 강남구 남부순환로**** 차우빌딩*층

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2015.12.18 수리 (Accepted) 1-1-2015-1246622-25
2 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2016.09.27 수리 (Accepted) 1-1-2016-0937944-41
3 [심사청구]심사청구(우선심사신청)서
[Request for Examination] Request for Examination (Request for Preferential Examination)
2017.08.03 수리 (Accepted) 1-1-2017-0749775-56
4 의견제출통지서
Notification of reason for refusal
2018.09.05 발송처리완료 (Completion of Transmission) 9-5-2018-0606471-09
5 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2018.11.05 수리 (Accepted) 1-1-2018-1094651-87
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2018.12.05 수리 (Accepted) 1-1-2018-1218637-12
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2018.12.05 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2018-1218638-68
8 등록결정서
Decision to grant
2019.03.15 발송처리완료 (Completion of Transmission) 9-5-2019-0192145-19
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
다의어 지식 데이터베이스를 문장 유사도를 기반으로 확장하는 장치로서, 상기 다의어 지식 데이터베이스에 포함된 다의어의 의미별 용례를 추가하여 확장하기를 원하는 단어인 확장대상 단어를 선정하고, 상기 확장대상 단어가 포함되어 있는 적어도 하나의 문서를 수집하며, 상기 수집된 문서에서 상기 확장대상 단어가 포함된 확장대상 문장만을 추출하는 문서 수집부;상기 다의어 지식 데이터베이스에 상기 확장대상 단어의 의미별 용례를 추가하기 위한 문장 유사도 계산에 사용되는 다중 의미를 지닌 단어(이하, '다의어 분석대상 단어'라 함)를 선정하고, 상기 다의어 분석대상 단어의 의미별 용례 및 상기 적어도 하나의 확장대상 문장에 대하여 형태소 분석을 수행하며, 상기 수행된 형태소 분석 결과에 따라 상기 다의어 분석대상 단어의 의미별 용례와 상기 확장대상 문장을 비교하여 유사도를 계산하고, 상기 계산 결과에 따라 다의어 의미를 분류하는 다의어 인식부;상기 분류된 다의어 의미에 대한 신뢰도를 계산하고, 상기 계산된 신뢰도를 미리 설정된 임계 값과 비교하여 상기 확장대상 문장이 다의어 의미의 용례로 사용될 수 있을지 여부를 검증하여 상기 확장대상 문장이 용례로 사용될 수 있는 다의어 의미를 확정하는 다의어 검증부; 및 상기 확정된 다의어 의미에 대한 용례로 상기 확장대상 문장을 다의어 데이터베이스에 추가하는 데이터베이스 확장부를 포함하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장장치
2 2
제 1 항에 있어서 상기 문서 수집부는,자동 또는 수동으로 용례의 확장을 원하는 단어를 선정하는 확장대상 단어 선정부;상기 선정된 확장대상 단어가 포함된 문서를 검색하는 문서 검색부; 및상기 검색된 문서로부터 상기 확장대상 단어가 포함된 확장대상 문장을 추출하는 확장대상 문장 추출부를 더 포함하는 문장 유사도 기반 다의어 데이터베이스 확장장치
3 3
제 2 항에 있어서 상기 확장대상 문장 추출부는,상기 검색된 문서 중 상기 확장대상 단어가 포함된 문장만을 남기고 다른 부분은 삭제하여 확장대상 문장을 추출하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장장치
4 4
제 1 항에 있어서 상기 다의어 인식부는,다의어 분석을 위해 상기 확장대상 단어와 동일 또는 상이한 다의어 분석대상 단어를 선정하는 다의어 분석대상 단어 선정부;상기 다의어 분석대상 단어의 의미 별 용례 및 적어도 하나의 상기 확장대상 문장에 대하여 형태소 단위로 분석을 수행하는 형태소 분석부;상기 분석된 다의어 의미 별 용례들과 확장대상 문장을 비교하여 유사도를 계산하는 다의어 문장 유사도 계산부; 및상기 계산된 유사도의 계산결과에 따라 상기 다의어 분석대상 단어의 의미 별 용례 중 가장 유사도가 높은 용례를 선정하여 다의어 의미를 분류하는 다의어 의미 분류부를 더 포함하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장장치
5 5
제 4 항에 있어서 상기 다의어 문장 유사도 계산부는,단어/형태소 일치 개수 측정방법, 문장 구조 유사도 측정방법, 벡터 근접도 측정방법 중 적어도 하나의 방법으로 유사도를 계산하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장장치
6 6
제 5 항에 있어서 상기 다의어 문장 유사도 계산부는 상기 단어/형태소 일치 개수 측정방법, 상기 문장 구조 유사도 측정방법, 상기 벡터 근접도 측정방법 중 상이한 둘 이상을 사용하여 복수의 계산단계를 수행하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장장치
7 7
제 1 항에 있어서 상기 다의어 검증부는,상기 분류된 다의어 의미의 신뢰도를 계산하는 다의어 의미 분류 신뢰도 계산부;상기 계산된 신뢰도가 미리 설정된 임계 값보다 큰 경우 대상 문장이 용례로 사용될 수 있는 다의어 의미를 확정하는 신뢰도 자동 검증부; 및상기 계산된 신뢰도가 미리 설정된 임계 값보다 작은 경우 사용자의 선택에 따라 대상 문장이 용례로 사용될 수 있는 다의어 의미를 확정하는 신뢰도 수동 검증부를 포함하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장장치
8 8
다의어 지식 데이터베이스를 문장 유사도를 기반으로 확장하는 방법으로서, 상기 다의어 지식 데이터베이스에 포함된 다의어의 의미별 용례를 추가하여 확장하기를 원하는 단어인 확장대상 단어를 선정하고, 상기 확장대상 단어가 포함되어 있는 적어도 하나의 문서를 수집하며, 상기 수집된 문서에서 상기 확장대상 단어가 포함된 확장대상 문장만을 추출하는 단계;상기 다의어 지식 데이터베이스에 상기 확장대상 단어의 의미별 용례를 추가하기 위한 문장 유사도 계산에 사용되는 다중 의미를 지닌 단어(이하, '다의어 분석대상 단어'라 함)를 선정하고, 상기 다의어 분석대상 단어의 의미 별 용례 및 적어도 하나의 상기 확장대상 문장에 대하여 형태소 분석을 수행하며, 상기 수행된 형태소 분석 결과에 따라 상기 다의어 분석대상 단어의 의미별 용례와 상기 확장대상 문장을 비교하여 유사도를 계산하고, 상기 계산 결과에 따라 다의어 의미를 분류하는 단계;상기 분류된 다의어 의미에 대한 신뢰도를 계산하고, 상기 계산된 신뢰도를 미리 설정된 임계 값과 비교하여 상기 확장대상 문장이 다의어 의미의 용례로 사용될 수 있을지 여부를 검증하여 상기 확장대상 문장이 용례로 사용될 수 있는 다의어 의미를 확정하는 단계; 및상기 확정된 다의어 의미의 용례로 상기 확장대상 문장을 데이터베이스에 추가하는 단계를 포함하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장방법
9 9
제 8 항에 있어서 상기 확장대상 문장만을 추출하는 단계,자동 또는 수동으로 용례의 확장을 원하는 단어를 선정하는 단계;상기 선정된 확장대상 단어가 포함된 문서를 검색하는 단계; 및상기 검색된 문서로부터 상기 확장대상 단어가 포함된 확장대상 문장을 추출하는 단계를 더 포함하는 문장 유사도 기반 다의어 데이터베이스 확장방법
10 10
제 9 항에 있어서 상기 확장대상 문장을 추출하는 단계는,상기 검색된 문서 중 상기 확장대상 단어가 포함된 문장만을 남기고 다른 부분은 삭제하여 확장대상 문장을 추출하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장방법
11 11
제 8 항에 있어서 상기 다의어 의미를 분류하는 단계는,다의어 분석을 위해 상기 확장대상 단어와 동일 또는 상이한 다의어 분석대상 단어를 선정하는 단계;상기 다의어 분석대상 단어의 의미 별 용례 및 적어도 하나의 상기 확장대상 문장에 대하여 형태소 단위로 분석을 수행하는 단계;상기 분석된 다의어 분석대상 단어의 의미 별 용례들과 확장대상 문장을 비교하여 유사도를 계산하는 단계; 및상기 계산된 유사도의 계산결과에 따라 상기 다의어 분석대상 단어의 의미 별 용례 중 가장 유사도가 높은 용례를 선정하여 다의어 의미를 분류하는 단계를 더 포함하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장방법
12 12
제 11 항에 있어서 상기 유사도를 계산하는 단계는,단어/형태소 일치 개수 측정방법, 문장 구조 유사도 측정방법, 벡터 근접도 측정방법 중 적어도 하나의 방법으로 유사도를 계산하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장방법
13 13
제 12 항에 있어서 상기 유사도를 계산하는 단계는 상기 단어/형태소 일치 개수 측정방법, 상기 문장 구조 유사도 측정방법, 상기 벡터 근접도 측정방법 중 상이한 둘 이상을 사용하여 복수의 계산단계를 수행하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장방법
14 14
제 8 항에 있어서 상기 추가해야 할 용례로 확정하는 단계는,상기 분류된 다의어 의미의 신뢰도를 계산하는 단계;상기 계산된 신뢰도가 미리 설정된 임계 값 보다 큰 경우 대상 문장을 용례로 추가할 다의어 의미를 자동으로 확정하는 단계; 및상기 계산된 신뢰도가 미리 설정된 임계 값 보다 작은 경우 사용자의 선택에 따라 대상 문장을 용례로 추가할 다의어 의미를 확정하는 단계를 포함하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 한국전자통신연구원 SW컴퓨팅산업원천기술개발 휴먼 지식증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술 개발