맞춤기술찾기

이전대상기술

온톨로지를 이용한 문서간 유사도 측정 방법 및 장치

  • 기술번호 : KST2014042957
  • 담당센터 :
  • 전화번호 :
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 온톨로지를 이용한 문서간 유사도 측정 방법 및 장치가 개시된다. 상기 문서간 유사도 측정 방법은, 상기 질의 문서 및 상기 대상 문서로부터 복수 개의 키워드 및 상기 각 키워드의 상기 문서 내에서의 빈도수를 추출하는 단계, 상기 질의 문서 및 상기 대상 문서에서 추출된 키워드로부터 상기 질의 문서 및 상기 대상 문서의 주제어를 선정하는 단계, 상기 질의 문서 및 상기 대상 문서의 범위를 계산하는 단계; 및 상기 선정된 주제어 및 범위를 이용하여 상기 질의 문서와 상기 대상 문서의 유사도를 계산하는 단계를 포함한다.
Int. CL G06F 17/21 (2006.01) G06F 17/00 (2006.01)
CPC G06F 17/2211(2013.01) G06F 17/2211(2013.01) G06F 17/2211(2013.01) G06F 17/2211(2013.01) G06F 17/2211(2013.01)
출원번호/일자 1020090107897 (2009.11.10)
출원인 동국대학교 산학협력단
등록번호/일자 10-1108600-0000 (2012.01.16)
공개번호/일자 10-2011-0051366 (2011.05.18) 문서열기
공고번호/일자 (20120131) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2009.11.10)
심사청구항수 21

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 동국대학교 산학협력단 대한민국 서울특별시 중구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이용규 대한민국 서울특별시 노원구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 박국진 대한민국 서울특별시 강남구 언주로***, *층(논현동,시그너스빌딩)(두호특허법인)
2 노준태 대한민국 부산광역시 강서구 미음산단*로**번길**, *층***호(미음동,부산글로벌테크비즈센터)(두호특허법인(부산분사무소))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 주식회사 오케이첵 서울특별시 중구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2009.11.10 수리 (Accepted) 1-1-2009-0688675-58
2 선행기술조사의뢰서
Request for Prior Art Search
2010.06.09 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2010.07.15 수리 (Accepted) 9-1-2010-0044115-53
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.11.05 수리 (Accepted) 4-1-2010-5206478-99
5 의견제출통지서
Notification of reason for refusal
2011.04.22 발송처리완료 (Completion of Transmission) 9-5-2011-0217874-18
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.06.02 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2011-0417113-92
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.06.02 수리 (Accepted) 1-1-2011-0417112-46
8 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.10.21 수리 (Accepted) 1-1-2011-0826758-02
9 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.10.21 보정승인 (Acceptance of amendment) 1-1-2011-0826760-94
10 최후의견제출통지서
Notification of reason for final refusal
2011.10.21 발송처리완료 (Completion of Transmission) 9-5-2011-0608402-53
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.12.06 수리 (Accepted) 4-1-2011-5243351-46
12 등록결정서
Decision to grant
2012.01.09 발송처리완료 (Completion of Transmission) 9-5-2012-0013706-73
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.01.10 수리 (Accepted) 4-1-2014-0002002-62
14 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.16 수리 (Accepted) 4-1-2019-5163486-33
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
문서간 유사도 측정 장치에서 질의 문서와 하나 이상의 대상 문서간의 유사도를 계산하는 방법으로서, 상기 문서간 유사도 측정 장치에서, 상기 질의 문서 및 상기 대상 문서로부터 복수 개의 키워드 및 상기 각 키워드의 상기 문서 내에서의 빈도수를 추출하는 단계; 상기 문서간 유사도 측정 장치에서, 상기 질의 문서 및 상기 대상 문서에서 추출된 키워드로부터 상기 질의 문서 및 상기 대상 문서의 주제어를 선정하는 단계; 상기 문서간 유사도 측정 장치에서, 상기 질의 문서 및 상기 대상 문서의 범위를 계산하는 단계; 및 상기 문서간 유사도 측정 장치에서, 상기 선정된 주제어 및 범위를 이용하여 상기 질의 문서와 상기 대상 문서의 유사도를 계산하는 단계를 포함하며, 상기 질의 문서 또는 상기 대상 문서의 범위는, 상기 질의 문서 또는 상기 대상 문서의 주제어와 상기 질의 문서 또는 상기 대상 문서로부터 추출된 키워드 간의 온톨로지 isA 계층구조상의 평균거리, 중간거리, 최근거리 또는 최장거리 중 어느 하나인, 문서간 유사도 측정 방법
2 2
제1항에 있어서, 상기 키워드 선정 단계는, 상기 질의 문서 또는 상기 대상 문서로부터 추출된 키워드 중 빈도수가 가장 높은 키워드를 상기 질의 문서 또는 상기 대상 문서의 주제어로 선정하는, 문서간 유사도 측정 방법
3 3
제1항에 있어서, 상기 주제어 선정 단계는, 상기 질의 문서 또는 상기 대상 문서로부터 추출된 키워드 별로 상기 빈도수 추출 단계에서 추출된 다른 키워드들 간의 온톨로지 isA 계층구조상의 평균거리를 계산하고, 계산된 상기 평균거리가 가장 짧은 키워드를 상기 질의 문서 또는 상기 대상 문서의 주제어로 선정하는, 문서간 유사도 측정 방법
4 4
제1항에 있어서, 상기 주제어 선정 단계는, 상기 질의 문서 또는 상기 대상 문서의 제목으로부터 추출된 키워드 중 상기 질의 문서 또는 상기 대상 문서 내에서의 빈도수가 가장 높은 키워드를 상기 질의 문서 또는 상기 대상 문서의 주제어로 선정하는, 문서간 유사도 측정 방법
5 5
제1항에 있어서, 상기 주제어 선정 단계는, 상기 질의 문서 또는 상기 대상 문서의 제목으로부터 추출된 키워드 별로 상기 빈도수 추출 단계에서 추출된 다른 키워드들 간의 온톨로지 isA 계층구조상의 평균 거리를 계산하고, 계산된 상기 평균 거리가 가장 짧은 키워드를 상기 질의 문서 또는 상기 대상 문서의 주제어로 선정하는, 문서간 유사도 측정 방법
6 6
삭제
7 7
제1항에 있어서, 상기 질의 문서와 상기 대상 문서간의 유사도는, 상기 질의 문서의 주제어 및 상기 대상 문서의 주제어 간의 온톨로지 isA 계층구조상에서의 거리에 따라 정해지는, 문서간 유사도 측정 방법
8 8
제1항에 있어서, 상기 질의 문서와 상기 대상 문서간의 유사도는, 상기 질의 문서로부터 추출된 각 키워드 및 상기 대상 문서로부터 추출된 각 키워드 간의 온톨로지 isA 계층구조상에서의 평균거리에 따라 정해지는, 문서간 유사도 측정 방법
9 9
제1항에 있어서, 상기 질의 문서와 상기 대상 문서간의 유사도는, 상기 질의 문서의 주제어 및 상기 대상 문서의 주제어의 온톨로지 isA 계층구조상에서의 정규화된 거리와 상기 질의 문서의 범위 및 상기 대상 문서의 범위의 정규화된 비율에 따라 정해지되, 상기 유사도는 상기 정규화된 거리가 0에 가까울수록 높아지며, 상기 정규화된 거리가 동일한 경우에는 상기 정규화된 비율이 0에 가까울수록 상기 유사도가 높아지도록 구성되는, 문서간 유사도 측정 방법
10 10
제9항에 있어서, 상기 질의 문서의 주제어 및 상기 대상 문서의 주제어의 온톨로지 isA 계층구조상에서의 정규화된 거리는, 다음의 수학식 (이때, Nk는 질의 문서와 k 번째 대상 문서와의 정규화된 거리, CQ는 질의 문서의 주제어, CDk는 k 번째 대상 문서의 주제어, d(A, B)는 온톨로지 isA 계층구조에서 노드 A와 B 사이의 거리) 에 의하여 정해지는, 문서간 유사도 측정 방법
11 11
제9항에 있어서, 상기 질의 문서의 범위 및 상기 대상 문서의 범위의 정규화된 비율은, 다음의 수학식 (이때, Rk는 질의 문서의 범위와 k 번째 대상 문서의 범위의 정규화된 비율, WQ는 질의 문서의 범위, WDk는 k 번째 대상 문서의 범위, min(WQ, WDk)는 WQ와 WDk 중 작은 값, max(WQ, WDk)는 WQ와 WDk 중 큰 값) 에 의하여 정해지는, 문서간 유사도 측정 방법
12 12
제1항에 있어서, 상기 질의 문서와 상기 대상 문서간의 유사도는, 다음의 수학식 (이때, Ek는 질의 문서와 k 번째 대상 문서와의 유사도, Tk는 질의 문서의 주제어와 k 번째 대상 문서의 주제어와의 온톨로지 isA 계층구조에서의 정규화된 거리, Ak는 질의 문서의 범위와 k 번째 대상 문서의 범위의 정규화된 비율, w1, w2는 조정계수로서 w1 + w2 = 1) 에 의하여 정해지는, 문서간 유사도 측정 방법
13 13
제12항에 있어서, 상기 질의 문서의 주제어와 k 번째 대상 문서의 주제어와의 온톨로지 isA 계층구조에서의 정규화된 거리는, 다음의 수학식 (이때, Tk는 질의 문서와 k 번째 대상 문서와의 정규화된 거리, CQ는 질의 문서의 주제어, CDk는 k 번째 대상 문서의 주제어, d(A, B)는 온톨로지 isA 계층구조에서 노드 A와 B 사이의 거리) 에 의하여 정해지는, 문서간 유사도 측정 방법
14 14
제12항에 있어서, 상기 질의 문서의 범위와 k 번째 대상 문서의 범위의 정규화된 비율은, (이때, Ak는 질의 문서의 범위와 k 번째 대상 문서의 범위의 정규화된 비율, WQ는 질의 문서의 범위, WDk는 k 번째 대상 문서의 범위, min(WQ, WDk)는 WQ와 WDk 중 작은 값, max(WQ, WDk)는 WQ와 WDk 중 큰 값) 에 의하여 정해지는, 문서간 유사도 측정 방법
15 15
제1항에 있어서, 상기 질의 문서와 상기 대상 문서간의 유사도는, 다음의 수학식 (이때, Sk는 질의 문서와 k 번째 대상 문서와의 유사도, Tk는 질의 문서의 주제어와 k 번째 대상 문서의 주제어와의 온톨로지 isA 계층구조에서의 정규화된 거리, Ak는 질의 문서의 범위와 k 번째 대상 문서의 범위의 정규화된 비율) 에 의하여 정해지는, 문서간 유사도 측정 방법
16 16
제15항에 있어서, 상기 질의 문서의 주제어와 k 번째 대상 문서의 주제어와의 온톨로지 isA 계층구조에서의 정규화된 거리는, 다음의 수학식 (이때, Tk는 질의 문서와 k 번째 대상 문서와의 정규화된 거리, CQ는 질의 문서의 주제어, CDk는 k 번째 대상 문서의 주제어, d(A, B)는 온톨로지 isA 계층구조에서 노드 A와 B 사이의 거리, w3는 조정계수로서 0003c#w3≤1) 에 의하여 정해지는, 문서간 유사도 측정 방법
17 17
제15항에 있어서, 상기 질의 문서의 범위와 k 번째 대상 문서의 범위의 정규화된 비율은, (이때, Ak는 질의 문서의 범위와 k 번째 대상 문서의 범위의 정규화된 비율, WQ는 질의 문서의 범위, WDk는 대상 문서의 범위, min(WQ, WDk)는 WQ와 WDk 중 작은 값, max(WQ, WDk)는 WQ와 WDk 중 큰 값, w4는 조정계수로서 0003c#w4≤1) 에 의하여 정해지는, 문서간 유사도 측정 방법
18 18
제1항에 있어서, 상기 유사도 계산 단계의 수행 이후, 상기 문서간 유사도 측정 장치에서, 상기 계산된 유사도가 높은 순서로 소정 개수의 대상 문서를 상기 질의 문서와 유사한 문서로 선정하는 단계; 를 더 포함하는, 문서간 유사도 측정 방법
19 19
제1항 내지 제5항 또는 제7항 내지 제18항 중 어느 한 항에 기재된 방법을 컴퓨터상에서 수행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
20 20
키워드들간의 온톨로지 isA 계층구조가 저장된 데이터베이스; 질의 문서 및 대상 문서로부터 복수 개의 키워드 및 상기 각 키워드의 상기 문서 내에서의 빈도수를 추출하는 키워드 추출부; 상기 질의 문서 및 상기 대상 문서에서 추출된 키워드로부터 상기 질의 문서 및 상기 대상 문서의 주제어를 선정하는 주제어 선정부; 상기 질의 문서 및 상기 대상 문서의 범위를 계산하는 문서 범위 계산부; 및 상기 주제어 선정부에서 선정된 상기 질의 문서 및 상기 대상 문서의 주제어, 상기 문서 범위 계산부에서 계산된 상기 질의 문서 및 상기 대상 문서의 범위를 이용하여 상기 온톨로지 isA 계층구조상에서의 상기 질의 문서와 상기 대상 문서의 유사도를 계산하는 유사도 계산부를 포함하며, 상기 질의 문서 또는 상기 대상 문서의 범위는, 상기 질의 문서 또는 상기 대상 문서의 주제어와 상기 질의 문서 또는 상기 대상 문서로부터 추출된 키워드 간의 온톨로지 isA 계층구조상의 평균거리, 중간거리, 최근거리 또는 최장거리 중 어느 하나인, 문서간 유사도 측정 장치
21 21
제20항에 있어서, 상기 유사도 계산부는, 상기 계산된 유사도가 높은 순서로 소정 개수의 대상 문서를 상기 질의 문서와 유사한 문서로 선정하는, 문서간 유사도 측정 장치
22 22
제20항에 있어서, 상기 대상 문서의 주제어 및 범위 및 상기 주제어 및 범위로부터 구축된 인덱스가 저장되는 문서 주제어 및 범위 데이터베이스를 더 포함하는, 문서간 유사도 측정 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.