맞춤기술찾기

이전대상기술

온톨로지를 이용한 문서의 군집화 방법 및 장치

  • 기술번호 : KST2014042839
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 온톨로지를 이용한 문서의 군집화 방법 및 장치가 제공된다. 상기 문서의 군집화 방법은, 복수 개의 문서 각각으로부터 복수 개의 키워드 및 각 키워드의 상기 문서 내에서의 빈도수를 추출하는 단계, 상기 추출된 키워드 및 빈도수를 이용하여 상기 복수 개의 문서 각각의 주제어를 선정하는 단계, 상기 추출된 주제어를 포함하는 온톨로지 isA 계층구조에 상기 복수 개의 문서들을 대응시켜 문서 계층구조를 생성하는 단계, 생성된 상기 문서 계층구조를 이용하여 상기 각 문서의 주제어에 따라 상기 문서들을 클러스터링하는 단계를 포함한다.
Int. CL G06F 17/21 (2006.01) G06F 17/00 (2006.01)
CPC G06F 17/3071(2013.01) G06F 17/3071(2013.01) G06F 17/3071(2013.01) G06F 17/3071(2013.01) G06F 17/3071(2013.01)
출원번호/일자 1020090115977 (2009.11.27)
출원인 동국대학교 산학협력단
등록번호/일자 10-1067819-0000 (2011.09.20)
공개번호/일자 10-2011-0059292 (2011.06.02) 문서열기
공고번호/일자 (20110927) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2009.11.27)
심사청구항수 23

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 동국대학교 산학협력단 대한민국 서울특별시 중구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이용규 대한민국 서울특별시 노원구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 박국진 대한민국 서울특별시 강남구 언주로***, *층(논현동,시그너스빌딩)(두호특허법인)
2 노준태 대한민국 부산광역시 강서구 미음산단*로**번길**, *층***호(미음동,부산글로벌테크비즈센터)(두호특허법인(부산분사무소))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 동국대학교 산학협력단 대한민국 서울특별시 중구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2009.11.27 수리 (Accepted) 1-1-2009-0732898-00
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.11.05 수리 (Accepted) 4-1-2010-5206478-99
3 선행기술조사의뢰서
Request for Prior Art Search
2010.11.10 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2010.12.15 수리 (Accepted) 9-1-2010-0075810-93
5 의견제출통지서
Notification of reason for refusal
2011.03.18 발송처리완료 (Completion of Transmission) 9-5-2011-0152888-00
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.05.17 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2011-0366483-84
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.05.17 수리 (Accepted) 1-1-2011-0366482-38
8 등록결정서
Decision to grant
2011.09.16 발송처리완료 (Completion of Transmission) 9-5-2011-0526308-68
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.12.06 수리 (Accepted) 4-1-2011-5243351-46
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.01.10 수리 (Accepted) 4-1-2014-0002002-62
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.16 수리 (Accepted) 4-1-2019-5163486-33
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
문서의 군집화 장치에서, 복수 개의 문서 각각으로부터 복수 개의 키워드 및 각 키워드의 상기 문서 내에서의 빈도수를 추출하는 단계; 상기 문서의 군집화 장치에서, 상기 추출된 키워드 및 빈도수를 이용하여 상기 복수 개의 문서 각각의 주제어를 선정하는 단계; 상기 문서의 군집화 장치에서, 상기 추출된 주제어를 포함하는 온톨로지 isA 계층구조에 상기 복수 개의 문서들을 대응시켜 문서 계층구조를 생성하는 단계; 상기 문서 계층구조의 각 노드 중 대응된 문서의 수가 0인 노드를 삭제하여 상기 문서 계층구조를 압축하는 단계; 및 상기 문서의 군집화 장치에서, 생성된 상기 문서 계층구조를 이용하여 상기 각 문서의 주제어에 따라 상기 문서들을 클러스터링 하는 단계; 를 포함하는 온톨로지를 이용한 문서의 군집화 방법
2 2
삭제
3 3
제1항에 있어서, 상기 문서 계층구조의 각 노드는, 해당 노드의 온톨로지 용어를 주제어로 하는 문서의 수, 해당 노드를 루트 노드로 하는 서브트리의 온톨로지 용어를 주제어로 하는 문서의 수의 합 및 상기 해당 노드의 온톨로지 용어를 주제어로 하는 문서의 리스트를 가리키는 포인터를 포함하는, 온톨로지를 이용한 문서의 군집화 방법
4 4
제3항에 있어서, 상기 클러스터링 단계는, 상기 문서 계층구조의 각 노드들을 포스트오더(postorder) 트리 순회 방식 또는 상향식 레벨 오더 트리 순회 방식에 따라 순회하거나, 상기 문서 계층구조를 이진 트리 형태로 변환하고 변환된 상기 문서 계층구조를 포스트오더 이진 트리 순회 방식으로 순회하고, 상기 순회 과정에서 방문한 상기 문서 계층구조의 각 노드 별로 세부 클러스터링 단계를 수행함으로써 수행되는, 온톨로지를 이용한 문서의 군집화 방법
5 5
제4항에 있어서, 상기 문서 계층구조의 순회 과정에서 방문한 특정 노드에서의 세부 클러스터링 단계는, 상기 특정 노드의 문서 수가 기 설정된 클러스터의 최대값보다 작거나 같은지를 판단하는 제1단계; 상기 제1단계의 판단 결과, 상기 특정 노드의 문서 수가 상기 클러스터의 최대값보다 작거나 같은 경우, 상기 특정 노드에 자식 노드가 존재하는지의 여부를 판단하는 제2단계; 상기 제2단계의 판단 결과, 상기 특정 노드에 자식 노드가 존재하는 경우, 상기 특정 노드의 자식 노드들을 루트 노드로 하는 하나 이상의 서브트리를 포함하는 서브트리 조합을 생성하는 제3단계; 상기 제3단계에서 생성된 서브트리 조합 중 포함된 문서의 수가 기 설정된 클러스터의 최소값보다 크거나 같고 상기 클러스터의 최대값보다 작거나 같은 조합이 존재하는지의 여부를 판단하는 제4단계; 상기 제4단계의 판단 결과, 포함된 문서의 수가 상기 클러스터의 최소값보다 크거나 같고 상기 클러스터의 최대값보다 작거나 같은 조합이 존재하는 경우, 상기 조합으로 하나 이상의 클러스터를 구성하는 제5단계; 상기 제5단계에서 구성된 상기 하나 이상의 클러스터에 상기 특정 노드의 모든 서브트리가 포함되는지의 여부를 판단하는 제6단계; 상기 제6단계의 판단 결과, 상기 하나 이상의 클러스터에 상기 특정 노드의 모든 서브트리가 포함되는 경우, 상기 하나 이상의 클러스터 중 상기 특정 노드를 포함할 경우에도 해당 클러스터의 문서 수가 상기 클러스터의 최대값보다 작거나 같은 클러스터가 존재하는지의 여부를 판단하는 제7단계; 상기 제7단계의 판단 결과, 상기 특정 노드를 포함할 경우에도 클러스터의 문서 수가 상기 클러스터의 최대값보다 작거나 같은 클러스터가 존재하는 경우, 상기 특정 노드를 해당 클러스터에 포함시키는 제8단계; 상기 클러스터에 포함된 노드를 상기 문서 계층구조에서 삭제하고, 생성된 클러스터의 총 개수 값을 상기 제5단계에서 구성된 클러스터의 개수만큼 증가시키는 제9단계; 상기 제9단계에서 증가된 클러스터의 총 개수 값이 기 설정된 클러스터의 목표치보다 작은지의 여부를 판단하는 제10단계; 상기 제10단계의 판단 결과 상기 클러스터의 총 개수 값이 기 설정된 클러스터의 목표치보다 작은 경우, 상기 클러스터에 상기 특정 노드가 포함되는지를 판단하는 제11단계; 상기 제11단계의 판단 결과, 상기 클러스터에 상기 특정 노드가 포함되는 경우, 상기 특정 노드가 루트 노드인지를 판단하고, 상기 특정 노드가 루트 노드가 아닌 경우 다음 노드로 이동하며, 상기 특정 노드가 루트 노드인 경우 클러스터링 실패로 판단하고 상기 클러스터링 단계를 중단하는 제12단계; 를 포함하는 온톨로지를 이용한 문서의 군집화 방법
6 6
제5항에 있어서, 상기 제1단계의 판단 결과 상기 특정 노드의 문서 수가 기 설정된 클러스터의 최대 문서 수보다 많거나, 상기 제4단계의 판단 결과, 모든 서브트리 조합에 포함된 문서의 수가 상기 클러스터의 최대값을 초과하는 경우, 클러스터링 실패로 판단하고 상기 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 군집화 방법
7 7
제5항에 있어서, 상기 제10단계의 판단 결과, 상기 제9단계에서 증가된 클러스터의 총 개수 값이 기 설정된 클러스터의 목표치와 같은 경우, 상기 문서 계층구조 내에 문서 수가 1 이상인 노드가 존재하는지의 여부를 판단하여, 상기 노드가 존재하지 않는 경우 클러스터링 성공으로 판단하고 상기 클러스터링 단계를 종료하며, 상기 노드가 존재하는 경우 클러스터링 실패로 판단하고 상기 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 군집화 방법
8 8
제5항에 있어서, 상기 제10단계의 판단 결과, 상기 제9단계에서 증가된 클러스터의 총 개수 값이 기 설정된 클러스터의 목표치보다 큰 경우, 클러스터링 실패로 판단하고 상기 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 군집화 방법
9 9
제5항에 있어서, 상기 제4단계의 판단 결과 모든 서브트리 조합에 포함된 문서의 수가 상기 클러스터의 최대값보다 작거나, 또는 제11단계의 판단 결과 상기 클러스터에 상기 특정 노드가 포함되지 않고 상기 특정 노드의 자식 노드를 루트 노드로 하는 서브트리가 존재하는 경우, 상기 상기 특정 노드 및 상기 특정 노드의 자식 노드를 루트 노드로 하는 서브트리 모두를 조합하는 제13단계; 상기 제13단계에서 생성된 조합이 상기 클러스터의 최대값보다 작거나 같고 상기 클러스터의 최소값보다 크거나 같은지의 여부를 판단하는 제14단계; 상기 제14단계의 판단 결과, 상기 제13단계에서 생성된 조합이 상기 클러스터의 최대값보다 작거나 같고, 상기 클러스터의 최소값보다 크거나 같은 경우, 상기 제9단계에서 생성된 조합으로 클러스터를 구성하는 제15단계; 상기 제15단계에서 구성된 클러스터에 포함된 노드를 상기 문서 계층구조에서 삭제하고, 생성된 클러스터의 총 개수 값을 1 증가시키는 제16단계; 상기 제16단계에서 증가된 클러스터의 총 개수 값이 기 설정된 클러스터의 목표치보다 작은지의 여부를 판단하는 제17단계; 상기 제17단계의 판단 결과 상기 클러스터의 총 개수 값이 상기 클러스터의 목표치보다 작은 경우, 상기 특정 노드가 루트 노드인지의 여부를 판단하는 제18단계; 상기 제18단계의 판단 결과, 상기 특정 노드가 루트 노드가 아닌 경우, 다음 노드로 이동하는 제19단계; 를 포함하는, 온톨로지를 이용한 문서의 군집화 방법
10 10
제9항에 있어서, 상기 제14단계의 판단 결과, 상기 제13단계에서 생성된 조합에 포함된 문서의 수가 상기 클러스터의 최대값보다 많은 경우, 클러스터링 실패로 판단하고 상기 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 군집화 방법
11 11
제9항에 있어서, 상기 제14단계의 판단 결과, 상기 제13단계에서 생성된 조합에 포함된 문서의수가 상기 클러스터의 최소값보다 적은 경우, 상기 특정 노드가 루트 노드인지의 여부를 판단하여, 상기 특정 노드가 루트 노드가 아닌 경우 상기 특정 노드의 문서 수 및 상기 특정 노드의 자손 노드들의 문서 수를 합한 값을 계산하고, 포스트오더 트리 순회 방식에 따라 다음 노드로 이동하며, 상기 특정 노드가 루트 노드인 경우 클러스터링 실패로 판단하여 상기 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 군집화 방법
12 12
제9항에 있어서, 상기 제18단계의 판단 결과, 상기 특정 노드가 루트 노드인 경우 클러스터링 실패로 판단하고 상기 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 군집화 방법
13 13
제9항에 있어서, 상기 제17단계의 판단 결과 상기 클러스터의 총 개수 값이 상기 클러스터의 목표치와 같은 경우, 상기 특정 노드가 루트 노드인지의 여부를 판단하는 제20단계; 상기 제20단계의 판단 결과, 상기 특정 노드가 루트 노드인 경우, 클러스터링 성공으로 판단하고 상기 클러스터링 단계를 종료하는 제21단계; 를 더 포함하는, 온톨로지를 이용한 문서의 군집화 방법
14 14
제13항에 있어서, 상기 제20단계의 판단 결과 상기 특정 노드가 루트 노드가 아닌 경우, 상기 문서 계층구조에 서브트리 문서 수가 1 이상인 노드가 존재하는지의 여부를 판단하여, 서브트리 문서 수가 1 이상인 노드가 존재하지 않으면 클러스터링 성공으로 판단하고 상기 클러스터링 단계를 종료하며, 서브트리 문서 수가 1 이상인 노드가 존재하면 클러스터링 실패로 판단하고 상기 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 군집화 방법
15 15
제5항에 있어서, 상기 제2단계의 판단 결과 상기 특정 노드에 자식 노드가 존재하지 않거나, 또는 상기 제11단계의 판단 결과 상기 클러스터에 상기 특정 노드가 포함되지 않고 상기 특정 노드의 자식 노드를 루트 노드로 하는 서브트리가 존재하지 않는 경우, 상기 특정 노드에 포함된 문서의 수가 0인지를 판단하는 제22단계; 상기 제22단계의 판단 결과, 상기 특정 노드에 포함된 문서의 수가 0인 경우, 상기 특정 노드를 상기 문서 계층구조에서 삭제하는 제23단계; 상기 특정 노드가 루트 노드인지의 여부를 판단하여, 상기 특정 노드가 루트 노드인 경우 클러스터링 실패로 판단하여 클러스터링을 중단하고, 상기 특정 노드가 루트 노드가 아닌 경우 다음 노드로 이동하는 제24단계; 를 더 포함하는, 온톨로지를 이용한 문서의 군집화 방법
16 16
제15항에 있어서, 상기 제22단계의 판단 결과, 상기 특정 노드에 포함된 문서의 수가 0이 아닌 경우, 상기 특정 노드에 포함된 문서의 수가 상기 클러스터의 최소값보다 크거나 같은지의 여부를 판단하는 제25단계; 상기 제25단계의 판단 결과, 상기 특정 노드에 포함된 문서의 수가 상기 클러스터의 최소값보다 크거나 같은 경우, 상기 특정 노드로 클러스터를 구성하는 제26단계; 상기 특정 노드를 상기 문서 계층구조에서 삭제하고, 생성된 클러스터의 총 개수 값을 1 증가시키는 제27단계; 상기 제27단계에서 증가된 클러스터의 총 개수 값이 기 설정된 클러스터의 목표치보다 작은지의 여부를 판단하는 제28단계; 상기 제28단계의 판단 결과 상기 클러스터의 총 개수 값이 상기 클러스터의 목표치보다 작은 경우, 상기 특정 노드가 루트 노드인지의 여부를 판단하는 제29단계; 상기 제29단계의 판단 결과, 상기 특정 노드가 루트 노드가 아닌 경우, 다음 노드로 이동하고, 상기 특정 노드가 루트 노드인 경우 클러스터링 실패로 판단하여 상기 클러스터링 단계를 중단하는 제30단계; 를 포함하는, 온톨로지를 이용한 문서의 군집화 방법
17 17
제16항에 있어서, 상기 제28단계의 판단 결과, 상기 클러스터의 총 개수 값이 상기 클러스터의 목표치와 같은 경우, 상기 특정 노드가 루트 노드인지의 여부를 판단하는 제31단계; 상기 제31단계의 판단 결과, 상기 특정 노드가 루트 노드인 경우, 클러스터링 성공으로 판단하고 상기 클러스터링 단계를 종료하는 제32단계; 를 더 포함하는, 온톨로지를 이용한 문서의 군집화 방법
18 18
제17항에 있어서, 상기 제31단계의 판단 결과 상기 특정 노드가 루트 노드가 아닌 경우, 상기 문서 계층구조에 서브트리 문서 수가 1 이상인 노드가 존재하는지의 여부를 판단하여, 서브트리 문서 수가 1 이상인 노드가 존재하지 않으면 클러스터링 성공으로 판단하고 상기 클러스터링 단계를 종료하고, 서브트리 문서 수가 1 이상인 노드가 존재하면 클러스터링 실패로 판단하고 상기 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 군집화 방법
19 19
제16항에 있어서, 상기 제25단계의 판단 결과, 상기 특정 노드에 포함된 문서의 수가 상기 클러스터의 최소값보다 작은 경우, 상기 특정 노드가 루트 노드인지의 여부를 판단하여, 루트 노드가 아닌 경우 다음 노드로 이동하고, 루트 노드인 경우 클러스터링 실패로 판단하여 상기 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 군집화 방법
20 20
제1항에 있어서, 상기 문서의 클러스터링 단계의 수행 이후, 상기 문서의 군집화 장치에서, 상기 클러스터링 단계에서 생성된 클러스터 각각의 중심어를 선정하고, 상기 중심어와 해당 클러스터에 속한 주제어들간의 평균 거리를 계산하는 단계; 상기 문서의 군집화 장치에서, 생성된 모든 클러스터의 주제어와 주제어들간의 평균 거리가 소정값 이하가 되도록 특정 클러스터에 포함된 문서를 다른 클러스터로 이동하는 단계; 및 상기 각 클러스터의 응집도를 계산하는 단계; 를 더 포함하는, 온톨로지를 이용한 문서의 군집화 방법
21 21
제20항에 있어서, 상기 중심어 선정 단계는, 해당 클러스터에 속한 문서의 주제어 중에서 주제어들 간 온톨로지 isA 계층구조 상의 평균 거리가 가장 짧은 주제어를 상기 중심어로 선정하는, 온톨로지를 이용한 문서의 군집화 방법
22 22
제20항에 있어서, 상기 각 클러스터의 응집도는, 다음의 수학식 을 이용하여 계산되는, 온톨로지를 이용한 문서의 군집화 방법
23 23
제1항 또는 제3항 내지 제22항 중 어느 한 항에 기재된 방법을 컴퓨터상에서 수행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
24 24
복수 개의 문서 각각으로부터 복수 개의 키워드 및 각 키워드의 상기 문서 내에서의 빈도수를 추출하는 키워드 추출부; 상기 키워드 추출부에서 추출된 키워드 및 빈도수를 이용하여 상기 복수 개의 문서 각각의 주제어를 선정하는 주제어 선정부; 상기 주제어 선정부에서 선정된 상기 주제어를 포함하는 온톨로지 isA 계층구조에 상기 복수 개의 문서를 대응시켜 문서 계층구조를 생성하는 문서 계층구조 생성부; 상기 문서 계층구조 생성부에서 생성된 상기 문서 계층구조를 이용하여 상기 각 문서의 주제어에 따라 상기 문서들을 클러스터링 하는 문서 클러스터링부; 상기 문서 클러스터링부에서 생성된 클러스터 각각의 중심어 및 상기 중심어와 해당 클러스터에 속한 주제어들간의 평균 거리를 계산하는 중심어 선정부; 상기 문서 클러스터링부에서 생성된 모든 클러스터의 주제어와 주제어들간의 평균 거리가 소정값 이하가 되도록 특정 클러스터에 포함된 문서를 다른 클러스터로 이동시키는 클러스터 조정부; 및 상기 문서 클러스터링부에서 생성된 각 클러스터의 응집도를 계산하는 응집도 계산부; 를 포함하는, 온톨로지를 이용한 문서의 군집화 장치
25 25
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.