맞춤기술찾기

이전대상기술

온톨로지를 이용한 문서의 다단계 군집화 방법 및 장치

  • 기술번호 : KST2014042840
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 온톨로지를 이용한 문서의 다단계 군집화 방법 및 장치가 제공된다. 상기 온톨로지를 이용한 문서의 다단계 군집화 방법은, 복수 개의 문서 각각의 주제어를 선정하는 단계, 상기 선정된 주제어를 포함하는 온톨로지 isA 계층구조에 상기 복수 개의 문서들을 대응시켜 문서 계층구조를 생성하는 단계, 생성된 상기 문서 계층구조를 압축하는 단계, 압축된 상기 문서 계층구조를 순회하면서 클러스터링 조건을 만족하는 상기 문서 계층구조상의 노드를 클러스터링하는 제 1 클러스터링 단계 및 상기 제 1 클러스터링 단계에서 삭제되지 않은 상기 문서 계층구조 내의 노드들을 순회하면서 상기 클러스터링 조건을 만족하는 상기 문서 계층구조상의 노드를 클러스터링하는 제 2 클러스터링 단계를 포함한다.
Int. CL G06F 17/21 (2006.01) G06F 17/00 (2006.01)
CPC G06F 17/3071(2013.01) G06F 17/3071(2013.01) G06F 17/3071(2013.01) G06F 17/3071(2013.01)
출원번호/일자 1020090123897 (2009.12.14)
출원인 동국대학교 산학협력단
등록번호/일자 10-1070738-0000 (2011.09.29)
공개번호/일자 10-2011-0067337 (2011.06.22) 문서열기
공고번호/일자 (20111007) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2009.12.14)
심사청구항수 30

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 동국대학교 산학협력단 대한민국 서울특별시 중구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이용규 대한민국 서울특별시 노원구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 박국진 대한민국 서울특별시 강남구 언주로***, *층(논현동,시그너스빌딩)(두호특허법인)
2 노준태 대한민국 부산광역시 강서구 미음산단*로**번길**, *층***호(미음동,부산글로벌테크비즈센터)(두호특허법인(부산분사무소))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 주식회사 솔루게이트 서울특별시 금천구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2009.12.14 수리 (Accepted) 1-1-2009-0770264-54
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.11.05 수리 (Accepted) 4-1-2010-5206478-99
3 선행기술조사의뢰서
Request for Prior Art Search
2010.12.13 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2011.01.17 수리 (Accepted) 9-1-2011-0004293-79
5 의견제출통지서
Notification of reason for refusal
2011.03.09 발송처리완료 (Completion of Transmission) 9-5-2011-0131537-53
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.04.04 수리 (Accepted) 1-1-2011-0243137-06
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.04.04 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2011-0243138-41
8 등록결정서
Decision to grant
2011.09.27 발송처리완료 (Completion of Transmission) 9-5-2011-0552051-84
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.12.06 수리 (Accepted) 4-1-2011-5243351-46
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.01.10 수리 (Accepted) 4-1-2014-0002002-62
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.16 수리 (Accepted) 4-1-2019-5163486-33
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
문서의 다단계 군집화 장치에서, 복수 개의 문서 각각의 주제어를 선정하는 단계; 상기 문서의 다단계 군집화 장치에서, 상기 선정된 주제어를 포함하는 온톨로지 isA 계층구조에 상기 복수 개의 문서들을 대응시켜 문서 계층구조를 생성하는 단계; 상기 문서의 다단계 군집화 장치에서, 생성된 상기 문서 계층구조에 포함된 노드 중 루트 노드가 아니면서 포함된 문서의 수가 0인 노드를 삭제하고, 삭제된 노드에 자식 노드가 존재하는 경우 해당 자식 노드를 상기 삭제된 노드의 부모 노드의 자식 노드로 삽입함으로써 생성된 상기 문서 계층구조를 압축하는 단계; 상기 문서의 다단계 군집화 장치에서, 압축된 상기 문서 계층구조에 포함된 노드 중 클러스터링 조건을 만족하는 상기 문서 계층구조상의 노드를 클러스터링하고 클러스터링된 노드를 상기 문서 계층구조에서 삭제하는 제 1 클러스터링 단계; 및 상기 문서의 다단계 군집화 장치에서, 상기 제 1 클러스터링 단계에서 삭제되지 않은 상기 문서 계층구조 내의 비단말 노드들을 순회하면서 상기 클러스터링 조건을 만족하는 상기 문서 계층구조상의 노드를 클러스터링하는 제 2 클러스터링 단계; 를 포함하는 온톨로지를 이용한 문서의 다단계 군집화 방법
2 2
제1항에 있어서, 상기 문서 계층구조의 각 노드는, 해당 노드의 온톨로지 용어를 주제어로 하는 문서의 수, 해당 노드를 루트 노드로 하는 서브트리의 온톨로지 용어를 주제어로 하는 문서의 수의 합 및 상기 해당 노드의 온톨로지 용어를 주제어로 하는 문서의 리스트를 가리키는 포인터를 포함하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
3 3
제2항에 있어서, 상기 문서 계층구조의 압축 단계는, 상기 문서 계층구조를 포스트오더(postorder) 트리 순회 방식에 따라 순회하고, 상기 순회 과정에서 방문한 상기 문서 계층구조의 각 노드 별로 세부 압축 단계를 수행함으로써 수행되는, 온톨로지를 이용한 문서의 다단계 군집화 방법
4 4
제3항에 있어서, 상기 문서 계층구조의 압축 단계의 순회 과정에서 방문한 특정 노드에서의 세부 압축 단계는, 상기 특정 노드에 포함된 문서 수가 기 설정된 클러스터의 최대값보다 작거나 같은지의 여부를 판단하는 제1단계; 상기 제1단계의 판단 결과 상기 특정 노드에 포함된 문서 수가 상기 최대값보다 작거나 같은 경우, 상기 특정 노드가 루트 노드인지의 여부를 판단하는 제2단계; 상기 제2단계의 판단 결과, 상기 특정 노드가 루트 노드가 아닌 경우, 상기 특정 노드에 포함된 문서 수가 0인지의 여부를 판단하는 제3단계; 상기 제3단계의 판단 결과, 상기 특정 노드에 포함된 문서 수가 0인 경우, 상기 특정 노드를 상기 문서 계층구조에서 삭제하고, 상기 특정 노드의 자식 노드를 상기 특정 노드의 부모 노드와 연결하는 제4단계; 를 포함하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
5 5
제4항에 있어서, 상기 제1단계의 판단 결과, 상기 특정 노드에 포함된 문서 수가 상기 최대값보다 큰 경우, 클러스터링 실패로 판단하고, 상기 문서 압축 단계를 중단하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
6 6
제4항에 있어서, 상기 제2단계의 판단 결과 상기 특정 노드가 루트 노드이거나, 또는 상기 제3단계의 판단 결과 상기 특정 노드에 포함된 문서 수가 0이 아닌 경우, 상기 특정 노드의 서브트리 문서 수를 계산하는 제5단계; 상기 특정 노드의 서브트리 문서 수가 기 설정된 클러스터의 최소값보다 크거나 같고 기 설정된 클러스터의 최대값보다 작거나 같은지의 여부를 판단하는 제6단계; 상기 제6단계의 판단 결과 상기 특정 노드의 서브트리 문서 수가 상기 최소값보다 크거나 같고 상기 최대값보다 작거나 같은 경우, 상기 특정 노드의 서브트리 문서 수와 기 설정된 클러스터의 최소값 및 최대값의 평균과의 차이를 계산하고, 상기 특정 노드를 클러스터 후보 리스트에 추가하는 제7단계; 상기 특정 노드가 루트 노드인지의 여부를 판단하여, 루트 노드가 아닌 경우 다음 노드로 이동하는 제8단계; 를 더 포함하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
7 7
제6항에 있어서, 상기 제8단계에서 상기 특정 노드가 루트 노드인 경우 상기 제 1 클러스터링 단계를 수행하며, 상기 제 1 클러스터링 단계는, 상기 클러스터 후보 리스트가 공백 리스트인지의 여부를 판단하는 제9단계; 상기 클러스터 후보 리스트가 공백 리스트가 아닌 경우, 상기 클러스터 후보 리스트에서 가장 우선순위가 높은 노드를 추출하고, 상기 추출된 노드와 추출된 노드의 서브트리로 클러스터를 생성하는 제10단계; 상기 생성된 클러스터에 포함된 노드를 상기 문서 계층구조에서 삭제하고, 상기 추출된 노드의 조상 노드의 서브트리 문서 수를 재계산하는 제11단계; 상기 후보 리스트에 포함된 상기 추출된 노드의 조상 노드 중 서브트리 문서의 수가 기 설정된 클러스터의 최소값보다 작거나 최대값보다 큰 노드를 상기 클러스터 후보 리스트에서 삭제하고, 클러스터 후보 리스트에 포함되지 않은 상기 추출된 노드의 조상 노드 중 서브트리 문서의 수가 기 설정된 클러스터의 최소값보다 크거나 같고 최대값보다 작거나 같은 노드를 상기 클러스터 후보 리스트에 추가하는 제12단계; 생성된 클러스터의 총 개수 값을 1 증가시키고, 증가된 상기 생성된 클러스터의 총 개수 값과 기 설정된 클러스터의 목표치를 비교하는 제13단계; 제13단계의 비교 결과, 상기 생성된 클러스터의 총 개수 값이 기 설정된 클러스터의 목표치와 같은 경우, 상기 문서 계층구조에 문서 수 1 이상인 노드가 존재하는지의 여부를 판단하고, 존재하지 않는 경우 클러스터링 성공으로 판단하여 상기 제 1 클러스터링 단계를 종료하고, 존재하는 경우 상기 서브트리 문서 수 1 이상인 노드를 상기 생성된 클러스터에 포함시킬 수 있는지를 판단하여 포함시킬 수 있는 경우 상기 생성된 클러스터에 포함시키고 클러스터링 성공으로 판단하여 상기 제 1 클러스터링 단계를 종료하고, 포함시킬 수 없는 경우 클러스터링 실패로 판단하여 상기 제 1 클러스터링 단계를 중단하는 제14단계; 를 포함하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
8 8
제7항에 있어서, 제9단계의 판단 결과 상기 클러스터 후보 리스트가 공백 리스트인 경우, 문서의 수가 1 이상인 노드가 존재하는지의 여부를 판단하여, 존재하지 않는 경우 클러스터링 실패로 판단하여 상기 제 1 클러스터링 단계를 종료하고, 존재하는 경우 제 2 클러스터링 단계를 수행하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
9 9
제8항에 있어서, 상기 제 2 클러스터링 단계는, 상기 제 1 클러스터링 단계가 종료된 상기 문서 계층구조를 역 레벨 오더 순회 방식으로 순회하고, 상기 순회 과정에서 방문한 노드에서 제 2 세부 클러스터링 단계를 수행함으로써 수행되는, 온톨로지를 이용한 문서의 다단계 군집화 방법
10 10
제9항에 있어서, 상기 제 2 세부 클러스터링 단계는, 상기 방문한 특정 노드의 자식 노드가 존재하는지의 여부를 판단하는 제15단계; 상기 제15단계의 판단 결과, 상기 방문한 특정 노드에 자식 노드가 존재하지 않는 경우, 상기 방문한 특정 노드의 문서 수가 상기 클러스터의 최소값보다 크거나 같은지의 여부를 판단하는 제16단계; 상기 제16단계의 판단 결과, 상기 방문한 특정 노드의 문서 수가 상기 클러스터의 최소값보다 크거나 같은 경우, 상기 방문한 특정 노드로 클러스터를 생성하고 상기 방문한 특정 노드를 상기 문서 계층구조에서 삭제하며, 상기 방문한 특정 노드의 조상 노드의 서브트리 문서 수를 재계산하는 제17단계; 상기 생성된 클러스터의 총 개수 값을 1 증가시키고, 증가된 상기 생성된 클러스터의 총 개수 값과 기 설정된 클러스터의 목표치를 비교하는 제18단계; 상기 제18단계의 판단 결과 상기 생성된 클러스터의 총 개수 값이 기 설정된 클러스터의 목표치보다 작은 경우, 상기 방문한 특정 노드가 루트 노드인지의 여부를 판단하여, 루트 노드인 경우 클러스터링 실패로 판단하여 상기 제 2 클러스터링 단계를 중단하고, 루트 노드가 아닌 경우 다음 노드로 이동하는 제19단계; 를 포함하는 온톨로지를 이용한 문서의 다단계 군집화 방법
11 11
제10항에 있어서, 상기 제16단계의 판단 결과, 상기 방문한 특정 노드의 문서 수가 상기 클러스터의 최소값보다 작은 경우, 상기 방문한 특정 노드가 루트 노드인지의 여부를 판단하여, 루트 노드인 경우 클러스터링 실패로 판단하여 상기 제 2 클러스터링 단계를 중단하고, 루트 노드가 아닌 경우 다음 노드로 이동하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
12 12
제10항에 있어서, 상기 제18단계의 판단 결과 상기 생성된 클러스터의 총 개수 값이 기 설정된 클러스터의 목표치와 같은 경우, 상기 방문한 특정 노드가 루트 노드인지의 여부를 판단하는 제20단계; 및 상기 제20단계의 판단 결과, 상기 방문한 특정 노드가 루트 노드인 경우 클러스터링 성공으로 판단하고 상기 제 2 클러스터링 단계를 종료하는 제 21단계를 더 포함하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
13 13
제12항에 있어서, 상기 제20단계의 판단 결과, 상기 방문한 특정 노드가 루트 노드가 아닌 경우 상기 문서 계층구조에 서브트리 문서 수가 1 이상인 노드가 존재하는지의 여부를 판단하여, 존재하지 않는 경우 클러스터링 성공으로 판단하여 상기 제 2 클러스터링 단계를 종료하고, 존재하는 경우 상기 서브트리 문서 수가 1 이상인 노드를 상기 생성된 클러스터에 포함시킬 수 있는지를 판단하여 포함시킬 수 있는 경우 상기 생성된 클러스터에 포함시키고 클러스터링 성공으로 판단하여 상기 제 2 클러스터링 단계를 종료하고, 포함시킬 수 없는 경우 클러스터링 실패로 판단하여 상기 제 2 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
14 14
제10항에 있어서, 상기 제15단계의 판단 결과, 상기 방문한 특정 노드에 자식 노드가 존재하는 경우, 상기 방문한 특정 노드의 서브트리 문서 수와 상기 클러스터의 최대값 및 최대값과의 크기를 비교하는 제22단계; 상기 제22단계의 판단 결과, 상기 방문한 특정 노드의 서브트리 문서 수가 상기 클러스터의 최대값보다 작거나 같고, 상기 클러스터의 최소값보다 크거나 같은 경우, 상기 방문한 특정 노드 및 상기 방문한 특정 노드의 서브트리로 클러스터를 생성하고, 생성된 클러스터에 포함된 노드를 트리에서 삭제하며, 상기 방문한 특정 노드의 조상 노드들의 서브트리 문서수를 재계산하는 제23단계; 상기 생성된 클러스터의 총 개수 값을 1 증가시키고, 증가된 상기 생성된 클러스터의 총 개수 값과 기 설정된 클러스터의 목표치를 비교하는 제24단계; 상기 제24단계의 판단 결과 상기 생성된 클러스터의 총 개수 값이 기 설정된 클러스터의 목표치보다 작은 경우, 상기 방문한 특정 노드가 루트 노드인지의 여부를 판단하여, 루트 노드인 경우 클러스터링 실패로 판단하여 상기 제 2 클러스터링 단계를 중단하고, 루트 노드가 아닌 경우 다음 노드로 이동하는 제25단계; 를 포함하는 온톨로지를 이용한 문서의 다단계 군집화 방법
15 15
제14항에 있어서, 상기 제22단계의 판단 결과, 상기 방문한 특정 노드의 문서 수가 상기 클러스터의 최소값보다 작은 경우, 상기 방문한 특정 노드가 루트 노드인지의 여부를 판단하여, 루트 노드인 경우 클러스터링 실패로 판단하여 상기 제 2 클러스터링 단계를 중단하고, 루트 노드가 아닌 경우 다음 노드로 이동하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
16 16
제14항에 있어서, 상기 제24단계의 판단 결과 상기 생성된 클러스터의 총 개수 값이 기 설정된 클러스터의 목표치와 같은 경우, 상기 방문한 특정 노드가 루트 노드인지의 여부를 판단하는 제26단계; 및 상기 제26단계의 판단 결과, 상기 방문한 특정 노드가 루트 노드인 경우 클러스터링 성공으로 판단하고 상기 제 2 클러스터링 단계를 종료하는 제27단계를 더 포함하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
17 17
제16항에 있어서, 상기 제26단계의 판단 결과, 상기 방문한 특정 노드가 루트 노드가 아닌 경우 상기 문서 계층구조에 서브트리 문서 수가 1 이상인 노드가 존재하는지의 여부를 판단하여, 존재하지 않는 경우 클러스터링 성공으로 판단하여 상기 제 2 클러스터링 단계를 종료하고, 존재하는 경우 상기 서브트리 문서 수가 1 이상인 노드를 상기 생성된 클러스터에 포함시킬 수 있는지를 판단하여 포함시킬 수 있는 경우 상기 생성된 클러스터에 포함시키고 클러스터링 성공으로 판단하여 상기 제 2 클러스터링 단계를 종료하고, 포함시킬 수 없는 경우 클러스터링 실패로 판단하여 상기 제 2 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
18 18
제14항에 있어서, 상기 제22단계의 판단 결과, 상기 방문한 특정 노드의 문서 수가 상기 클러스터의 최대값보다 큰 경우, 상기 방문한 특정 노드와 상기 방문한 특정 노드의 서브트리들을 이용하여 기 설정된 클러스터외 최소값보다 크거나 같고 기 설정된 클러스터의 최대값보다 작거나 같은 문서 수를 포함하는 하나 이상의 조합을 구성하는 제28단계; 상기 제28단계에서 상기 방문한 특정 노드 및 상기 방문한 특정 노드의 모든 서브트리들이 상기 하나 이상의 조합 중 어느 하나에 포함되는 경우, 구성된 상기 조합들로 하나 이상의 클러스터를 생성하고, 생성된 클러스터를 상기 문서 계층구조에서 삭제하며, 상기 방문한 특정 노드의 조상 노드의 서브트리 문서 수를 재계산하고, 생성된 클러스터의 총 개수 값을 생성된 클러스터의 수만큼 증가시키는 제29단계; 상기 생성된 클러스터의 총 개수 값을 기 설정된 클러스터의 목표치와 비교하는 제30단계; 상기 제30단계의 판단 결과, 상기 생성된 클러스터의 총 개수 값이 상기 클러스터의 목표치와 같은 경우, 상기 방문한 특정 노드가 루트 노드인지의 여부를 판단하여, 루트 노드인 경우 클러스터링 성공으로 판단하고 상기 제 2 클러스터링 단계를 종료하는 제31단계; 를 포함하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
19 19
제18항에 있어서, 상기 제30단계의 판단 결과, 상기 생성된 클러스터의 총 개수 값이 상기 클러스터의 목표치보다 큰 경우, 클러스터링 실패로 판단하고 상기 제 2 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
20 20
제18항에 있어서, 상기 제31단계의 판단 결과, 상기 방문한 특정 노드가 루트 노드가 아닌 경우, 상기 문서 계층구조에 서브트리 문서 수가 1 이상인 노드가 존재하는지의 여부를 판단하여, 존재하지 않는 경우 클러스터링 성공으로 판단하여 상기 제 2 클러스터링 단계를 종료하고, 존재하는 경우 상기 서브트리 문서 수가 1 이상인 노드를 상기 생성된 클러스터에 포함시킬 수 있는지를 판단하여 포함시킬 수 있는 경우 상기 생성된 클러스터에 포함시키고 클러스터링 성공으로 판단하여 상기 제 2 클러스터링 단계를 종료하고, 포함시킬 수 없는 경우 클러스터링 실패로 판단하여 상기 제 2 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
21 21
제18항에 있어서, 상기 제30단계의 판단 결과, 상기 생성된 클러스터의 총 개수 값이 상기 클러스터의 목표치보다 작은 경우, 상기 방문한 특정 노드가 루트 노드인지의 여부를 판단하여, 루트 노드가 아닌 경우 상기 방문한 특정 노드의 노상 노드의 서브트리 문서 수를 재계산하고 다음 노드로 이동하고, 루트 노드인 경우 클러스터링 실패로 판단하고 상기 제 2 클러스터링 단계를 중단하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
22 22
제18항에 있어서, 상기 제28단계에서 상기 방문한 특정 노드 및 상기 방문한 특정 노드의 모든 서브트리들이 상기 하나 이상의 조합 중 어느 하나에 포함되지 않는 경우, 상기 방문한 특정 노드의 서브트리들을 이용하여 기 설정된 클러스터외 최소값보다 크거나 같고 기 설정된 클러스터의 최대값보다 작거나 같은 문서 수를 포함하는 하나 이상의 조합을 구성하는 제32단계; 상기 방문한 특정 노드 및 상기 32단계에서 생성된 조합에 포함되지 않은 상기 방문한 특정 노드의 자식 노드에 포함된 문서 수가 상기 클러스터의 최대값보다 작거나 같은 지의 여부를 판단하여, 작거나 같은 경우 상기 제32단계에서 생성된 조합으로 하나 이상의 클러스터를 생성하는 제33단계; 상기 클러스터에 포함된 노드들을 상기 문서 계층구조에서 삭제하고, 상기 방문한 특정 노드의 서브트리 문서수를 재계산하는 제34단계; 생성된 클러스터의 총 개수 값을 상기 제33단계에서 생성된 클러스터의 수만큼 증가시키는 제35단계; 상기 생성된 클러스터의 총 개수 값을 기 설정된 클러스터의 목표치와 비교하는 제36단계; 상기 제36단계의 판단 결과, 상기 생성된 클러스터의 총 개수 값이 상기 클러스터의 목표치보다 작은 경우, 상기 방문한 특정 노드의 노상 노드의 서브트리 문서 수를 재계산하고 다음 노드로 이동하고, 크거나 같은 경우 클러스터링 실패로 판단하고 상기 제 2 클러스터링 단계를 중단하는 제37단계를 포함하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
23 23
제22항에 있어서, 상기 제33단계의 판단 결과, 상기 방문한 특정 노드 및 상기 32단계에서 생성된 조합에 포함되지 않은 상기 방문한 특정 노드의 자식 노드에 포함된 문서 수가 상기 클러스터의 최대값보다 큰 경우, 클러스터링 실패로 판단하고 상기 제 2 클러스터링 단계를 종료하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
24 24
제1항에 있어서, 상기 제 2 클러스터링 단계의 수행 이후, 상기 문서의 다단계 군집화 장치에서, 상기 생성된 클러스터 각각의 중심어를 선정하고, 상기 중심어와 해당 클러스터에 속한 주제어들간의 평균 거리를 계산하는 단계; 상기 문서의 다단계 군집화 장치에서, 생성된 모든 클러스터의 주제어와 주제어들간의 평균 거리가 소정값 이하가 되도록 특정 클러스터에 포함된 문서를 다른 클러스터로 이동하는 단계; 상기 문서의 다단계 군집화 장치에서, 상기 각 클러스터의 응집도를 계산하는 단계; 및 상기 문서의 다단계 군집화 장치에서, 질의문에 의해 상기 생성된 각 클러스터의 문서를 검색하는 단계; 를 더 포함하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
25 25
제24항에 있어서, 상기 중심어 선정 단계는, 해당 클러스터에 속한 문서의 주제어 중에서 주제어들 간 온톨로지 isA 계층구조 상의 평균 거리가 가장 짧은 주제어를 상기 중심어로 선정하는, 온톨로지를 이용한 문서의 다단계 군집화 방법
26 26
제24항에 있어서, 상기 각 클러스터의 응집도는, 다음의 수학식 을 이용하여 계산되는, 온톨로지를 이용한 문서의 다단계 군집화 방법
27 27
제24항에 있어서, 상기 문서 검색 단계는, 상기 질의문으로부터 질의 주제어를 추출하는 단계; 상기 질의 주제어와 각 클러스터들의 중심어와의 온톨로지 계층구조상의 거리를 비교하여 질의 주제어로부터의 거리가 가장 가까운 클러스터를 선택하는 단계; 상기 선택된 클러스터 내의 문서들의 주제어와 상기 질의 주제어 간의 거리를 계산하는 단계; 및 계산된 상기 거리가 가까운 순서로 소정 개수의 문서를 선택하는 단계; 를 포함하는 문서의 다단계 군집화 방법
28 28
제1항 내지 제27항 중 어느 한 항에 기재된 방법을 컴퓨터상에서 수행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
29 29
복수 개의 문서 각각으로부터 복수 개의 키워드 및 각 키워드의 상기 문서 내에서의 빈도수를 추출하는 키워드 추출부; 상기 키워드 추출부에서 추출된 키워드 및 빈도수를 이용하여 상기 복수 개의 문서 각각의 주제어를 선정하는 주제어 선정부; 상기 주제어 선정부에서 선정된 상기 주제어를 포함하는 온톨로지 isA 계층구조에 상기 복수 개의 문서를 대응시켜 문서 계층구조를 생성하는 문서 계층구조 생성부; 상기 문서 계층구조 생성부에서 생성된 상기 문서 계층구조에 포함된 노드 중 루트 노드가 아니면서 포함된 문서의 수가 0인 노드를 삭제하고, 삭제된 노드에 자식 노드가 존재하는 경우 해당 자식 노드를 상기 삭제된 노드의 부모 노드의 자식 노드로 삽입함으로써 생성된 상기 문서 계층구조를 압축하는 문서 계층구조 압축부; 상기 문서 계층구조 압축부에서 압축된 상기 문서 계층구조를 순회하면서 클러스터링 조건을 만족하는 상기 문서 계층구조상의 노드를 클러스터링하고 클러스터링된 노드를 상기 문서 계층구조에서 삭제하는 제 1 클러스터링부; 및 상기 제 1 클러스터링부에 의해 삭제되지 않은 상기 문서 계층구조 내의 비단말 노드들을 순회하면서 상기 클러스터링 조건을 만족하는 상기 문서 계층구조상의 노드를 클러스터링하는 제 2 클러스터링부; 를 포함하는 온톨로지를 이용한 문서의 다단계 군집화 장치
30 30
제29항에 있어서, 상기 제 1 클러스터링부 및 상기 제 2 클러스터링부에 의해 생성된 클러스터 각각의 중심어 및 상기 중심어와 해당 클러스터에 속한 주제어들간의 평균 거리를 계산하는 중심어 선정부; 상기 생성된 모든 클러스터의 주제어와 주제어들간의 평균 거리가 소정값 이하가 되도록 특정 클러스터에 포함된 문서를 다른 클러스터로 이동시키는 클러스터 조정부; 생성된 각 클러스터의 응집도를 계산하는 응집도 계산부; 질의문에 의해 상기 생성된 각 클러스터의 문서를 검색하는 문서 검색부; 중 하나 이상을 더 포함하는 온톨로지를 이용한 문서의 다단계 군집화 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.