맞춤기술찾기

이전대상기술

이진 코드를 이용한 엑스엠엘 데이터들의 최대 σ-빈번서브트리 추출방법

  • 기술번호 : KST2015214431
  • 담당센터 : 경기기술혁신센터
  • 전화번호 : 031-8006-1570
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 최근 웹에서 정보 교환, 저장의 표준으로 사용이 급증하고 있는 XML문서에 적용할 수 있는 유용 정보 추출의 한 방법으로, 이진 코드를 이용하여 XML 데이터들을 표현한 후 일련의 비트 시퀀스들의 집합으로 재 표현된 XML 데이터들로부터 사용자로부터 직접 입력받는 최소지지도 σ값을 만족하는 최대 σ-빈번 서브트리 추출 방법을 제공함에 있다. 본 발명은 모든 입력 XML 트리들을 이진 코드표현으로 나타내는 단계, 이진 코드로 명시된 트리들로부터 모든 빈번 프리픽스 PairSets를 얻어내는 단계 및, 상기 얻어진 PairSets로부터 다시 트리 구조로 변형하는 총 3단계로 구성된다. 이진 코드 표현 단계에서는 먼저, 각 노드에 대한 n 비트의 이진 코드 생성이 수행된 후, 이를 이용해 노드들의 연속된 연결로 각각의 경로들을 나타낸다. 빈번 프리픽스 PairSets 생성 단계에서는 각 경로들을 depth에 맞게 분해한 후, 그 분해된 n 비트의 프리픽스들을 키로 하여 이 키를 포함하는 트리 인덱스들과 쌍을 이뤄 PairSet의 원소로 설정한다. 프리픽스 Pairsets으로부터 최종적인 빈번 서브트리 생성을 위해 필요한 모든 빈번 프리픽스 PairSets을 유도해 낸다. 최종 단계에서는 앞서 구해진 빈번 프리픽스 PairSets으로부터 서브트리 구조를 생성한다. 본 발명은 XML 문서가 반구조적인 형식이라는 것을 기반으로 하여 미리 정해진 스키마가 없는 문서들을 대상으로 효율적으로 최소 지지도 σ를 만족하는 공통의 서브트리 발견을 목적으로 한다. XML, 이진 코드, 빈번 서브트리, PairSet, 최소지지도 σ
Int. CL G06F 17/00 (2006.01) G06F 17/30 (2006.01)
CPC G06F 17/30914(2013.01) G06F 17/30914(2013.01) G06F 17/30914(2013.01)
출원번호/일자 1020040037156 (2004.05.25)
출원인 학교법인 성균관대학
등록번호/일자 10-0539022-0000 (2005.12.20)
공개번호/일자 10-2005-0112229 (2005.11.30) 문서열기
공고번호/일자 (20051227) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2004.05.25)
심사청구항수 1

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 학교법인 성균관대학 대한민국 서울 종로구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김응모 대한민국 경기도수원시장안구
2 백주련 대한민국 경기도수원시장안구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인정직과특허 대한민국 서울 강남구 선릉로 ***(논현동, 썬라이더빌딩 *층)
2 윤여표 대한민국 서울특별시 서초구 방배로**길 *, ***호(방배동,정암빌딩)(웰컨설팅(분사무소))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 성균관대학교 산학협력단 경기도 수원시 장안구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2004.05.25 수리 (Accepted) 1-1-2004-0220519-18
2 선행기술조사의뢰서
Request for Prior Art Search
2005.10.14 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2005.11.18 수리 (Accepted) 9-1-2005-0075879-69
4 등록결정서
Decision to grant
2005.12.13 발송처리완료 (Completion of Transmission) 9-5-2005-0633320-97
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
XML 문서들에 대한 데이터 마이닝 방법에 있어서, 입력 XML 트리들을 Forest-DFS 방식으로 탐색해 가는 노드 순서대로 해당 노드 레이블들을 n 비트의 이진 코드로 변환하는 제 1과정과; 상기 Forest-DFS 방식에 따라 모든 XML 트리의 경로들을 이진 코드로 표현된 노드들의 연결로 나타내는 제 2과정과; 상기 제2과정을 통해 얻어진 일련의 이진 코드로 표현된 경로들에 대해서 입력 XML 트리의 가장 큰 depth 만큼의 프리픽스 PairSets([P]ℓ, 0≤ℓ≤ 입력 XML트리의 가장 큰 depth)를 생성하는 제 3과정과; 상기 제 3과정에서 생성된 프리픽스 PairSets 으로부터 최소 지지도 σ를 기준으로 각각의 F ℓ 과 C ℓ 을 생성하고, 상기 각각의 F ℓ 과 C ℓ 이 생성되면 각 [P] ℓ 는 소멸시키는 제 4과정과; 상기 제 4과정에서 생성된 각각의 F ℓ 과 C ℓ 중에서, ( F ℓ , C ℓ-1 ) 집합을 쌍으로 하여 C ℓ-1 의 key값들 중 F ℓ 의 key값과 동일한 값이 존재하는지를 검사하여 서로 동일한 key값이 존재하는 경우, C ℓ-1 의 해당 key값의 value가 F ℓ 의 해당 key값에 존재하지 않는 value이면 F ℓ 의 해당 key값에 상기 value를 추가하여 보완하고, 상기 C ℓ-1 에서 상기 서로 동일한 key값과 해당 value를 삭제하는 제 5과정과; 상기 제 4과정에서 생성된 각각의 F ℓ 과 C ℓ 중에서, ( F ℓ-1 , C ℓ ) 집합을 쌍으로 하여 제 5과정과 동일한 연산을 수행하는 제 6과정과; 상기 제 5과정과 제 6과정을 통해 수정된 ( C ℓ-1 , C ℓ ) 집합을 쌍으로 하여 이들의 key값을 비교하여 동일한 key값이 존재하면, 해당 key와 쌍으로 되어 있는 C ℓ-1 , C ℓ 의 양쪽의 vlaue들을 분석하여 서로 다른 트리 인덱스 개수의 합이 최소지지도 σ를 만족한다면, F ℓ 이 공집합이 아닌 경우에는 상기의 공통되는 key값과 해당 value들을 상기 F ℓ 에 추가하여 보완하고, F ℓ 이 공집합인 경우에는 F ℓ-1 에 추가하여 보완하며, 상기 F ℓ 또는 F ℓ-1 이 보완된 후, 상기 해당 (key, value)쌍들을 C ℓ-1 , C ℓ 에서 삭제하고 남은 두 집합의 원소들을 대상으로 C ℓ 과 C ℓ-1 의 원소의 합집합을 C ℓ 로 치환(C ℓ = C ℓ U C ℓ-1 ) 하여 C ℓ 을 수정하는 제 7과정 과; 상기의 제 5과정 내지 7과정이 ℓ= 1부터 가장 큰 depth 만큼 반복되어 보완된 모든 빈번 프리픽스 PairSets(F ℓ, 1≤ℓ≤ XML트리의 가장 큰 depth를 생성하는 제 8과정과; 상기 제 8과정에서 구한 빈번 프리픽스 PairSets(F ℓ)을 사용하여, 가장 상위의 depth부터 순차적으로 체크하고 하나의 원소라도 존재하는 가장높은 depth의 F ℓ 의 ℓ을 저장하며, 해당 F ℓ 의 모든 key 값들은 각각 서브트리의 루트 노드로 설정하는 제 9과정과; 상기 제 8과정에서 구한 빈번 프리픽스 PairSets(F ℓ)을 사용하여, 상기 제 9과정에서 구한 F ℓ 이후의 빈번 프리픽스 PairSets(F ℓ+1 )부터는 해당 key 와 value에 대해 상기 제 9과정의 상위 depth ℓ 과의 관계를 Apriori 알고리즘에 따라 설정해 주는 제 10과정; 및, 상기 제 9과정에서 생성된 서브트리들의 이진 코드 노드 값들을 원래의 XML 문자열로 변환하여 최대 σ-빈번 서브트리들을 생성하는 제 11과정; 으로 이루어진 이진 코드를 이용한 XML 데이터들의 최대 σ-빈번 서브트리 추출 방법
2 1
XML 문서들에 대한 데이터 마이닝 방법에 있어서, 입력 XML 트리들을 Forest-DFS 방식으로 탐색해 가는 노드 순서대로 해당 노드 레이블들을 n 비트의 이진 코드로 변환하는 제 1과정과; 상기 Forest-DFS 방식에 따라 모든 XML 트리의 경로들을 이진 코드로 표현된 노드들의 연결로 나타내는 제 2과정과; 상기 제2과정을 통해 얻어진 일련의 이진 코드로 표현된 경로들에 대해서 입력 XML 트리의 가장 큰 depth 만큼의 프리픽스 PairSets([P]ℓ, 0≤ℓ≤ 입력 XML트리의 가장 큰 depth)를 생성하는 제 3과정과; 상기 제 3과정에서 생성된 프리픽스 PairSets 으로부터 최소 지지도 σ를 기준으로 각각의 F ℓ 과 C ℓ 을 생성하고, 상기 각각의 F ℓ 과 C ℓ 이 생성되면 각 [P] ℓ 는 소멸시키는 제 4과정과; 상기 제 4과정에서 생성된 각각의 F ℓ 과 C ℓ 중에서, ( F ℓ , C ℓ-1 ) 집합을 쌍으로 하여 C ℓ-1 의 key값들 중 F ℓ 의 key값과 동일한 값이 존재하는지를 검사하여 서로 동일한 key값이 존재하는 경우, C ℓ-1 의 해당 key값의 value가 F ℓ 의 해당 key값에 존재하지 않는 value이면 F ℓ 의 해당 key값에 상기 value를 추가하여 보완하고, 상기 C ℓ-1 에서 상기 서로 동일한 key값과 해당 value를 삭제하는 제 5과정과; 상기 제 4과정에서 생성된 각각의 F ℓ 과 C ℓ 중에서, ( F ℓ-1 , C ℓ ) 집합을 쌍으로 하여 제 5과정과 동일한 연산을 수행하는 제 6과정과; 상기 제 5과정과 제 6과정을 통해 수정된 ( C ℓ-1 , C ℓ ) 집합을 쌍으로 하여 이들의 key값을 비교하여 동일한 key값이 존재하면, 해당 key와 쌍으로 되어 있는 C ℓ-1 , C ℓ 의 양쪽의 vlaue들을 분석하여 서로 다른 트리 인덱스 개수의 합이 최소지지도 σ를 만족한다면, F ℓ 이 공집합이 아닌 경우에는 상기의 공통되는 key값과 해당 value들을 상기 F ℓ 에 추가하여 보완하고, F ℓ 이 공집합인 경우에는 F ℓ-1 에 추가하여 보완하며, 상기 F ℓ 또는 F ℓ-1 이 보완된 후, 상기 해당 (key, value)쌍들을 C ℓ-1 , C ℓ 에서 삭제하고 남은 두 집합의 원소들을 대상으로 C ℓ 과 C ℓ-1 의 원소의 합집합을 C ℓ 로 치환(C ℓ = C ℓ U C ℓ-1 ) 하여 C ℓ 을 수정하는 제 7과정 과; 상기의 제 5과정 내지 7과정이 ℓ= 1부터 가장 큰 depth 만큼 반복되어 보완된 모든 빈번 프리픽스 PairSets(F ℓ, 1≤ℓ≤ XML트리의 가장 큰 depth를 생성하는 제 8과정과; 상기 제 8과정에서 구한 빈번 프리픽스 PairSets(F ℓ)을 사용하여, 가장 상위의 depth부터 순차적으로 체크하고 하나의 원소라도 존재하는 가장높은 depth의 F ℓ 의 ℓ을 저장하며, 해당 F ℓ 의 모든 key 값들은 각각 서브트리의 루트 노드로 설정하는 제 9과정과; 상기 제 8과정에서 구한 빈번 프리픽스 PairSets(F ℓ)을 사용하여, 상기 제 9과정에서 구한 F ℓ 이후의 빈번 프리픽스 PairSets(F ℓ+1 )부터는 해당 key 와 value에 대해 상기 제 9과정의 상위 depth ℓ 과의 관계를 Apriori 알고리즘에 따라 설정해 주는 제 10과정; 및, 상기 제 9과정에서 생성된 서브트리들의 이진 코드 노드 값들을 원래의 XML 문자열로 변환하여 최대 σ-빈번 서브트리들을 생성하는 제 11과정; 으로 이루어진 이진 코드를 이용한 XML 데이터들의 최대 σ-빈번 서브트리 추출 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.