1 |
1
데이터 스트림으로부터 빈발항목집합을 탐색하는 방법에 있어서,(a) 발생하는 트랜잭션을 분할하여 복수 개의 분할 트랜잭션을 생성하는 단계;(b) 상기 복수 개의 분할 트랜잭션 각각을 복수 개의 제1 계층 전위 트리를 이용하여 마이닝하는 단계;(c) 상기 제1 계층 전위 트리에서 생성되는 빈발항목집합을 압축하여 압축항목집합을 생성하는 단계; 및(d) 상기 생성된 압축항목집합을 병합하고, 상기 병합된 압축항목집합을 제2 계층 전위 트리를 이용하여 마이닝하는 단계를 포함하는 것을 특징으로 하는 빈발항목집합 탐색 방법
|
2 |
2
제1항에 있어서,상기 (b) 단계에서 상기 복수 개의 제1 계층 전위트리는, 트랜잭션 Tk(여기서, k는 TID)가 주어질 때 m번째 제1 계층 전위트리를 Pm
|
3 |
3
제2항에 있어서,상기 (b) 단계에서, Pm
|
4 |
4
제1항에 있어서,상기 (c) 단계 및 (d) 단계는, 상기 (b) 단계에서 상기 제1 계층 전위트리에 상기 분할 트랜잭션의 멱집합에 일치하는 빈발항목집합이 있을 경우에 수행되는 것을 특징으로 하는 빈발항목집합 탐색 방법
|
5 |
5
제3항에 있어서,상기 (c) 단계는,상기 제1 계층 전위트리에서 생성된 빈발항목집합 x 와 y 가 상위집합과 부분집합 관계에 있으면서 지지도 차이가 미리 설정된 임계값 ω(0 ≤ ω ≤ 1) 보다 작은 경우 상기 압축항목집합을 생성하는 것을 특징으로 하는 빈발항목집합 탐색 방법
|
6 |
6
제2항에 있어서,상기 (d) 단계에서의 상기 압축항목집합의 병합은,첫번째 제1 계층 전위트리에서 생성된 압축항목집합부터 m번째 제1 계층 전위트리에서 생성된 압축항목집합을 연결하는 형태로 수행되는 것을 특징으로 하는 빈발항목집합 탐색 방법
|
7 |
7
제6항에 있어서,새로운 트랜잭션 Tk가 생성되었을 때의 상기 제2 계층 전위 트리를 Bk로 나타내고, 상기 압축항목집합의 병합 결과 생성되는 튜플을 부분트랜잭션 Uk라 할 때, 상기 (d) 단계는, 상기 Uk의 항목들의 사전적인 순서에 의해 Bk-1을 탐색하면서 수행하는 출현 빈도수 및 노드 갱신 단계를 포함하는 것을 특징으로 하는 빈발항목집합 탐색 방법
|
8 |
8
제7항에 있어서,상기 출현빈도수 및 노드 갱신 단계는, 상기 부분트랜잭션의 두 제1 계층 전위트리에 해당하는 항목을 합치고, 상기 Bk-1을 탐색하면서 탐색되는 각 노드에 대해서 출현 빈도수를 증가시키는 것을 특징으로 하는 빈발항목집합 탐색 방법
|
9 |
9
제7항에 있어서,상기 (d) 단계는, 상기 Uk의 항목집합들 중 상기 Bk-1에서 관리되지 않는 중요 항목집합들을 상기 제2 계층 전위 트리에 새로 추가하는 항목집합 추가 단계를 더 포함하는 것을 특징으로 하는 빈발항목집합 탐색 방법
|
10 |
10
제1항에 있어서,깊이 우선 탐색으로 상기 제2 계층 전위 트리를 순회하며 각 노드의 지지도가 사전 정의된 최소 지지도 이상인 노드를 추출하는 빈발항목집합 탐색 단계를 더 포함하는 것을 특징으로 하는 빈발항목집합 탐색 방법
|
11 |
11
제10항에 있어서,상기 빈발항목집합 탐색 단계는, 상기 제1 계층 전위트리의 항목집합을 포함시켜 빈발항목집합을 탐색하는 것을 특징으로 하는 빈발항목집합 탐색 방법
|
12 |
12
제11항에 있어서,상기 제2 계층 전위 트리에서의 빈발항목집합 탐색은 상기 제1 계층 전위트리에서의 빈발항목집합 탐색보다 같거나 낮은 최소 지지도를 가지고 빈발항목집합을 탐색하는 것을 특징으로 하는 빈발항목집합 탐색 방법
|
13 |
13
제5항에 있어서,ω 003e# 0 인 경우에, 압축항목집합을 항목으로 가지고 있는 노드에 의해서 생성될 수 있는 임의의 항목의 출현 빈도수를 추정하는 단계를 더 포함하는 것을 특징으로 하는 빈발항목집합 탐색 방법
|
14 |
14
제13항에 있어서,상기 임의의 항목의 출현 빈도수를 추정하는 단계는, 상기 압축항목집합의 출현 빈도수의 값을 상기 임의의 항목의 출현 빈도수로 사용함으로써 추정하는 것을 특징으로 하는 빈발항목집합 탐색 방법
|
15 |
15
제1항 내지 제14항 중 어느 한 항에 기재된 빈발항목집합 탐색 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체
|