1 |
1
삭제
|
2 |
2
지속적으로 발생되는 트랜잭션들로 구성되는 비한정적 데이터 집합인 데이터 스트림으로부터 연관규칙을 생성하는 방법에 있어서,
이미 발생한 트랜잭션들에 포함된 항목집합들 및 상기 항목집합들의 출현빈도수가 전위트리를 이용하여 관리되고, 상기 전위트리의 각 노드는 특정 항목과 상기 노드에 대응하는 특정 항목집합의 출현빈도수 정보를 가질 때,
(a) 현재 발생한 트랜잭션에 포함된 항목집합 및 상기 항목집합의 출현 빈도수에 따라서 상기 항목집합에 대응하는 노드가 가지고 있는 정보를 갱신하거나 새로운 노드를 추가하는 단계;
(b) 상기 전위트리의 각 노드에 해당하는 항목집합에 대하여 지지도를 소정의 임계값인 최소 지지도와 비교하여 빈발항목집합들을 선택하는 단계; 및
(c) 상기 선택된 빈발항목집합들에 해당하는 노드들 중 전부 또는 일부의 노드들을 방문하면서 상기 방문된 노드들 각각이 가지고 있는 정보를 이용하여 연관규칙을 생성하는 단계를 포함하고,
상기 (c) 단계는,
(c1) 루트 노드로부터 상기 노드들 중 연관규칙을 생성하고자 하는 항목집합에 대응하는 노드까지의 경로 상에 있는 노드들 각각이 가지고 있는 항목 및 출현빈도수를 상기 경로 상의 순서대로 스택에 저장하는 단계; 및
(c2) 상기 스택에 저장된 항목 및 출현빈도수를 이용하여 상기 항목집합에 대한 연관규칙을 생성하는 단계를 포함하는 것을 특징으로 하는 연관규칙 생성 방법
|
3 |
3
제2항에 있어서,
상기 항목집합에 포함된 항목들이 사전적 정렬순서를 이루고 있을 때, 상기 (c2) 단계는,
(c21) 연관규칙의 조건부에 포함된 모든 항목들의 사전적 정렬 순서가 결과부에 포함된 항목들 중 사전적 정렬 순서가 가장 앞선 항목보다 모두 앞서 있는 형태의 연관규칙인 순방향 연관규칙을 생성하는 단계; 및
(c22) 상기 항목집합에 대한 연관규칙 중 상기 순방향 연관규칙을 제외한 형태의 연관규칙인 역방향 연관규칙을 생성하는 단계를 포함하는 것을 특징으로 하는 연관규칙 생성 방법
|
4 |
4
제3항에 있어서,
상기 (c21) 단계에서의 상기 순방향 연관규칙의 생성은, 상기 항목집합이 n-항목집합인 e=i1i2…in이고, 상기 스택의 j번째 층(여기서, j=1, 2,
|
5 |
5
제3항에 있어서,
상기 (c22) 단계에서 상기 역방향 연관규칙을 생성하기 위하여, 상기 항목집합이 n-항목집합인 e=i1i2…in일 때, 상기 스택에 저장된 항목 및 출현빈도수(정보)를 이용하여, 항목 i1이 조건부에 포함되는 연관규칙을 생성하고, 항목 i1이 결과부에 포함되는 연관규칙을 생성하는 것을 특징으로 하는 연관규칙 생성방법
|
6 |
6
제2항에 있어서,
상기 (c) 단계는 깊이 우선 탐색 방법을 이용하여 상기 노드들을 방문하고, 상기 방문된 노드들 각각에 해당하는 항목집합에 대하여 연관규칙을 생성하는 것을 특징으로 하는 연관규칙 생성방법
|
7 |
7
지속적으로 발생되는 트랜잭션들로 구성되는 비한정적 데이터 집합인 데이터 스트림으로부터 연관규칙을 생성하는 방법에 있어서,
이미 발생한 트랜잭션들에 포함된 항목집합들 및 상기 항목집합들의 출현빈도수가 전위트리를 이용하여 관리되고, 상기 전위트리의 각 노드는 특정 항목과 상기 노드에 대응하는 특정 항목집합의 출현빈도수 정보를 가질 때,
(a) 현재 발생한 트랜잭션에 포함된 항목집합 및 상기 항목집합의 출현 빈도수에 따라서 상기 항목집합에 대응하는 노드가 가지고 있는 정보를 갱신하거나 새로운 노드를 추가하는 단계;
(b) 상기 전위트리의 각 노드에 해당하는 항목집합에 대하여 지지도를 소정의 임계값인 최소 지지도와 비교하여 빈발항목집합들을 선택하는 단계; 및
(c) 상기 선택된 빈발항목집합들에 해당하는 노드들 중 전부 또는 일부의 노드들을 방문하면서 상기 방문된 노드들 각각이 가지고 있는 정보를 이용하여 연관규칙을 생성하는 단계를 포함하고,
상기 (c) 단계는,
(c1) 루트 노드로부터 상기 노드들 중 임의의 노드까지의 경로 상에 있는 노드들 각각이 가지고 있는 정보를 상기 경로 상의 순서대로 스택에 저장하는 단계;
(c2) 상기 스택에 저장된 정보를 이용하여 상기 임의의 노드에 대응하는 항목집합에 대한 연관규칙을 생성하는 단계;
(c3) 상기 스택의 최상위에 저장된 정보인 상기 임의의 노드에 대응하는 항목 및 출현빈도수를 삭제하고, 상기 임의의 노드의 형제노드 또는 부모노드를 방문하여 상기 방문된 형제노드 또는 부모노드가 가지고 있는 정보를 상기 스택에 저장하는 단계; 및
(c4) 상기 스택에 저장된 정보를 이용하여 상기 형제노드 또는 부모노드에 대응하는 항목집합에 대한 연관규칙을 생성하는 단계를 포함하는 것을 특징으로 하는 연관규칙 생성방법
|
8 |
8
제7항에 있어서,
상기 항목집합에 포함된 항목들이 사전적 정렬순서를 이루고 있을 때, 상기 (c2) 단계 또는 상기 (c4) 단계는 각각,
연관규칙의 조건부에 포함된 모든 항목들의 사전적 정렬 순서가 결과부에 포함된 항목들 중 사전적 정렬 순서가 가장 앞선 항목보다 모두 앞서 있는 형태의 연관규칙인 순방향 연관규칙을 생성하는 단계; 및
상기 항목집합에 대한 연관규칙 중 상기 순방향 연관규칙을 제외한 형태의 연관규칙인 역방향 연관규칙을 생성하는 단계를 포함하는 것을 특징으로 하는 연관규칙 생성 방법
|
9 |
9
제7항에 있어서,
상기 (c2) 단계 또는 상기 (c4) 단계에서 상기 항목집합에 대한 연관규칙의 생성은, 상기 항목집합의 부분항목집합들 모두가 각각 조건부가 되는 연관규칙의 신뢰도를 계산하고, 소정의 임계값인 최소 신뢰도와 비교하여 연관규칙을 생성하는 것을 특징으로 하는 연관규칙 생성방법
|
10 |
10
제7항에 있어서,
상기 (c2) 단계 또는 상기 (c4) 단계에서 상기 항목집합에 대한 연관규칙의 생성은, 상기 항목집합의 부분항목집합들 중 적어도 일부가 조건부가 되는 연관규칙의 신뢰도를 검사하여 연관규칙을 생성하는 한편, 상기 항목집합의 부분항목집합들 중 임의의 부분항목집합을 조건부로 하는 연관규칙의 신뢰도가 소정의 임계값인 최소 신뢰도보다 작은 경우, 상기 임의의 부분항목집합의 부분집합을 조건부로 하는 연관규칙의 신뢰도는 검사하지 않는 것을 특징으로 하는 연관규칙 생성방법
|
11 |
11
제10항에 있어서,
상기 항목집합에 포함된 항목들이 사전적 정렬순서를 이루고 있을 때,
상기 (c2) 단계 또는 상기 (c4) 단계에서, 연관규칙의 조건부에 포함된 모든 항목들의 사전적 정렬 순서가 결과부에 포함된 항목들 중 사전적 정렬 순서가 가장 앞선 항목보다 모두 앞서 있는 형태의 연관규칙인 순방향 연관규칙의 생성은, 상기 스택을 위에서 아래로 탐색하면서 상기 스택에 저장된 정보를 이용하여 상기 항목집합의 부분항목집합들의 신뢰도를 검사하는 것을 특징으로 하는 연관규칙 생성방법
|
12 |
12
제11항에 있어서,
상기 (c2) 단계 또는 상기 (c4) 단계에서, 상기 항목집합에 대한 연관규칙 중 상기 순방향 연관규칙을 제외한 형태의 연관규칙인 역방향 연관규칙의 생성은, 상기 전위트리의 각 노드를 방문하면서 상기 각 노드에 대응하는 항목집합이 상기 역방향 연관규칙을 생성하고자 하는 항목집합의 부분집합인지 여부 및 상기 역방향 연관규칙을 생성하고자 하는 항목집합의 마지막 항목보다 사전적 정렬 순서가 앞서는지 여부의 조건을 검사하고, 상기 조건을 만족하는 노드에 대응하는 항목집합을 조건부로 하는 연관규칙의 신뢰도를 검사하는 한편, 상기 조건을 만족하지 않는 노드의 자손 노드들은 방문하지 않는 것을 특징으로 하는 연관규칙 생성방법
|
13 |
13
제2항에 있어서,
상기 (c) 단계에서, 특정 항목집합 X가 조건부에 위치하는 연관규칙을 생성하고자 할 때, 전위순위 탐색방법으로 상기 특정 항목집합 X의 수퍼집합에 대응하는 각 노드를 방문하면서 연관규칙을 생성하되, 임의의 방문된 노드에 대하여 연관규칙 X→e-X(여기서, e는 상기 임의의 방문된 노드에 대응하는 항목집합)가 성립되지 않는 경우, 상기 임의의 방문된 노드의 자손 노드들은 방문하지 않는 것을 특징으로 하는 연관규칙 생성방법
|
14 |
14
제2항에 있어서,
상기 (c) 단계에서, 특정 항목집합 Y가 결과부에 위치하는 연관규칙을 생성하고자 할 때, 전위순위 탐색방법으로 상기 특정 항목집합 Y의 수퍼집합에 대응하는 각 노드를 방문하면서 연관규칙을 생성하되, 임의의 방문된 노드에 대하여 연관규칙 e-Y→Y(여기서, e는 상기 임의의 방문된 노드에 대응하는 항목집합)가 성립되지 않는 경우, 상기 임의의 방문된 노드의 자손 노드들은 방문하지 않는 것을 특징으로 하는 연관규칙 생성방법
|
15 |
15
제2항 내지 제14항 중 어느 한 항에 기재된 연관규칙 생성방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체
|
16 |
16
삭제
|
17 |
17
지속적으로 발생되는 트랜잭션들로 구성되는 비한정적 데이터 집합인 데이터 스트림으로부터 연관규칙을 생성하는 데이터 마이닝 시스템에 있어서,
이미 발생한 트랜잭션들에 포함된 항목집합들 및 상기 항목집합들의 출현빈도수가 전위트리를 이용하여 관리되고, 상기 전위트리의 각 노드는 특정 항목과 상기 노드에 대응하는 특정 항목집합의 출현빈도수 정보를 가지는 상기 전위 트리를 저장하는 전위 트리 저장부;
현재 발생한 트랜잭션에 포함된 항목집합 및 상기 항목집합의 출현 빈도수에 따라서 상기 항목집합에 대응하는 노드가 가지고 있는 정보를 갱신하거나 새로운 노드를 추가하는 전위 트리 갱신부;
상기 전위트리의 각 노드에 해당하는 항목집합에 대하여 지지도를 소정의 임계값인 최소 지지도와 비교하여 빈발항목집합들을 선택하는 빈발항목집합 선택부;
루트 노드로부터 상기 선택된 빈발항목집합들에 해당하는 노드들 중 연관규칙을 생성하고자 하는 항목집합에 대응하는 노드까지의 경로 상에 있는 노드들 각각이 가지고 있는 항목 및 출현빈도수를 상기 경로 상의 순서대로 저장하기 위한 스택; 및
상기 노드들 중 전부 또는 일부의 노드들을 방문하면서 상기 방문된 노드들 각각이 가지고 있는 정보를 이용하여 연관규칙을 생성하되, 상기 스택에 저장된 항목 및 출현빈도수를 이용하여 상기 항목집합에 대한 연관규칙을 생성하는 연관규칙 생성부를 포함하는 것을 특징으로 하는 데이터 마이닝 시스템
|
18 |
18
제17항에 있어서,
상기 항목집합에 포함된 항목들이 사전적 정렬순서를 이루고 있을 때,
상기 연관규칙 생성부는, 연관규칙의 조건부에 포함된 모든 항목들의 사전적 정렬 순서가 결과부에 포함된 항목들 중 사전적 정렬 순서가 가장 앞선 항목보다 모두 앞서 있는 형태의 연관규칙인 순방향 연관규칙을 생성하고, 상기 항목집합에 대한 연관규칙 중 상기 순방향 연관규칙을 제외한 형태의 연관규칙인 역방향 연관규칙을 생성하는 것을 특징으로 하는 데이터 마이닝 시스템
|