1 |
1
하나 이상의 속성을 포함하는 데이터 집합에서 이상 속성을 포함하는 데이터를 검출하기 위한 데이터 검출 장치의 방법에 있어서, 상기 데이터 검출 장치가 상기 데이터에 포함되는 속성들의 수치 범위를 각각 적어도 하나의 구간(interval)으로 분할하고, 상기 속성들의 값을 상기 값을 포함하는 구간으로 각각 대체함으로써 상기 데이터를 트랜잭션으로 변환하는 데이터 전처리 단계; 상기 데이터 검출 장치가 상기 트랜잭션들의 집합으로부터 상기 속성들 중 관련성 있는 속성들 간의 정상적 관계를 나타내는 데이터 연관 패턴(data association pattern, DAP)을 결정하는 데이터 연관 패턴 결정 단계; 상기 데이터 검출 장치가 결정된 데이터 연관 패턴들 각각의 중요도(significance)를 결정하는 중요도 결정 단계; 및 상기 데이터 검출 장치가 상기 데이터 연관 패턴을 부분 집합으로서 포함하는 데이터를 결정하고, 결정된 데이터의 속성들에 대해 상기 데이터 연관 패턴의 중요도를 이용하여 상기 데이터가 이상 속성을 포함하는지 여부를 결정하는 이상치 판정 단계를 포함하는 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 방법
|
2 |
2
제1항에 있어서, 상기 데이터 전처리 단계는, 상기 속성들의 값에 계층적 군집화(hierarchical clustering) 기법을 적용하여 상기 속성들의 값이 포함될 수 있는 수치 범위를 적어도 하나의 구간으로 분할(discretization)하는 단계를 더 포함하는 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 방법
|
3 |
3
제1항에 있어서, 상기 데이터 연관 패턴 결정 단계는, 상기 트랜잭션들의 집합으로부터 서로 관련성이 있는 구간들을 추출하여 패턴 p를 생성하는 단계; 전체 데이터 내에서의 상기 패턴 p의 발생 빈도를 나타내는 지지도(support) 및 상기 패턴을 구성하는 구간들 간의 상관 관계의 정도를 나타내는 신뢰도(confidence)를 연산하는 단계; 및 소정의 임계치보다 큰 지지도 및 신뢰도를 가지는 패턴 p를 상기 데이터 연관 패턴으로서 결정하는 단계를 더 포함하는 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 방법
|
4 |
4
제3항에 있어서, 상기 중요도 결정 단계는, 상기 패턴 p의 지지도 및 신뢰도를 각각 정규화하고, 정규화된 지지도 및 신뢰도의 평균을 상기 패턴 p의 강도(strength)로서 결정하는 단계; 및 상기 패턴 p의 강도를 정규화하고, 정규화된 강도 및 상기 패턴 p를 구성하는 구간들의 개수를 고려하여 상기 패턴 p의 중요도를 결정하는 단계를 더 포함하는 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 방법
|
5 |
5
제4항에 있어서, 상기 패턴 p의 신뢰도 conf(p)는 다음 수학식에 의하여 결정되고, (단, Si∈S-{p}, S는 p의 가능한 하위패턴들의 집합, n=2|p|-2 이다)강도 strength(p)는 다음 수학식에 의하여 결정되며, 중요도 significance(p)는 다음 수학식에 의하여 결정되는 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 방법(단, S는 p와 동일한 길이를 갖는 데이터 연관 패턴들의 집합, |p|-1≤significance(p)≤|p| 이다)
|
6 |
6
제1항에 있어서, 상기 이상치 판정 단계는, 상기 데이터 연관 패턴을 부분 집합으로서 포함하는 것으로 결정된 데이터의 속성들에 각각에 대하여, 상기 속성에 상응하는 구간을 포함하는 데이터 연관 패턴들의 중요도를 합산하는 단계; 합산된 속성별 중요도 중 최대값을 이용하여 각 속성별 중요도를 정규화하는 단계; 정규화된 결과를 소정의 임계치와 비교하는 단계; 및 정규화된 결과가 상기 임계치보다 작을 경우 상기 데이터가 이상 속성을 포함하는 것으로 결정하는 단계를 더 포함하는 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 방법
|
7 |
7
제1항에 있어서, 상기 데이터는, 장래의 소프트웨어 프로젝트 관리에 이용되는 속성으로 구성되는 완료된 소프트웨어 프로젝트 정보들의 집합인 소프트웨어 프로젝트 데이터(software project data)인 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 방법
|
8 |
8
제 1항 내지 제 7항 중 어느 한 항에 따른 데이터 검출 방법을 기능시키기 위한 프로그램이 기록되며, 컴퓨터로 읽을 수 있는 기록 매체
|
9 |
9
하나 이상의 속성을 포함하는 데이터 집합에서 이상 속성을 포함하는 데이터를 검출하기 위한 장치에 있어서, 상기 데이터에 포함되는 속성들의 수치 범위를 각각 적어도 하나의 구간으로 분할하고, 상기 속성들의 값을 상기 값을 포함하는 구간으로 각각 대체함으로써 상기 데이터를 트랜잭션으로 변환하는 데이터 전처리부; 상기 트랜잭션들의 집합으로부터 상기 속성들 중 관련성 있는 속성들 간의 정상적 관계를 나타내는 데이터 연관 패턴(DAP)을 결정하는 데이터 연관 패턴 결정부; 결정된 데이터 연관 패턴들 각각의 중요도를 결정하는 중요도 결정부; 및 상기 데이터 연관 패턴을 부분 집합으로서 포함하는 데이터를 결정하고, 결정된 데이터의 속성들에 대해 상기 데이터 연관 패턴의 중요도를 이용하여 상기 데이터가 이상 속성을 포함하는지 여부를 결정하는 이상치 판정부를 포함하는 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 장치
|
10 |
10
제9항에 있어서, 상기 데이터 전처리부는, 상기 속성들의 값에 계층적 군집화 기법을 적용하여 상기 속성들의 값이 포함될 수 있는 수치 범위를 적어도 하나의 구간으로 분할하는 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 장치
|
11 |
11
제9항에 있어서, 상기 데이터 연관 패턴 결정부는, 상기 트랜잭션들의 집합으로부터 서로 관련성이 있는 구간들을 추출하여 패턴 p를 생성하고, 전체 데이터 내에서의 상기 패턴 p의 발생 빈도를 나타내는 지지도 및 상기 패턴을 구성하는 구간들 간의 상관관계의 정도를 나타내는 신뢰도를 연산하며, 및 소정의 임계치보다 큰 지지도 및 신뢰도를 가지는 패턴 p를 상기 데이터 연관 패턴으로서 결정하는 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 장치
|
12 |
12
제11항에 있어서, 상기 중요도 결정부는, 상기 패턴 p의 지지도 및 신뢰도를 각각 정규화하고, 정규화된 지지도 및 신뢰도의 평균을 상기 패턴 p의 강도로서 결정하며, 및 상기 패턴 p의 강도를 정규화하고, 정규화된 강도 및 상기 패턴 p를 구성하는 구간들의 개수를 고려하여 상기 패턴 p의 중요도를 결정하는 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 장치
|
13 |
13
제12항에 있어서, 상기 데이터 연관 패턴 결정부는, 상기 패턴 p의 신뢰도 conf(p)를 다음 수학식에 의하여 결정하고, (단, Si∈S-{p}, S는 p의 가능한 하위패턴들의 집합, n=2|p|-2 이다)상기 중요도 결정부는, 강도 strength(p)를 다음 수학식에 의하여 결정하며, 중요도 significance(p)를 다음 수학식에 의하여 결정하는 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 장치
|
14 |
14
하나 이상의 속성을 포함하는 데이터 집합에서 이상 속성을 포함하는 데이터를 검출하기 위한 장치에 있어서, 상기 데이터에 포함되는 속성들의 수치 범위를 각각 적어도 하나의 구간으로 분할하고, 상기 속성들의 값을 상기 값을 포함하는 구간으로 각각 대체함으로써 상기 데이터를 트랜잭션으로 변환하는 데이터 전처리부; 상기 트랜잭션들의 집합으로부터 상기 속성들 중 관련성 있는 속성들 간의 정상적 관계를 나타내는 데이터 연관 패턴(DAP)을 결정하는 데이터 연관 패턴 결정부; 결정된 데이터 연관 패턴들 각각의 중요도를 결정하는 중요도 결정부; 및 상기 데이터 연관 패턴을 부분 집합으로서 포함하는 데이터를 결정하고, 결정된 데이터의 속성들에 대해 상기 데이터 연관 패턴의 중요도를 이용하여 상기 데이터가 이상 속성을 포함하는지 여부를 결정하며, 상기 데이터 연관 패턴을 부분 집합으로서 포함하는 것으로 결정된 데이터의 속성들에 각각에 대하여, 상기 속성에 상응하는 구간을 포함하는 데이터 연관 패턴들의 중요도를 합산하고, 합산된 속성별 중요도 중 최대값을 이용하여 각 속성별 중요도를 정규화하며, 정규화된 결과를 소정의 임계치와 비교하고, 및 정규화된 결과가 상기 임계치보다 작을 경우 상기 데이터가 이상 속성을 포함하는 것으로 결정하는 이상치 판정부를 포함하는 것을 특징으로 하는 이상 속성을 포함하는 데이터 검출 장치
|
15 |
15
삭제
|