1 |
1
다차원 데이터 스트림에서 실시간 이상치 탐지 장치의 동작 방법으로서,실시간 입력된 다차원 데이터들을 그리드 셀 영역에 배치하고, 그리드 셀 영역에 배치된 데이터 분포에 기초하여 그리드 셀의 커널 센터에 대한 가중치를 설정하는 단계, 현재 시점의 데이터 분포와 직전 시점의 데이터 분포를 비교하여 서로 대응하는 커널 센터마다 가중치의 누적 변화량을 산출하고, 상기 누적 변화량에 기초하여 그리드 셀 영역에서 불변 영역을 설정하는 단계, 상기 불변 영역의 커널 센터의 밀도를 갱신 마지막 시점에서의 설정된 밀도로 유지하고, 상기 불변 영역을 제외한 커널 센터의 밀도를 산출하여 갱신하는 단계, 그리고 현재 시점의 다차원 데이터들의 밀도를 추정하고, 다차원 데이터의 밀도와 해당 다차원 데이터와의 최근접한 커널 센터의 밀도간의 상대적 차이 값에 기초하여 미리 설정된 임의의 개수의 다차원 데이터를 이상치로 검출하는 단계 를 포함하는 동작 방법
|
2 |
2
제1항에서,상기 커널 센터에 대한 가중치를 설정하는 단계는, 그리드 셀에 위치하는 다차원 데이터의 개수를 상기 그리드 셀에 대한 커널 센터의 가중치로 설정하는 동작 방법
|
3 |
3
제1항에서,상기 불변 영역을 설정하는 단계는,상기 그리드 셀 내의 데이터 개수의 순 변화량을 나타내는 상기 가중치의 누적 변화량이 설정된 한계치 이하의 값을 가지면 불변 영역으로 분류하고, 상기 누적 변화량이 한계치보다 큰 값을 가지면 갱신 영역으로 분류하는 동작 방법
|
4 |
4
제3항에서,상기 커널 센터의 밀도를 산출하여 갱신하는 단계는, 상기 갱신 영역에 해당되는 최근접한 k개(k는 자연수)의 상이한 커널 센터간의 거리와 커널 함수(kernel function)에 기초하여 상기 해당 커널 센터의 밀도를 산출하는 동작 방법
|
5 |
5
제3항에서,상기 이상치로 검출하는 단계는, 상기 현재 시점에서의 다차원 데이터마다 해당 위치에서 최근접한 k개(k는 자연수)의 커널 센터간의 거리와 커널 함수(kernel function)에 기초하여 상기 다차원 데이터마다의 밀도를 추정하는 동작 방법
|
6 |
6
제5항에서,상기 이상치로 검출하는 단계는, 상기 상대적 차이 값을 이상치 점수로 산정하고, 상기 이상치 점수가 가장 높은 순서에 따라 상기 임의의 개수의 다차원 데이터를 이상치로 검출하거나 미리 설정된 임계치 이상의 이상치 점수를 가지는 다차원 데이터를 이상치로 검출하는 동작 방법
|
7 |
7
제6항에서,상기 이상치로 검출하는 단계는, 상기 그리드 셀 안에서 다차원 데이터의 위치에 기초하여 그리드 셀마다 다차원 데이터의 밀도 상한값과 밀도 하한값을 추정하고, 상기 밀도 상한값과 상기 밀도 하한값에 기초하여 이상치 점수의 상한 값과 하한 값을 산출하는 동작 방법
|
8 |
8
제6항에서,상기 이상치로 검출하는 단계는, 그리드 셀마다 이상치 점수의 상한 값과 하한 값들을 비교하여 일부 그리드 셀이 가지는 이상치 점수의 상한값보다 높은 이상치 점수의 하한값을 가지는 하나 이상의 그리드 셀을 후보 그리드 셀로 선택하고, 상기 후보 그리드 셀 내의 위치하는 다차원 데이터들을 대상으로 상기 임의의 개수의 다차원 데이터를 상기 이상치를 검출하는 동작 방법
|
9 |
9
컴퓨팅 장치로서,명령어들을 포함하는 메모리, 그리고상기 명령어들을 실행하여 다차원 스트림 데이터에서 이상치를 검출하는 적어도 하나의 프로세서를 포함하고,상기 프로세서는실시간 입력된 다차원 데이터들을 그리드 셀 영역에 배치하고, 그리드 셀 영역에 배치된 데이터 분포에 기초하여 그리드 셀의 커널 센터에 가중치를 설정하고, 현재 시점의 데이터 분포와 직전 시점의 데이터 분포를 비교하여, 서로 대응되는 그리드 셀의 커널 센터에 설정된 가중치의 누적 변화량에 따라 불변 영역과 갱신 영역으로 분류하며, 갱신 영역 내 커널 센터의 밀도를 산출하여 갱신하고 상기 다차원 데이터들마다 밀도를 추정하여 다차원 데이터의 밀도와 해당 다차원 데이터와의 최근접한 커널 센터의 밀도간의 상대적 차이 값에 기초하여 미리 설정된 임의의 개수의 다차원 데이터를 이상치로 검출하는 컴퓨팅 장치
|
10 |
10
제9항에서,상기 프로세서는, 상기 그리드 셀에 위치하는 다차원 데이터의 수를 상기 커널 센터의 가중치로 설정하고, 상기 커널 센터의 가중치 분포에 대한 변화량을 통해 상기 누적 변화량을 산출하는 컴퓨팅 장치
|
11 |
11
제9항에서,상기 프로세서는,커널 센터의 밀도 또는 다차원 데이터의 밀도를 각 위치에서의 최근접한 k개의 커널 센터와의 거리와 커널 함수(kernel function)에 기초하여 산출하는 컴퓨팅 장치
|
12 |
12
제9항에서,상기 프로세서는, 상기 불변 영역의 커널 센터의 밀도를 갱신 마지막 시점에서의 설정된 밀도로 유지하고, 상기 불변 영역을 제외한 커널 센터의 밀도를 산출하여 갱신하여 상기 현재 시점에서의 커널 센터의 밀도를 저장하는 컴퓨팅 장치
|
13 |
13
제9항에서,상기 프로세서는, 상기 그리드 셀 안에서 다차원 데이터의 위치에 기초하여 그리드 셀마다 다차원 데이터의 밀도를 상한 값과 하한 값으로 추정하고, 상기 밀도 상한 값과 밀도 하한값에 기초하여 상기 상대적 차이값의 상한 값과 하한 값으로 산출하며,그리드 셀마다 상한 값과 하한 값들을 비교하여 그리드 셀 중에서 상기 상대적 차이값의 하한값이 다른 그리드 셀들의 상한값 보다 큰 값을 가지는 그리드 셀을 후보 그리드 셀을 선택하는 컴퓨팅 장치
|
14 |
14
제13항에서,상기 프로세서는, 상기 후보 그리드 셀에 위치한 다차원 데이터의 개수가 상기 임의의 개수보다 큰 값을 가지도록 하나 이상의 후보 그리드 셀을 선택하고, 상기 후보 그리드 셀 내에 위치하는 다차원 데이터들 중에서 상기 상대적 차이값이 큰 순서대로 임의의 개수의 다차원 데이터를 이상치로 선택하는 컴퓨팅 장치
|