1 |
1
데이터 집합을 구성하는 복수의 데이터 점 중에서 상기 복수의 데이터 점이 위치하는 데이터 공간에서 다른 데이터 점과의 거리정보를 기초로 산출된 초기 밀도값이 최대인 데이터 점을 초기 클러스터 중심으로 결정하는 초기값 결정부;상기 초기 클러스터 중심이 결정되면 상기 데이터 점들 각각에 대해 산출된 밀도값을 기초로 상기 데이터 집합을 복수의 클러스터로 분류하기 위한 복수의 클러스터 중심을 순차적으로 결정하는 클러스터 중심 결정부;순차적으로 결정되는 상기 복수의 클러스터 중심 중에서 현재 클러스터 중심이 결정된 시점에 존재하는 복수의 클러스터 중심과 상기 각각의 데이터 점 사이의 거리정보를 기초로 상기 현재 클러스터 중심에 대응하는 클러스터와 나머지 클러스터 중심에 대응하는 각각의 클러스터 사이의 종속관계를 나타내는 상호정보의 값을 산출하는 상호정보 산출부; 및상기 현재 클러스터 중심이 결정된 시점에서 산출된 상기 상호정보의 값에 의해 상기 현재 클러스터에 대응하는 클러스터가 상기 나머지 클러스터 중심에 대응하는 클러스터 중 적어도 하나와 종속적인 관계인 것으로 결정되면 상기 현재 클러스터 중심의 결정을 취소하고, 상기 현재 클러스터 중심의 이전에 결정된 이전 클러스터 중심이 결정된 시점에서 생성된 복수의 클러스터로 상기 데이터 집합을 분류하는 제어부;를 포함하며,상기 클러스터 중심 결정부는 상기 이전 클러스터 중심을 결정할 때 상기 복수의 데이터 점 각각에 대해 산출된 이전 밀도값을 기초로 상기 복수의 데이터 점 각각의 현재 밀도값을 산출하여 상기 현재 밀도값이 최대인 점을 상기 현재 클러스터 중심으로 결정하는 것을 특징으로 하는 클러스터링 장치
|
2 |
2
삭제
|
3 |
3
제 1항에 있어서,상기 초기값 결정부는 하기 수학식 A에 의해 상기 초기 밀도값을 산출하는 것을 특징으로 하는 클러스터링 장치:[수학식 A]여기서, N은 상기 데이터 점의 개수, D1(m)은 상기 복수의 데이터 점 중에서 m번째 데이터 점에 대한 초기 밀도값, x(n)은 상기 데이터 공간에서 n번째 데이터 점의 위치, x(m)은 상기 데이터 공간에서 상기 m번째 데이터 점의 위치, 그리고 α는 출력값을 얻기 위해 설정되는 디자인 파라미터이다
|
4 |
4
제 1항에 있어서,상기 클러스터 중심 결정부는 하기 수학식 B에 의해 상기 현재 밀도값을 산출하는 것을 특징으로 하는 클러스터링 장치:[수학식 B]여기서, Dk(m)은 상기 복수의 데이터 점 중에서 m번째 데이터 점에 대한 현재 밀도값, Dk-1(m)은 상기 m번째 데이터 점에 대한 이전 밀도값, Dk-1(m*)는 상기 이전 클러스터 중심에 대응하는 데이터 점에 대한 이전 밀도값, x(m)은 상기 데이터 공간에서 상기 m번째 데이터 점의 위치, Ck-1은 상기 데이터 공간에서 상기 이전 클러스터 중심의 위치, 그리고 β는 상기 복수의 클러스터 중심 사이의 거리를 제한하기 위해 결정되는 디자인 파라미터이다
|
5 |
5
제 1항에 있어서,상기 제어부는 하기 수학식 C 내지 수학식 E에 의해 상기 현재 클러스터 중심이 결정된 시점에서 생성된 복수의 클러스터 중에서 상기 현재 클러스터 중심에 대응하는 클러스터와 나머지 클러스터 중심에 대응하는 각각의 클러스터 사이의 상호정보의 값을 산출하고, 상기 산출된 상호정보의 값 중에서 적어도 하나의 값이 양수이면 상기 현재 클러스터 중심의 결정을 취소하는 것을 특징으로 하는 클러스터링 장치:[수학식 C][수학식 D][수학식 E]여기서, ψ(i,k)는 상기 현재 클러스터 중심이 결정된 시점에서 생성된 복수의 클러스터 중에서 i번째 클러스터와 k번째 클러스터 사이의 상호정보의 값, p(i|x(n))은 와 같이 정의되는 상기 i번째 클러스터와 상기 복수의 데이터 점 중에서 n번째 데이터 점 사이의 확률값, x(n)은 상기 데이터 공간에서 상기 n번째 데이터 점의 위치, Ci는 상기 데이터 공간에서 상기 i번째 클러스터에 대응하는 클러스터 중심의 위치, 그리고 Cj는 상기 데이터 공간에서 상기 복수의 클러스터 중 j번째 클러스터에 대응하는 클러스터 중심의 위치이다
|
6 |
6
(a) 데이터 집합을 구성하는 복수의 데이터 점 중에서 상기 복수의 데이터 점이 위치하는 데이터 공간에서 다른 데이터 점과의 거리정보를 기초로 산출된 초기 밀도값이 최대인 데이터 점을 초기 클러스터 중심으로 결정하는 단계;(b) 상기 초기 클러스터 중심이 결정되면 상기 데이터 점들 각각에 대해 산출된 밀도값을 기초로 상기 데이터 집합을 복수의 클러스터로 분류하기 위한 현재 클러스터 중심을 결정하는 단계;(c) 상기 현재 클러스터 중심이 결정된 시점에 존재하는 복수의 클러스터 중심과 상기 각각의 데이터 점 사이의 거리정보를 기초로 상기 현재 클러스터 중심에 대응하는 클러스터와 나머지 클러스터 중심에 대응하는 각각의 클러스터 사이의 종속관계를 나타내는 상호정보의 값을 산출하는 단계; 및(d) 상기 현재 클러스터 중심이 결정된 시점에서 산출된 상기 상호정보의 값에 의해 상기 현재 클러스터에 대응하는 클러스터가 상기 나머지 클러스터 중심에 대응하는 클러스터 중 적어도 하나와 종속적인 관계인 것으로 결정되면 상기 현재 클러스터 중심의 결정을 취소하고, 상기 현재 클러스터 중심의 이전에 결정된 이전 클러스터 중심이 결정된 시점에서 생성된 복수의 클러스터로 상기 데이터 집합을 분류하는 단계;를 포함하며,상기 (b) 단계에서, 상기 이전 클러스터 중심을 결정할 때 상기 복수의 데이터 점 각각에 대해 산출된 이전 밀도값을 기초로 상기 복수의 데이터 점 각각의 현재 밀도값을 산출하여 상기 현재 밀도값이 최대인 데이터 점을 상기 현재 클러스터 중심으로 결정하고,상기 (d) 단계에서 상기 현재 클러스터 중심의 결정이 취소되지 않으면 상기 (b) 단계 내지 상기 (d) 단계가 반복 수행되는 것을 특징으로 하는 클러스터링 방법
|
7 |
7
삭제
|
8 |
8
제 6항에 있어서,상기 (a) 단계에서, 하기 수학식 A에 의해 상기 초기 밀도값을 산출하는 것을 특징으로 하는 클러스터링 방법:[수학식 A]여기서, N은 상기 데이터 점의 개수, D1(m)은 상기 복수의 데이터 점 중에서 m번째 데이터 점에 대한 초기 밀도값, x(n)은 상기 데이터 공간에서 n번째 데이터 점의 위치, x(m)은 상기 데이터 공간에서 상기 m번째 데이터 점의 위치, 그리고 α는 출력값을 얻기 위해 설정되는 디자인 파라미터이다
|
9 |
9
제 6항에 있어서,상기 (b) 단계에서, 하기 수학식 B에 의해 상기 현재 밀도값을 산출하는 것을 특징으로 하는 클러스터링 방법:[수학식 B]여기서, Dk(m)은 상기 복수의 데이터 점 중에서 m번째 데이터 점에 대한 현재 밀도값, Dk-1(m)은 상기 m번째 데이터 점에 대한 이전 밀도값, Dk-1(m*)는 상기 이전 클러스터 중심에 대응하는 데이터 점에 대한 이전 밀도값, x(m)은 상기 데이터 공간에서 상기 m번째 데이터 점의 위치, Ck-1은 상기 데이터 공간에서 상기 이전 클러스터 중심의 위치, 그리고 β는 상기 복수의 클러스터 중심 사이의 거리를 제한하기 위해 결정되는 디자인 파라미터이다
|
10 |
10
제 6항에 있어서,상기 (d) 단계에서, 하기 수학식 C 내지 수학식 E에 의해 상기 현재 클러스터 중심이 결정된 시점에서 생성된 복수의 클러스터 중에서 상기 현재 클러스터 중심에 대응하는 클러스터와 나머지 클러스터 중심에 대응하는 각각의 클러스터 사이의 상호정보의 값을 산출하고, 상기 산출된 상호정보의 값 중에서 적어도 하나의 값이 양수이면 상기 현재 클러스터 중심의 결정을 취소하는 것을 특징으로 하는 클러스터링 방법:[수학식 C][수학식 D][수학식 E]여기서, ψ(i,k)는 상기 현재 클러스터 중심이 결정된 시점에서 생성된 복수의 클러스터 중에서 i번째 클러스터와 k번째 클러스터 사이의 상호정보의 값, p(i|x(n))은 와 같이 정의되는 상기 i번째 클러스터와 상기 복수의 데이터 점 중에서 n번째 데이터 점 사이의 확률값, x(n)은 상기 데이터 공간에서 상기 n번째 데이터 점의 위치, Ci는 상기 데이터 공간에서 상기 i번째 클러스터에 대응하는 클러스터 중심의 위치, 그리고 Cj는 상기 데이터 공간에서 상기 복수의 클러스터 중 j번째 클러스터에 대응하는 클러스터 중심의 위치이다
|
11 |
11
제 6항에 기재된 클러스터링 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|