1 |
1
다변량 스트림 데이터를 사전에 정의된 클래스 집합 중의 하나로 분류하는 장치에 있어서,
입력된 다변량 스트림 데이터를 기호를 사용하여 하나의 문자열로 변환하는 데이터 변환부,
상기 변환된 문자열에 엔-그램(n-gram) 방법을 적용하여 n 개(n은 자연수)의 음절을 갖는 부분 문자열들의 집합을 생성하는 부분 문자열 생성부,
상기 생성된 부분 문자열 집합에서 상기 각 클래스에 대한 모티프(Motif)가 될 수 있는 부분 문자열을 추출하는 모티프 추출부 및
상기 추출된 부분 문자열에 기초하여 상기 다변량 스트림 데이터를 상기 클래스 집합 중의 하나로 분류하는 데이터 분류부
를 포함하는 다변량 스트림 데이터 분류 장치
|
2 |
2
제 1 항에 있어서,
상기 추출된 부분 문자열들 중 임의의 2개의 상기 부분 문자열 사이의 시간 관계 정보를 생성하는 시간 정보 생성부 및
미리 설정되어 있는 시간 범위 내의 상기 시간 관계 정보가 상기 각 클래스에서 차지하는 가중치 값을 산출하는 상호 정보 생성부를 더 포함하되
상기 데이터 분류부는 상기 시간 관계 정보 및 상기 가중치 값에 기초하여 상기 다변량 스트림 데이터를 상기 클래스 집합 중의 하나로 분류하는 것인 다변량 스트림 데이터 분류 장치
|
3 |
3
제 1 항에 있어서,
상기 데이터 변환부는 상기 다변량 스트림 데이터를 정규화시키고, 상기 다변량 스트림 데이터의 연속된 두 시점의 정규화된 값의 차에 대한 누적 확률 분포를 산출하고, 상기 산출된 누적 확률 분포에 기초하여 브레이크 포인트(breakpoint)를 결정하고, 상기 브레이크 포인트에 기초하여 상기 기호를 결정하는 것인 다변량 스트림 데이터 분류 장치
|
4 |
4
제 1 항에 있어서,
상기 부분 문자열 생성부는 2 개의 음절을 갖는 부분 문자열들의 집합, 3개의 음절을 갖는 부분 문자열들의 집합, 4 개의 음절을 갖는 부분 문자열들의 집합 및 5 개의 음절을 갖는 부분 문자열들의 집합 중 하나 이상의 집합을 생성하는 다변량 스트림 데이터 분류 장치
|
5 |
5
제 3 항에 있어서,
상기 기호는 상기 다변량 스트림 데이터의 두 개의 시점 사이의 데이터의 증감 변화 정도와 연계된 것인 다변량 스트림 데이터 분류 장치
|
6 |
6
제 3 항에 있어서,
상기 기호는 U, u, D, d 및 S를 포함하되,
상기 U는 상기 다변량 스트림 데이터의 두 시점 사이의 데이터의 급격한 상승, 상기 u는 단조로운 상승, 상기 D는 급격한 감소, 상기 d는 단조로운 감소, 상기 S는 안정화를 의미하는 것인 다변량 스트림 데이터 분류 장치
|
7 |
7
제 3 항에 있어서,
상기 기호는 U, u, D, d 및 S를 포함하되,
상기 S는 상기 연속된 두 시점의 정규화된 값의 차이가 -0
|
8 |
8
제 1 항에 있어서,
상기 모티프 추출부는 상기 각 클래스에 대한 상기 각 부분 문자열의 가중치를 결정하는 TFIDF(Term Frequency and Inverse Document Frequency) 값을 이용하는 것인 다변량 스트림 데이터 분류 장치
|
9 |
9
제 2 항에 있어서,
상기 시간 관계 정보는 이전(before), 만남(meet), 중첩(overlap), 시작(start), 포함(during) 및 종료(finish)를 포함하는 것인 다변량 스트림 데이터 분류 장치
|
10 |
10
제 9 항에 있어서,
상기 상호 정보 생성부 상기 추출된 부분 문자열들 중 미리 설정되어 있는 시간 범위 내의 임의의 2개의 상기 부분 문자열과 상기 2개의 부분 문자열이 형성하는 상기 시간 관계 정보 간의 상호 정보(Mutual Information) 값을 이용하는 것인 다변량 스트림 데이터 분류 장치
|
11 |
11
다변량 스트림 데이터를 사전에 정의된 클래스 집합 중의 하나로 분류하는 방법에 있어서,
(a) 입력된 상기 다변량 스트림 데이터를 기호를 사용하여 하나의 문자열로 변환하는 단계,
(b) 상기 변환된 문자열에 엔-그램(n-gram) 방법을 적용하여 n 개(n은 자연수)의 음절을 갖는 부분 문자열들의 집합을 생성하는 단계,
(c) 상기 생성된 부분 문자열 집합에서 상기 각 클래스에 대한 모티프(Motif)가 될 수 있는 부분 문자열을 추출하는 단계 및
(d) 상기 추출된 모티프가 될 수 있는 부분 문자열에 기초하여 상기 다변량 스트림 데이터를 상기 클래스 집합 중의 하나로 분류하는 단계
를 포함하는 다변량 스트림 데이터 분류 방법
|
12 |
12
제 11 항에 있어서,
(e) 상기 추출된 부분 문자열들 중 임의의 2개의 상기 부분 문자열 사이의 시간 관계 정보를 생성하는 단계 및
(f) 미리 설정되어 있는 시간 범위 내의 상기 시간 관계 정보가 상기 각 클래스에서 차지하는 가중치 값을 산출하는 단계를 더 포함하되
상기 (d) 단계는 상기 시간 관계 정보 및 상기 가중치 값에 기초하여 상기 다변량 스트림 데이터를 상기 클래스 집합 중의 하나로 분류하는 것인 다변량 스트림 데이터 분류 방법
|
13 |
13
제 11 항에 있어서,
상기 (a) 단계는
(a1) 상기 다변량 스트림 데이터를 정규화시키는 단계,
(a2) 상기 다변량 스트림 데이터의 연속된 두 시점의 정규화된 값의 차에 대한 누적 확률 분포를 산출하는 단계 및
(a3) 상기 산출된 누적 확률 분포에 기초하여 브레이크 포인트(breakpoint)를 결정하는 단계
를 포함하는 것인 다변량 스트림 데이터 분류 방법
|
14 |
14
제 11 항에 있어서,
상기 (b) 단계는 2 개의 음절을 갖는 부분 문자열들의 집합, 3 개의 음절을 갖는 부분 문자열들의 집합, 4 개의 음절을 갖는 부분 문자열들의 집합, 5 개의 음절을 갖는 부분 문자열들의 집합 중 하나 이상의 집합을 생성하는 단계
를 포함하는 다변량 스트림 데이터 분류 방법
|
15 |
15
제 13 항에 있어서,
상기 기호는 상기 다변량 스트림 데이터의 두 개의 시점 사이의 데이터의 증감 변화 정도와 연계된 것인 다변량 스트림 데이터 분류 방법
|
16 |
16
제 13 항에 있어서,
상기 기호는 U, u, D, d 및 S를 포함하되,
상기 U는 상기 다변량 스트림 데이터의 두 시점 사이의 데이터의 급격한 상승, 상기 u는 단조로운 상승, 상기 D는 급격한 감소, 상기 d는 단조로운 감소, 상기 S는 안정화를 의미하는 것인 다변량 스트림 데이터 분류 방법
|
17 |
17
제 13 항에 있어서,
상기 기호는 U, u, D, d 및 S를 포함하되,
상기 S는 상기 연속된 두 시점의 정규화된 값의 차이가 -0
|
18 |
18
제 11 항에 있어서,
상기 (c) 단계는 상기 각 클래스에 대한 상기 각 부분 문자열의 가중치를 결정하는 TFIDF(Term Frequency and Inverse Document Frequency) 값을 이용하는 것인 다변량 스트림 데이터 분류 방법
|
19 |
19
제 12 항에 있어서,
상기 시간 관계 정보는 이전(before), 만남(meet), 중첩(overlap), 시작(start), 포함(during) 및 종료(finish)를 포함하는 것인 다변량 스트림 데이터 분류 방법
|
20 |
20
제 19 항에 있어서,
상기 (f) 단계는 상기 추출된 부분 문자열들 중 미리 설정되어 있는 시간 범위 내의 임의의 2개의 상기 부분 문자열과 상기 2개의 부분 문자열이 형성하는 상기 시간 관계 정보 간의 상호 정보(Mutual Information) 값을 이용하는 것인 다변량 스트림 데이터 분류 방법
|
21 |
21
제 11 항 내지 제 20 항 중 어느 하나의 항에 기재된 단계를 수행하는 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체
|
22 |
22
삭제
|
23 |
23
삭제
|