1 |
1
시간계열(time-series)로 나열된 n개의 요소들로 구성된 n 차원의 데이터 시퀀스(data sequence)들을 유사 정도에 따라 클러스터링하여, 유사한 데이터 시퀀스들끼리 그룹화된 복수의 데이터 시퀀스 그룹을 생성하는 단계;상기 복수의 데이터 시퀀스 그룹 각각을 대표하는 최소 경계 시퀀스(Minimum Bounding Sequence: MBS)들로서, 각 데이터 시퀀스 그룹 내에서 동일한 차원의 요소들 중 최소값에 해당하는 요소들과 최대값에 해당하는 요소들로 구성된 상기 최소 경계 시퀀스를 정의하는 단계; 및상기 정의된 MBS들과 질의 시퀀스(query sequence) 간의 동적 시간 교정(Dynamic Time Warping: DTW) 기법에 따라 측정한 최소 DTW 거리로서, 상기 MBS로 대표되는 그룹에 속하는 각 데이터 시퀀스와 질의 시퀀스 간에 계산된 거리들 중 가장 작은 거리로 정의되는 상기 최소 DTW 거리에 기초하여 상기 데이터 시퀀스를 색인하는 단계;를 포함하는 시퀸스 데이터 색인 방법
|
2 |
2
제1항에 있어서, 상기 최소 경계 시퀀스는,로 정의되며, 상기 는 시퀀스 그룹이고, 상기 이고, 상기 는 상기 의 최소 경계 시퀀스이고, 상기 는 상기 를 구성하는 요소들 중 상기 최소 값에 해당하는 요소이고, 상기 는 를 구성하는 요소들 중 상기 최대 값에 해당하는 요소인 것인 시퀸스 데이터 색인 방법
|
3 |
3
제1항에 있어서, 상기 최소 DTW 거리는,로 정의되며, 상기 는 질의 시퀀스이고, 상기 는 상기 와 의 i 번째 요소인 와 간의 최소거리인 것인 시퀸스 데이터 색인 방법
|
4 |
4
제1항에 있어서, 상기 복수의 시퀀스 그룹을 생성하는 단계는,K-means 클러스터링 기법에 따라 상기 데이터 시퀀스들을 클러스터링하여, 그룹화된 상기 복수의 데이터 시퀀스 그룹을 생성하는 것인 시퀸스 데이터 색인 방법
|
5 |
5
제1항에 있어서, 상기 최소 경계 시퀀스를 정의하는 단계에서, 상기 정의된 최소 경계 시퀀스들을 플랫 파일 구조(Flat file structure)형태로 메모리에 저장하는 단계를 포함하고, 상기 시퀀스를 색인하는 단계는,상기 플랫 파일 구조 형태로 저장된 최소 경계 시퀀스들을 참조하여 상기 질의 시퀀스와의 동적 시간 교정(Dynamic Time Warping: DTW)에 따라 최소 DTW 거리를 측정하는 단계를 포함하는 것인 시퀸스 데이터 색인 방법
|
6 |
6
제5항에 있어서, 상기 메모리에 저장하는 단계는,상기 정의된 최소 경계 시퀀스들을 상기 플랫 파일 구조인 VA-파일(Vector Approximation-file) 구조로 상기 메모리에 저장하되,하나의 시퀀스 그룹에 속해 있는 상기 데이터 시퀀스나 최소 경계 시퀀스는 상기 메모리 내의 하나의 디스크 페이지에 저장되고, 각 데이터 시퀀스 그룹에 포함된 데이터 시퀀스를 저장하는 페이지 식별자(ID)와 상기 최소 경계 시퀀스를 한 쌍으로 하는 엔트리 정보를 상기 VA-파일구조에 저장하는 단계를 포함하는 것인 시퀸스 데이터 색인 방법
|
7 |
7
제1항 내지 제4항 중 어느 한 항에 기재된 데이터 시퀀스 색인 방법의 각 단계를 컴퓨터로 실행시키기 위한 소스 프로그램을 기록한 것을 특징으로 하는 프로그램 기록매체
|