1 |
1
시계열 데이터(time series data)를 포함하는 원본 데이터를 리드(read)하고,상기 원본 데이터에 대한 눈금(unit)을 측정하고,클러스터링 기법을 사용하여 압축 후 데이터와 상기 원본 데이터 사이의 허용 오차를 결정하기 위한 문턱값(threshold)을 결정하고,상기 원본 데이터 중 이상 점(abnormal point)을 보존하기 위해 최장 거리 다운샘플링(Longest Distance downsampling)을 수행하고,상기 원본 데이터 중 시작 점(start point) 및 최종 점(end point)을 저장하고,상기 시작 점과 상기 최종 점을 제외하고, 상기 최장 거리 다운샘플링 수행 결과에 대해 드롭 아웃(drop out)을 수행하고,상기 원본 데이터가 갖는 값들의 개수가, 상기 원본 데이터 길이의 a 배(여기서 a는 0과 1 사이의 값을 갖는 실수)보다 작은 경우, 상기 원본 데이터가 갖는 값들 중 적어도 일부를 기준 점(reference point)으로서 저장하는 것을 포함하는 시계열 데이터 압축 방법
|
2 |
2
제1항에 있어서,상기 최장 거리 다운샘플링을 수행하는 것은,상기 최장 거리 다운샘플링을 수행하기 위한 하나 이상의 구간(interval)을 설정하기 위해 사용되는 윈도우 사이즈(window size)를 가변길이로 설정하여 상기 최장 거리 다운샘플링을 수행하는 가변길이 구간 최장거리 다운샘플링(Longest Distance downsampling with Flexible Interval, LDFI)을 수행하는 것을 포함하는 시계열 데이터 압축 방법
|
3 |
3
제1항에 있어서,상기 원본 데이터에 대한 눈금을 측정하는 것은,상기 원본 데이터 중 인접한 데이터의 값의 차이(difference)를 제1 차분 값으로 측정하고,인접한 상기 제1 차분 값의 차이를 제2 차분 값으로 측겅하고,상기 제2 차분 값 중 최소 값을 상기 눈금으로 결정하는 것을 포함하는 시계열 데이터 압축 방법
|
4 |
4
제1항에 있어서,상기 문턱값을 결정하는 것은,상기 원본 데이터 중 인접한 데이터의 값의 차이(difference)를 제1 차분 값으로 측정하고,K 평균 클러스터링(K-means clustering)을 이용하여 상기 제1 차분 값을 2 개의 클러스터로 분할하고,상기 분할된 2 개의 클러스터 중 더 큰 제1 클러스터에 대해 상기 K 평균 클러스터링을 반복 수행하여 상기 제1 클러스터를 2 개의 클러스터로 분할하고,상기 분할된 2 개의 클러스터 중 더 큰 제2 클러스터가 85 % 미만에 도달한 경우, 상기 제2 클러스터의 98 % 지점에 대응하는 값을 상기 문턱값으로 결정하는 시계열 데이터 압축 방법
|
5 |
5
제1항에 있어서,상기 드롭 아웃을 수행하는 것은,상기 최장 거리 다운샘플링 수행 결과로부터 삭제될 후보(candidate)를 결정하고,상기 후보의 값과, 이에 대응하는 상기 원본 데이터의 값의 차이를 비교하고,상기 후보의 값과, 상기 원본 데이터의 값의 차이가 상기 문턱값을 초과하는 경우, 상기 후보를 상기 최장 거리 다운샘플링 수행 결과에서 삭제하는 것을 포함하는 시계열 데이터 압축 방법
|
6 |
6
시계열 데이터의 압축 결과를 리드(read)하고,상기 압축 결과에 대해 선형 보간(linear interpolation)을 수행하고,원본 데이터에 대한 눈금(unit)이 측정되었는지 판단하고,상기 원본 데이터에 대한 상기 눈금이 측정된 경우, 상기 눈금을 이용하여 상기 선형 보간이 수행된 상기 압축 결과를 복원하고,상기 원본 데이터에 대한 상기 눈금이 측정되지 않은 경우, 상기 원본 데이터가 갖는 값을 이용하여 상기 선형 보간이 수행된 압축 결과를 복원하는 것을 포함하는 시계열 데이터 복원 방법
|
7 |
7
제6항에 있어서,상기 압축 결과에 대한 표준 편차(standard deviation)를 이용하여, 상기 선형 보간이 수행된 압축 결과에 노이즈(noise)를 추가하는 것을 더 포함하는 시계열 데이터 복원 방법
|
8 |
8
제6항에 있어서,상기 원본 데이터가 갖는 값을 이용하여 상기 선형 보간이 수행된 상기 압축 결과를 복원하는 것은,상기 선형 보간이 수행된 압축 결과의 값과, 상기 원본 데이터가 갖는 값을 비교하여, 상기 선형 보간이 수행된 압축 결과의 값을 상기 원본 데이터가 갖는 값 중 가장 가까운 값으로 대체하는 것을 포함하는 시계열 데이터 복원 방법
|
9 |
9
시계열 데이터(time series data)를 포함하는 원본 데이터를 리드(read)하고,상기 원본 데이터에 대한 눈금(unit)을 측정하고,클러스터링 기법을 사용하여 압축 후 데이터와 상기 원본 데이터 사이의 허용 오차를 결정하기 위한 문턱값(threshold)을 결정하고,상기 원본 데이터 중 이상 점(abnormal point)을 보존하기 위해 최장 거리 다운샘플링(Longest Distance downsampling)을 수행하고,상기 원본 데이터 중 시작 점(start point) 및 최종 점(end point)을 저장하고,상기 시작 점과 상기 최종 점을 제외하고, 상기 최장 거리 다운샘플링 수행 결과에 대해 드롭 아웃(drop out)을 수행하고,상기 원본 데이터가 갖는 값들의 개수가, 상기 원본 데이터 길이의 a 배(여기서 a는 0과 1 사이의 값을 갖는 실수)보다 작은 경우, 상기 원본 데이터가 갖는 값들 중 적어도 일부를 기준 점(reference point)으로서 저장하는 것을 수행하는 하나 이상의 인스트럭션을 포함하는 프로그램이 저장된 컴퓨터로 판독 가능한 기록 매체
|
10 |
10
시계열 데이터의 압축 결과를 리드(read)하고,상기 압축 결과에 대해 선형 보간(linear interpolation)을 수행하고,원본 데이터에 대한 눈금(unit)이 측정되었는지 판단하고,상기 원본 데이터에 대한 상기 눈금이 측정된 경우, 상기 눈금을 이용하여 상기 선형 보간이 수행된 상기 압축 결과를 복원하고,상기 원본 데이터에 대한 상기 눈금이 측정되지 않은 경우, 상기 원본 데이터가 갖는 값을 이용하여 상기 선형 보간이 수행된 압축 결과를 복원하는 것을 수행하는 하나 이상의 인스트럭션을 포함하는 프로그램이 저장된 컴퓨터로 판독 가능한 기록 매체
|