1 |
1
호스트머신이 데이터 저장장치에 기입된 데이터의 스트림을 분할하는 방법에 있어서,a) 호스트머신이 파일 시스템 단계에서 구분된 데이터 타입과 어플리케이션 단계의 사용자데이터인지 확인하는 단계;b) 호스트머신이 상기 파일시스템단계의 데이터를 파일시스템의 변경사항을 기록하는 저널데이터, 파일시스템의 운용과정에서 데이터관리에 사용되는 메타데이터 및 그 외의 파일시스템 단계의 데이터인 기타데이터로 구분하여 각각 고유 식별자를 부여하는 단계; 및c) 호스트머신이 상기 사용자 데이터를 기입방식에 따라, 상기 호스트머신의 캐시 메모리와 상기 저장장치 내 같은 파일의 데이터 간의 일치성을 보장하지 않는 비동기식 기입데이터, 상기 호스트머신의 캐시 메모리와 저장장치 내 같은 파일의 데이터를 일치시키는 동기식 데이터 중, 기존 파일이 없이 생성되는 동기식 생성 기입 데이터, 및 기존에 존재하던 파일의 데이터를 보존한 상태에서 해당 파일의 끝부분에 이어서 데이터를 추가하는 동기식 추가 기입데이터; 로 구분하여 각각 고유한 식별자를 부여하는 단계; 를 포함하는 것을 특징으로 하는 스트림 분할방법
|
2 |
2
제1항에 있어서,상기 호스트머신이 상기 동기식 추가기입데이터에 대한 분할방법은 (a) 호스트 머신이 기입하는 파일의 기입 시간 간격 평균을 산출하고 데이터의 크기를 수집하는 단계;(b) 상기 산출한 값이 속한 시간 범위에 대응하는 추가기입 스트림에 스트림 식별자를 배정하는 단계; 및(c) 특정시간 범위를 추가기입 스트림에 분배하는 단계; 를 포함하는 것을 특징으로 하는 스트림 분할방법
|
3 |
3
제2항에 있어서,상기 (a) 단계에서 기입 시간 간격 평균은,(a-1) 호스트머신이 특정량의 동기식 추가 기입 시간 간격인 최근 추가 인터벌 표본을 큐 형태로 각각 축적하는 단계; (a-2) 호스트머신이 상기 최근 추가 인터벌 표본의 평균과 표준편차를 계산하고 큐에서 사용한 최근 추가 인터벌 표본을 삭제하는 단계; 및(a-3) 호스트머신이 상기 (b)과정에서 구한 평균과 표준편차를 가지는 정규분포로부터 경계값을 설정하여 시간 범위를 분할하는 단계; 를 포함하는 것을 특징으로 하는 스트림 분할방법
|
4 |
4
제2항에 있어서,상기 (b)단계에서, 상기 추가기입 스트림에 시간 범위가 부여된 적이 없는 경우에 해당하는 동기식 추가기입 데이터는 모두 같은 스트림 식별자를 부여하는 것을 특징으로 하는, 스트림 분할방법
|
5 |
5
제2항에 있어서,상기 (c) 단계에서, 상기 추가기입 스트림에 특정 시간 범위를 분배하기 위해 동기식 추가기입 명령 이후, 기입 명령된 파일의 가장 최근 두 동기식 기입 시간 간격을 계산하는 단계: 를 포함하는 것을 특징으로 하는, 스트림 분할방법
|
6 |
6
제2항에 있어서,상기 (c) 단계에서, 상기 추가기입 스트림에 시간 범위가 부여된 적이 없는 경우, 동기식 추가기입 데이터의 누적량을 산출하고, 상기 산출된 동기식 추가기입 데이터의 누적량이 '추가기입 스트림 수 Х 한 블록의 크기' 이상이 될 때 각 추가기입 스트림에 시간 범위가 분배되는 것을 특징으로 하는 스트림 분할방법
|
7 |
7
제2항에 있어서,상기 (c) 단계에서, 상기 추가기입 스트림에 시간 범위가 부여된 적이 있는 경우에는, 동기식 추가기입 데이터의 누적량을 산출하고, 상기 산출된 동기식 추가기입 데이터의 누적량이 '(추가기입 스트림 )2 × 한 블록의 크기' 이상이 될 때 추가기입 스트림에 시간 범위가 분배되는 것을 특징으로 하는, 스트림 분할방법
|
8 |
8
제2항에 있어서,상기 (c) 단계에서 상기 호스트머신이 추가기입 스트림에 시간 범위를 분배하는 방법은,(d-1) 상기 동기식 기입 시간 사이 간격 평균과 표준편차를 산출하는 단계;(d-2) 상기 산출된 동기식 기입 시간 사이 간격 평균과 표준편차를 가지는 정규분포로부터 누적확률과 확률변수를 산출하는 단계; (d-3) 상기 정규분포에 대하여, 분배할 시간 영역에서 누적확률이 각각 N/추가기입 스트림 수(N은 추가기입 스트림 수 이하의 모든 자연수)가 되는 확률변수 값들을 경계값으로 하여 시간 영역을 겹치지 않게 분할하는 단계; 및(d-4) 상기 경계값에 의해 분할된 시간 영역을 각 추가기입 스트림에 배정하는 단계; 를 포함하는 스트림 분할방법
|
9 |
9
제8항에 있어서,상기 (d-3) 단계에서, 상기 경계값에 음수의 수가 존재할 경우, 음수인 경계값의 개수를 산출한 후, 양의 경계값 중 가장 작은 값을 음수인 경계값의 개수 + 1등분 하는 값들로 음수의 경계값들을 대체하는 단계; 를 더 포함하는 것을 특징으로 하는 스트림 분할방법
|
10 |
10
제1항에 있어서,상기 동기식 추가 기입데이터는, 총 동기식 기입횟수, 가장 최근 동기식 기입시간, 현재 동기식 기입시간 및 가장 최근 계산된 추가인터벌 평균이 기입되는 것을 특징으로 하는 스트림 분할방법
|
11 |
11
제10항에 있어서,상기 추가인터벌 평균은 다음 수학식에 의해 산출되는 것을 특징으로 하는 스트림 분할방법
|
12 |
12
제8항에 있어서,상기 호스트 머신은 상기 표준편차로부터 '추가 기입 스트림 수 - 분위수' 들을 산출하여 추가 기입 스트림의 인터벌 범위 경계값으로 설정하는 것을 더 포함하는 것을 특징으로 하는 스트림 분할방법
|
13 |
13
제3항에 있어서,상기 (a-2) 단계는 상기 호스트머신이 큐파일이 비었는지 여부를 판단하고, 큐파일에 엔트리가 남아 있다고 판단이 되면, 다시 큐파일을 읽고 읽은 엔트리는 삭제하는 과정을 상기 큐파일에 남은 엔트리가 없을 때까지 반복되는 것을 특징으로 하는 스트림 분할방법
|