1 |
1
데이터 스트림 환경에서 가변 크기 샘플링 방법에서, 컴퓨터의 중앙처리 장치에서 미리 정해진 균일신뢰도의 하한(ε)을 항상 만족하는 윈도우의 최대 크기를 계산하는 단계;상기 중앙처리 장치에서 윈도우의 최대 크기가 계산되면, 샘플링하고자 하는 데이터 스트림을 입력받는 단계;상기 중앙처리 장치에서 상기 윈도우의 최대 크기와 현재까지 유입된 데이터 스트림 길이를 비교하는 단계; 상기 중앙처리 장치에서 상기 윈도우의 최대 크기가 상기 데이터 스트림 길이보다 크면, 샘플 크기 및 샘플링 비율 검사를 진행하는 단계;상기 중앙처리 장치에서 상기 샘플 크기 및 샘플링 비율 검사를 진행한 결과, 현재 샘플 크기가 상기 데이터 스트림의 미리 정해진 P% 미만이면, 샘플 크기를 증가시키기 위해 슬롯을 생성한 후, 샘플링을 수행하는 단계; 및상기 중앙처리 장치에서 상기 샘플 크기 및 샘플링 비율 검사를 진행한 결과, 현재 샘플 크기가 상기 데이터 스트림의 미리 정해진 P% 이상이면, 슬롯을 생성하지 않고, 바로 샘플링을 수행하는 단계를 포함하는 가변 크기 샘플링 방법
|
2 |
2
청구항 1에 있어서, 상기 중앙처리 장치에서 상기 윈도우의 최대 크기가 상기 데이터 스트림 길이보다 작으면, 현재 윈도우에서 생성된 샘플을 저장소에 저장하는 단계; 및상기 중앙처리 장치에서 새로운 윈도우를 생성하여 상기 샘플 크기 및 샘플링 비율 검사를 진행하는 단계를 더 포함하는 것을 특징으로 하는 가변 크기 샘플링 방법
|
3 |
3
청구항 2에 있어서, 상기 샘플링을 수행하는 단계에서, 상기 중앙처리 장치는 데이터 스트림 원소가 슬롯에 선택될 확률이 임의로 생성한 난수 값보다 크면, 해당 데이터 스트림을 슬롯에 삽입하여 기존 슬롯에 저장되어 있던 원소와 교체하는 것을 특징으로 하는 가변 크기 샘플링 방법
|
4 |
4
청구항 1에 있어서, p(∈[0,1])는 샘플링 비율이라고 할 때, 상기 P%는 p×100인 것임을 특징으로 하는 가변 크기 샘플링 방법
|
5 |
5
청구항 4에 있어서,ε은 균일신뢰도의 하한이고, p는 샘플링 비율이고, k는 현재까지 들어온 스트림 크기이고, m은 샘플 크기가 1 증가할 때 들어올 수 있는 최대 입력 스트림 크기라고 할 때, 상기 중앙처리 장치는, 의 수학식을 이용하여 샘플링 비율 p와 균일신뢰도 하한 ε을 만족하는 윈도우의 최대 크기를 계산하는 것을 특징으로 하는 가변 크기 샘플링 방법
|