1 |
1
데이터베이스 질의의 선택율을 추정하기 위하여 스키마관리자가 데이터 분포를 근사시키는 통계 자료를 구함에 있어서, 데이터 분포를 크기가 작은 다수개의 다차원 히스토그램 버켓을 생성하는 단계; 생성된 다차원 히스토그램 버켓들로부터 히스토그램 정보를 다차원 이산 여현 변환(DCT)을 이용하여 정보의 양을 줄이는 방법으로서, DCT 계수중 큰 계수를 선택하는 기하학적인 영역 샘플링시 DCT 계수의 위치 인덱스의 합이 주어진 샘플링 바운드값 보다 작은 DCT 계수 만을 선택하는 삼각 샘플링 방법(Triangular Sampling)을 이용하는 단계; 상기 압축 저장된 히스토그램 정보를 통계 자료로 사용하여 질의의 선택율을 추정하는 단계로서, qk를 k차원의 범위 질의라 하고, qk의 범위를 ai≤xi≤bi, 1≤i≤k, 데이터 공간이 (0,1)n 로 정규화 되어 있다고 하고, xi좌표는 Ni개의 영역으로 분할된다고 하면, qk의 선택율은
3
데이터베이스 질의의 선택율을 추정하기 위하여 스키마관리자가 데이터 분포를 근사시키는 통계 자료를 구함에 있어서, 데이터 분포를 크기가 작은 다수개의 다차원 히스토그램 버켓을 생성하는 단계; 생성된 다차원 히스토그램 버켓들로부터 히스토그램 정보를 다차원 이산 여현 변환(DCT)을 이용하여 정보의 양을 줄이는 방법으로서, DCT 계수중 큰 계수를 선택하는 기하학적인 영역 샘플링시 DCT 계수의 위치 인덱스에 1을 더한 값들을 곱한 값이 주어진 샘플링 바운드값보다 작은 DCT 계수 만을 선택하는 상반 샘플링 방법(Reciprocal Sampling)을 이용하는 단계; 상기 압축 저장된 히스토그램 정보를 통계 자료로 사용하여 질의의 선택율을 추정하는 단계로서, qk를 k차원의 범위 질의라 하고, qk의 범위를 ai≤xi≤bi, 1≤i≤k, 데이터 공간이 (0,1)n 로 정규화 되어 있다고 하고, xi좌표는 Ni개의 영역으로 분할된다고 하면, qk의 선택율은
4
데이터베이스 질의의 선택율을 추정하기 위하여 스키마관리자가 데이터 분포를 근사시키는 통계 자료를 구함에 있어서, 데이터 분포를 크기가 작은 다수개의 다차원 히스토그램 버켓을 생성하는 단계; 생성된 다차원 히스토그램 버켓들로부터 히스토그램 정보를 다차원 이산 여현 변환(DCT)을 이용하여 정보의 양을 줄이는 방법으로서, DCT 계수중 큰 계수를 선택하는 기하학적인 영역 샘플링시 DCT 계수의 위치 인덱스의 제곱의 합이 주어진 샘플링 바운드값보다 작은 DCT 계수 만을 선택하는 구 샘플링 방법(Spherical Sampling)을 이용하는 단계; 상기 압축 저장된 히스토그램 정보를 통계 자료로 사용하여 질의의 선택율을 추정하는 단계로서, qk를 k차원의 범위 질의라 하고, qk의 범위를 ai≤xi≤bi, 1≤i≤k, 데이터 공간이 (0,1)n 로 정규화 되어 있다고 하고, xi좌표는 Ni개의 영역으로 분할된다고 하면, qk의 선택율은
5
제1항, 제3항 또는 제4항중 어느 한 항에 있어서, 데이터의 삽입과 삭제가 자주 있는 환경에서 동적인 데이터 갱신 정보를 질의의 선택율 추정을 위한 상기 통계 자료에 곧바로 반영하기 위하여, 상기 이산 여현 변환의 선형성을 이용하여 데이터가 새로 삽입되면 삽입된 데이터의 DCT 계수들을 계산하여 현재의 DCT 계수들에 가산하고, 데이터가 삭제되면 삭제된 데이터의 DCT계수들을 계산하여 현재의 DCT 계수들에서 감산하는 것을 특징으로 하는 압축된 히스토그램 정보를 사용한 다차원 선택율 추정 방법
|