1 |
1
적어도 하나의 프로세서에 의해 구동되는 시간 간격 데이터 공개 시스템이 시간 간격 데이터를 처리하는 방법으로서,시작시간과 종료시간으로 구성된 복수의 레코드들을 상삼각행렬과 하삼각행렬로 구성된 사각의 빈도행렬로 생성하고, 상기 상삼각행렬을 분할할 분할 개수를 계산하는 단계,상기 빈도행렬에 포함된 레코드 개수와 미리 설정한 제1 임계값을 비교하여, 상기 빈도행렬에 차분 프라이버시를 적용할지 결정하는 단계,상기 빈도 행렬에 차분 프라이버시를 적용하지 않는 것으로 결정하면, 상기 상삼각행렬을 상기 계산한 분할 개수로 분할하여 생성된 복수의 서브삼각행렬들 중 어느 하나의 서브삼각행렬을 선택하고, 상기 선택한 서브삼각행렬에 포함된 레코드 개수를 미리 설정한 제2 임계값과 비교하여 상기 서브삼각행렬 또는 상기 서브삼각행렬에서 생성된 빈도 벡터 중 어느 하나에 차분 프라이버시를 적용할지 결정하는 단계, 그리고상기 빈도 벡터 또는 상기 서브삼각행렬 중 어느 하나에 차분 프라이버시를 적용하는 단계를 포함하는 시간 간격 데이터 처리 방법
|
2 |
2
삭제
|
3 |
3
제1항에 있어서,상기 분할 개수를 계산하는 단계는,상기 빈도행렬에 포함되어 있는 레코드 개수와 외부로부터 입력된 정보보호 수준을 토대로, 상기 빈도행렬의 노이즈에 의한 오차와 구조에 의한 오차의 합이 최소가 되도록 분할 개수를 결정하는 시간 간격 데이터 처리 방법
|
4 |
4
제3항에 있어서,상기 빈도 행렬에 차분 프라이버시를 적용할지 결정하는 단계는,상기 빈도행렬에 포함된 레코드 개수가 상기 제1 임계값보다 많은지 확인하는 단계, 그리고상기 빈도행렬에 포함된 레코드 개수가 상기 제1 임계값보다 적으면, 상기 빈도행렬에 노이즈를 삽입하는 차분 프라이버시를 적용하는 것으로 결정하는 단계를 포함하는 시간 간격 데이터 처리 방법
|
5 |
5
제4항에 있어서,상기 빈도행렬에 포함된 레코드 개수가 상기 제1 임계값보다 많으면, 상기 빈도 행렬에 차분 프라이버시를 적용하지 않는 것으로 결정하는 단계를 포함하는 시간 간격 데이터 처리 방법
|
6 |
6
제5항에 있어서,상기 어느 하나에 차분 프라이버시를 적용할지 결정하는 단계는,상기 선택한 서브삼각행렬에 포함된 레코드 개수가 상기 제2 임계값보다 많은지 확인하는 단계,상기 서브삼각행렬에 포함된 레코드 개수가 상기 제2 임계값보다 적으면, 상기 서브삼각행렬에 노이즈를 삽입하는 차분 프라이버시를 적용하는 것으로 결정하는 단계, 그리고상기 서브삼각행렬에 포함된 레코드 개수가 상기 제2 임계값보다 많으면, 상기 빈도 벡터에 노이즈를 삽입하는 차분 프라이버시를 적용하는 것으로 결정하는 단계를 포함하는 시간 간격 데이터 처리 방법
|
7 |
7
제6항에 있어서,상기 어느 하나에 차분 프라이버시를 적용하는 단계는,상기 빈도 벡터에 노이즈를 삽입하는 차분 프라이버시를 적용하는 것으로 결정하면, 상기 서브삼각행렬로부터 시작시간을 기준으로 하는 시작시간 벡터, 종료시간을 기준으로 하는 종료시간 벡터, 그리고 지속 시간에 대한 지속 시간 벡터를 각각 생성하는 단계,상기 각각 생성한 시작시간 벡터, 종료시간 벡터, 그리고 지속 시간 벡터에 노이즈를 삽입하는 단계, 그리고각각의 시작시간, 종료시간 쌍에 대한 빈도 기대값을 계산하는 단계, 그리고계산한 빈도 기대값을 상기 노이즈가 삽입된 시작시간 벡터, 종료시간 벡터 그리고 지속 시간 벡터에 반영하여, 노이즈가 삽입된 서브삼각행렬로 재구성하는 단계를 포함하는 시간 간격 데이터 처리 방법
|
8 |
8
제7항에 있어서,상기 서브삼각행렬로 재구성하는 단계는,i 시간을 시작시간으로 하는 복수의 레코드들 중에서, j 시간까지 종료되지 않은 복수개의 활성 레코드를 생성하는 단계,상기 복수개의 활성 레코드들에 종료시간을 지정하고, 상기 j 시간에서 종료되는 레코드가 i 시간에서 시작한 레코드일 확률을 계산하는 단계, 그리고상기 계산한 확률과 상기 종료시간 벡터를 이용하여 빈도 기대값을 계산하여, 상기 빈도 벡터를 서브삼각행렬로 재구성하는 단계를 포함하는 시간 간격 데이터 처리 방법
|
9 |
9
시간 간격 데이터에 차분 프라이버시를 적용하는 시간 간격 데이터 공개 시스템으로서,시작시간과 종료시간으로 이루어진 복수의 레코드들과 사용자에 의해 입력되는 정보보호 수준을 수신하고, 상기 복수의 레코드들을 이용하여 사각의 빈도행렬로 생성하는 입력 정보 수신부,상기 빈도행렬을 상삼각행렬과 하삼각행렬로 분할하고, 상기 상삼각행렬을 분할할 분할 개수를 결정하며, 결정한 분할 개수로 상기 상삼각행렬을 분할하여 복수의 서브삼각행렬들을 생성하는 빈도행렬 분할부,상기 빈도행렬에 포함된 레코드 수와 미리 설정된 제1 임계값 또는 복수의 서브삼각행렬들에 각각 포함된 레코드 수와 미리 설정된 제2 임계값을 비교하여, 차분 프라이버시를 적용할 행렬 형태를 결정하는 비식별화부, 그리고상기 비식별화부에서 복수의 서브삼각행렬 중 선택된 하나의 서브삼각행렬을 기초로 생성된 빈도 벡터에 차분 프라이버시를 적용하는 것으로 결정하면, 상기 선택된 서브삼각행렬을 빈도 벡터로 생성하고, 생성한 빈도 벡터에 노이즈를 삽입하여 차분 프라이버시를 적용하는 빈도 벡터 생성부를 포함하는 시간 간격 데이터 공개 시스템
|
10 |
10
삭제
|
11 |
11
제9항에 있어서,상기 빈도행렬 분할부는,상기 빈도행렬을 주대각선 행렬을 기준으로 상기 상삼각행렬과 하삼각행렬로 분할하고,상기 빈도행렬에 포함되어 있는 레코드 개수와 상기 정보보호 수준을 토대로, 상기 빈도행렬의 노이즈에 의한 오차와 구조에 의한 오차의 합이 최소가 되도록 분할 개수를 결정하는 시간 간격 데이터 공개 시스템
|
12 |
12
제11항에 있어서,상기 빈도행렬 분할부는,상기 빈도행렬의 상삼각행렬을 분할 개수의 제곱에 해당하는 수만큼의 서브삼각행렬들로 분할하는 시간 간격 데이터 공개 시스템
|
13 |
13
제12항에 있어서,상기 비식별화부는,상기 빈도행렬에 포함된 레코드 수가 상기 제1 임계값보다 적으면 상기 빈도행렬에 차분 프라이버시를 적용하는 것으로 결정하는 시간 간격 데이터 공개 시스템
|
14 |
14
제13항에 있어서,상기 비식별화부는,상기 빈도행렬에 포함된 레코드 수가 상기 제1 임계값 보다 많으면, 상기 서브삼각행렬들 중 선택된 서브삼각행렬에 포함된 레코드 수와 상기 제2 임계값을 비교하고,상기 서브삼각행렬에 포함된 레코드 수가 상기 제2 임계값보다 적으면 상기 서브삼각행렬에 차분 프라이버시를 적용하는 것으로 결정하고,상기 서브삼각행렬에 포함된 레코드 수가 상기 제2 임계값보다 많으면, 상기 서브삼각행렬로부터 생성된 빈도 벡터에 차분 프라이버시를 적용하는 것으로 결정하는 시간 간격 데이터 공개 시스템
|
15 |
15
제14항에 있어서,상기 빈도벡터 생성부는,상기 서브삼각행렬을 시작시간 벡터, 종료시간 벡터, 그리고 지속 시간 벡터로 생성하고,상기 시작시간 벡터, 종료시간 벡터, 지속 시간 벡터에 노이즈를 삽입한 후, 노이즈가 삽입된 서브삼각행렬로 재구성하는 시간 간격 데이터 공개 시스템
|
16 |
16
제15항에 있어서,상기 빈도벡터 생성부는,각각의 빈도 벡터로부터, 시작시간과 종료시간 쌍에 대한 빈도 기대값을 계산하는 시간 간격 데이터 공개 시스템
|