1 |
1
확률적 결정 경계를 생성하기 위해 표적 데이터 주변의 데이터를 이용하여 대체 모델을 학습하고 저장하는 복수의 대체 모델 학습부; 상기 복수의 대체 모델 학습부로부터 학습된 데이터를 입력 받아 결과를 취합하여 표적 데이터 및 표적 데이터와 다른 라벨을 가질 확률을 계산하는 확률적 결정 경계 생성부; 현재 가지고 있는 데이터 이외에 실제 데이터와 유사한 데이터 후보를 생성하는 후보 생성부; 및상기 후보 생성부에서 생성된 데이터 후보 중 상기 확률적 결정 경계 생성부에서 계산된 확률을 이용하여 거짓 데이터를 생성하는 거짓 데이터 생성부 를 포함하는 데이터 중독 장치
|
2 |
2
제1항에 있어서,상기 복수의 대체 모델 학습부는, 표적 데이터 주변의 데이터를 이용하여 신경망(Neural network), 결정 트리(Decision tree), 서포트 벡터 머신(Support Vector Machine; SVM)을 포함하는 복수의 대체 모델을 이용하여 학습 및 저장하는 데이터 중독 장치
|
3 |
3
제1항에 있어서,상기 확률적 결정 경계 생성부는, 데이터 프로그래밍 기법을 이용하고, 상기 데이터 프로그래밍 기법을 이용하기 위해 대체 모델들 간의 유사성과 의존도를 추론하여 최종 라벨링 확률값을 반환함으로써 각각의 대체 모델을 라벨링 함수(Labeling function)로 변환하고, 결정 경계를 확률적으로 아는 상태에서 데이터의 라벨이 다를 확률이 미리 정해진 기준 이상 높은 데이터만을 선별하고 취합하여 확률적 결정 경계를 생성하는 데이터 중독 장치
|
4 |
4
제1항에 있어서,상기 후보 생성부는, 이산적인 특성값과 범주형 특성값을 가지는 정형 데이터에서 활용하기 위한 워터마킹(Watermarking) 기법을 통해 기반 데이터에 기초하여 표적 데이터와 확률적 결정 경계를 이용하여 거짓 데이터 후보로 생성하는 데이터 중독 장치
|
5 |
5
제1항에 있어서,상기 후보 생성부는, 실제 데이터 분포를 활용하여 자동으로 의존관계를 벗어나는 데이터를 선별하여 특성값들 간의 의존(dependency) 관계를 따르고, 정형 데이터에 활용하기 위한 CTGAN을 통해 표적 데이터와 확률적 결정 경계를 이용하여 거짓 데이터 후보로 생성하는 데이터 중독 장치
|
6 |
6
복수의 대체 모델 학습부가 확률적 결정 경계를 생성하기 위해 표적 데이터 주변의 데이터를 이용하여 대체 모델을 학습하고 저장하는 단계; 확률적 결정 경계 생성부가 상기 복수의 대체 모델 학습부로부터 학습된 데이터를 입력 받아 결과를 취합하여 표적 데이터 및 표적 데이터와 다른 라벨을 가질 확률을 계산하는 단계; 후보 생성부가 현재 가지고 있는 데이터 이외에 실제 데이터와 유사한 데이터 후보를 생성하는 단계; 및거짓 데이터 생성부가 상기 후보 생성부에서 생성된 데이터 후보 중 상기 확률적 결정 경계 생성부에서 계산된 확률을 이용하여 거짓 데이터를 생성하는 단계를 포함하는 데이터 중독 방법
|
7 |
7
제6항에 있어서,상기 확률적 결정 경계 생성부가 상기 복수의 대체 모델 학습부로부터 학습된 데이터를 입력 받아 결과를 취합하여 표적 데이터 및 표적 데이터와 다른 라벨을 가질 확률을 계산하는 단계는, 데이터 프로그래밍 기법을 이용하고, 상기 데이터 프로그래밍 기법을 이용하기 위해 대체 모델들 간의 유사성과 의존도를 추론하여 최종 라벨링 확률값을 반환함으로써 각각의 대체 모델을 라벨링 함수(Labeling function)로 변환하고, 결정 경계를 확률적으로 아는 상태에서 데이터의 라벨이 다를 확률이 미리 정해진 기준 이상 높은 데이터만을 선별하고 취합하여 확률적 결정 경계를 생성하는 데이터 중독 방법
|
8 |
8
제6항에 있어서,상기 후보 생성부가 현재 가지고 있는 데이터 이외에 실제 데이터와 유사한 데이터 후보를 생성하는 단계는, 이산적인 특성값과 범주형 특성값을 가지는 정형 데이터에서 활용하기 위한 워터마킹(Watermarking) 기법을 통해 기반 데이터에 기초하여 표적 데이터와 확률적 결정 경계를 이용하여 거짓 데이터 후보로 생성하는 데이터 중독 방법
|
9 |
9
제6항에 있어서,상기 후보 생성부가 현재 가지고 있는 데이터 이외에 실제 데이터와 유사한 데이터 후보를 생성하는 단계는,실제 데이터 분포를 활용하여 자동으로 의존관계를 벗어나는 데이터를 선별하여 특성값들 간의 의존(dependency) 관계를 따르고, 정형 데이터에 활용하기 위한 CTGAN을 통해 표적 데이터와 확률적 결정 경계를 이용하여 거짓 데이터 후보로 생성하는 데이터 중독 방법
|
10 |
10
데이터 중독 장치에 의해 수행되는 데이터 중독 방법을 실행시키기 위해 컴퓨터 판독 가능한 저장 매체에 저장된 프로그램에 있어서,복수의 대체 모델 학습부가 확률적 결정 경계를 생성하기 위해 표적 데이터 주변의 데이터를 이용하여 대체 모델을 학습하고 저장하는 단계; 확률적 결정 경계 생성부가 상기 복수의 대체 모델 학습부로부터 학습된 데이터를 입력 받아 결과를 취합하여 표적 데이터 및 표적 데이터와 다른 라벨을 가질 확률을 계산하는 단계; 후보 생성부가 현재 가지고 있는 데이터 이외에 실제 데이터와 유사한 데이터 후보를 생성하는 단계; 및거짓 데이터 생성부가 상기 후보 생성부에서 생성된 데이터 후보 중 상기 확률적 결정 경계 생성부에서 계산된 확률을 이용하여 거짓 데이터를 생성하는 단계를 포함하는 컴퓨터 판독 가능한 저장 매체에 저장된 프로그램
|