1 |
1
학습 데이터에 대한 데이터 불균형 처리를 위한 오버 샘플링 방법에 있어서, (a) 학습 데이터에 대하여 잠재 변수 공간에 대한 특징들을 추출하는 인코딩 단계; (b) 상기 특징이 추출된 잠재 변수 공간에서의 소수 범주의 데이터들에 대하여 오버샘플링하는 오버샘플링 단계; (c) 상기 오버 샘플링된 잠재 변수 공간에 대하여 디코딩하는 디코딩 단계; 를 구비하여, 학습 데이터를 재구성하여 소수 범주의 데이터와 다수 범주의 데이터의 균형을 맞춘 것을 특징으로 하는 학습 데이터에 대한 오버 샘플링 방법
|
2 |
2
제1항에 있어서, 상기 (a) 단계는 오토인코더의 구조를 갖는 생성 모델(Generative Model)을 이용하여 학습 데이터의 잠재 변수 공간에 대한 특징들을 추출하는 것을 특징으로 하는 학습 데이터에 대한 오버 샘플링 방법
|
3 |
3
제2항에 있어서, 상기 오토인코더의 구조를 갖는 생성 모델(Generative Model)은 변분 인코더(Variable Autoencoder, VAE)와 적대적 생성 네트워크(Generative Adversarial Network, GAN)를 결합한 적대적 오토인코더(Adversarial Auto-Encoder, AAE)를 적용하는 것을 특징으로 하는 학습 데이터에 대한 오버 샘플링 방법
|
4 |
4
제1항에 있어서, 상기 (b) 단계는,잠재 변수 공간의 소수 범주의 각 샘플에 대하여 사전 설정된 개수(k)의 최근접 이웃을 합성하여 새로운 샘플들을 생성하여, 소수 범주의 샘플들에 대하여 오버 샘플링하는 것을 특징으로 하는 학습 데이터에 대한 오버 샘플링 방법
|
5 |
5
제4항에 있어서, 상기 (b) 단계는,소수 범주의 한 샘플()을 선택하고, 사전 설정된 개수(k)의 최근접 이웃으로부터 임의의 이웃()을 선택하고, 0과 1 사이의 난수( )를 생성하고, 아래의 수학식에 따라 합성 샘플( )을 생성하는 것을 특징으로 하는 학습 데이터에 대한 오버 샘플링 방법
|
6 |
6
제1항에 있어서, 상기 (b) 단계는 SMOTE((Synthetic Minority Over-sampling Technique)을 이용하여 오버샘플링하는 것을 특징으로 하는 학습 데이터에 대한 오버 샘플링 방법
|
7 |
7
제1항에 있어서, 상기 (b) 단계는 소수 범주의 데이터와 다수 범주의 데이터가 동일 비율이 될 때까지 반복 수행되는 것을 특징으로 하는 학습 데이터에 대한 오버 샘플링 방법
|
8 |
8
제1항에 있어서, 상기 (c) 단계는 오버샘플링된 소수 범주의 데이터만을 복원하고, 초기의 학습 데이터와 복원된 오버샘플들로 학습 데이터를 재구성하는 것을 특징으로 하는 학습 데이터에 대한 오버 샘플링 방법
|
9 |
9
제1항에 있어서, 상기 (c) 단계는초기의 학습 데이터와 오버샘플링된 소수 범주의 데이터를 모두 복원하고, 복원된 학습 데이터와 복원된 오버 샘플들로 학습 데이터를 재구성하는 것을 특징으로 하는 학습 데이터에 대한 오버 샘플링 방법
|
10 |
10
청구항 제1항에 따른 학습 데이터에 대한 오버 샘플링 방법을 구현한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체
|