1 |
1
학습 데이터들의 분포 특성을 기초로, 오버샘플링(oversampling)할 학습 데이터들을 격리(isolation) 학습 데이터와 노말(normal) 학습 데이터로 구분하는 단계;상기 격리 학습 데이터와 상기 노말 학습 데이터 간의 비율에 따라, 상기 격리 학습 데이터 및 상기 노말 학습 데이터 각각으로부터 오버샘플링할 추가 학습 데이터들의 개수를 결정하는 단계; 및상기 오버샘플링할 학습 데이터들 각각의 개수에 기초하여, 상기 격리 학습 데이터 및 상기 노말 학습 데이터 각각에 대응하는 추가 학습 데이터들을 생성하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
2 |
2
제1항에 있어서, 상기 구분하는 단계는서로 다른 클래스(class)들을 위한 상기 학습 데이터들 중 상기 오버샘플링할 타겟 클래스의 학습 데이터들과 상기 타겟 클래스의 학습 데이터들로부터 오버샘플링할 추가 학습 데이터들 간의 비율을 기초로, 상기 타겟 클래스의 학습 데이터들마다에 대한 최근접 학습 데이터들을 추출하는 단계; 및상기 타겟 클래스의 학습 데이터들마다에 대한 최근접 학습 데이터들을 기초로, 상기 타겟 클래스의 학습 데이터들을 상기 격리 학습 데이터와 상기 노말 학습 데이터로 구분하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
3 |
3
제2항에 있어서, 상기 타겟 클래스의 학습 데이터들마다에 대한 최근접 학습 데이터들을 추출하는 단계는상기 타겟 클래스의 학습 데이터들 각각과의 거리를 기초로, 상기 타겟 클래스의 학습 데이터들과 상기 오버샘플링할 추가 학습 데이터들 간의 비율에 해당하는 최근접 학습 데이터들을 추출하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
4 |
4
제2항에 있어서, 상기 최근접 학습 데이터들을 기초로, 상기 타겟 클래스의 학습 데이터들을 상기 격리 학습 데이터와 상기 노말 학습 데이터로 구분하는 단계는상기 최근접 학습 데이터들 전부가 상기 타겟 클래스의 학습 데이터와 이종의 학습 데이터인 경우, 상기 최근접 학습 데이터들에 대응하는 타겟 클래스의 학습 데이터를 상기 격리 학습 데이터로 구분하는 단계; 및 상기 최근접 학습 데이터들 중 적어도 하나가 상기 타겟 클래스의 학습 데이터와 동종의 학습 데이터인 경우, 상기 최근접 학습 데이터들에 대응하는 타겟 클래스의 학습 데이터를 상기 노말 학습 데이터로 구분하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
5 |
5
제2항에 있어서, 상기 추가 학습 데이터들의 개수를 결정하는 단계는 상기 격리 학습 데이터와 상기 노말 학습 데이터 간의 비율에 따라, 상기 격리 학습 데이터로부터 오버샘플링할 추가 학습 데이터들의 제1 개수 및 상기 노말 학습 데이터로부터 오버샘플링할 추가 학습 데이터들의 제2 개수를 결정하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
6 |
6
제5항에 있어서,상기 추가 학습 데이터들을 생성하는 단계는상기 격리 학습 데이터로부터 오버샘플링할 추가 학습 데이터들의 제1 개수 및 상기 노말 학습 데이터로부터 오버샘플링할 추가 학습 데이터들의 제2 개수에 기초하여, 상기 추가 학습 데이터들을 추출하는 단계; 및상기 격리 학습 데이터와 상기 격리 학습 데이터로부터 추출한 추가 학습 데이터들 간의 제1 거리 및 상기 노말 학습 데이터와 상기 노말 학습 데이터로부터 추출한 추가 학습 데이터들 간의 제2 거리 각각을 기초로, 상기 격리 학습 데이터 및 상기 노말 학습 데이터 각각에 대응하는 추가 학습 데이터들을 생성하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
7 |
7
제6항에 있어서, 상기 추가 학습 데이터들을 추출하는 단계는상기 격리 학습 데이터로부터 오버샘플링할 추가 학습 데이터들의 제1 개수에 기초하여, 상기 타겟 클래스의 학습 데이터들로부터 제3 개수의 추가 학습 데이터들을 추출하는 단계; 및상기 노말 학습 데이터로부터 오버샘플링할 추가 학습 데이터들의 제2 개수에 기초하여, 상기 학습 데이터들로부터 제4 개수의 추가 학습 데이터들을 추출하는 단계 를 포함하는, 학습 데이터를 생성하는 방법
|
8 |
8
제7항에 있어서, 상기 추가 학습 데이터들을 생성하는 단계는상기 격리 학습 데이터와 상기 제3개수의 추가 학습 데이터들 간의 제1 거리 및 상기 노말 학습 데이터와 상기 제4 개수의 추가 학습 데이터들 간의 제2 거리 각각을 기초로, 상기 격리 학습 데이터 및 상기 노말 학습 데이터 각각의 단위 거리 당 샘플링 개수를 산출하는 단계; 및상기 제1 거리, 상기 제2 거리, 및 상기 격리 학습 데이터 및 노말 학습 데이터 각각의 단위 거리 당 샘플링 개수를 기초로, 상기 격리 학습 데이터 및 상기 노말 학습 데이터 각각에 대응하는 추가 학습 데이터들을 생성하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
9 |
9
제8항에 있어서, 상기 격리 학습 데이터 및 상기 노말 학습 데이터 각각의 단위 거리 당 샘플링 개수를 산출하는 단계는 상기 격리 학습 데이터와 상기 제3 개수의 추가 학습 데이터들 간의 제1 거리를 산출하는 단계; 및상기 제1 거리를 기초로, 상기 격리 학습 데이터의 단위 거리 당 샘플링 개수를 산출하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
10 |
10
제8항에 있어서, 상기 추가 학습 데이터들을 생성하는 단계는상기 제1 거리에 반비례하여 상기 격리 학습 데이터에 대응하는 추가 학습 데이터들을 오버샘플링하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
11 |
11
제10항에 있어서, 상기 격리 학습 데이터에 대응하는 추가 학습 데이터들을 오버샘플링하는 단계는상기 제1 거리가 상기 격리 학습 데이터의 단위 거리보다 먼 경우, 상기 격리 학습 데이터로부터 상기 격리 학습 데이터의 단위 거리 당 샘플링 개수보다 적은 개수의 추가 학습 데이터들을 오버샘플링하는 단계; 및 상기 제1 거리가 상기 격리 학습 데이터의 단위 거리보다 같거나 가까운 경우, 상기 격리 학습 데이터로부터 상기 격리 학습 데이터의 단위 거리 당 샘플링 개수보다 많은 개수의 추가 학습 데이터들을 오버샘플링하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
12 |
12
제1항에 있어서, 상기 추가 학습 데이터들을 생성하는 단계는상기 격리 학습 데이터에 대응하는 추가 학습 데이터들과 이종의 학습 데이터들 간의 중첩 여부를 판단하는 단계; 및상기 중첩 여부에 대한 판단 결과를 기초로, 상기 격리 학습 데이터에 대응하는 추가 학습 데이터들을 제거하는 단계를 더 포함하는, 학습 데이터를 생성하는 방법
|
13 |
13
제8항에 있어서, 상기 격리 학습 데이터 및 상기 노말 학습 데이터 각각의 단위 거리 당 샘플링 개수를 산출하는 단계는 상기 노말 학습 데이터와 상기 제4개수의 추가 학습 데이터들 간의 제2 거리를 산출하는 단계; 및 상기 제2 거리를 기초로, 상기 노말 학습 데이터의 단위 거리 당 샘플링 개수를 산출하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
14 |
14
제13항에 있어서, 상기 추가 학습 데이터들을 생성하는 단계는상기 제2거리에 비례하여 상기 노말 학습 데이터에 대응하는 추가 학습 데이터들을 오버샘플링하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
15 |
15
제14항에 있어서, 상기 노말 학습 데이터에 대응하는 추가 학습 데이터들을 오버샘플링하는 단계는상기 제2 거리가 상기 노말 학습 데이터의 단위 거리보다 먼 경우, 상기 노말 학습 데이터로부터 상기 노말 학습 데이터의 단위 거리 당 샘플링 개수보다 많은 개수의 추가 학습 데이터들을 오버샘플링하는 단계; 및 상기 제2거리가 상기 노말 학습 데이터의 단위 거리보다 같거나 가까운 경우, 상기 노말 학습 데이터로부터 상기 노말 학습 데이터의 단위 거리 당 샘플링 개수보다 적은 개수의 추가 학습 데이터들을 오버샘플링하는 단계를 포함하는, 학습 데이터를 생성하는 방법
|
16 |
16
하드웨어와 결합되어 제1항 내지 제15항 중 어느 하나의 항의 방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램
|
17 |
17
학습 데이터들의 분포 특성을 기초로, 오버샘플링할 학습 데이터들을 격리 학습 데이터와 노말 학습 데이터로 구분하고, 상기 격리 학습 데이터와 상기 노말 학습 데이터 간의 비율에 따라, 상기 격리 학습 데이터 및 상기 노말 학습 데이터 각각으로부터 오버샘플링할 추가 학습 데이터들의 개수를 결정하며, 상기 오버샘플링할 학습 데이터들 각각의 개수에 기초하여, 상기 격리 학습 데이터 및 상기 노말 학습 데이터 각각에 대응하는 추가 학습 데이터들을 생성하는프로세서를 포함하는, 학습 데이터를 생성하는 장치
|
18 |
18
제17항에 있어서, 상기 프로세서는서로 다른 클래스들을 위한 상기 학습 데이터들 중 상기 오버샘플링할 타겟 클래스의 학습 데이터들과 상기 타겟 클래스의 학습 데이터들로부터 오버샘플링할 추가 학습 데이터들 간의 비율을 기초로, 상기 타겟 클래스의 학습 데이터들마다에 대한 최근접 학습 데이터들을 추출하고, 상기 타겟 클래스의 학습 데이터들마다에 대한 최근접 학습 데이터들을 기초로, 상기 타겟 클래스의 학습 데이터들을 상기 격리 학습 데이터와 상기 노말 학습 데이터로 구분하는, 학습 데이터를 생성하는 장치
|
19 |
19
제18항에 있어서, 상기 프로세서는상기 타겟 클래스의 학습 데이터들 각각과의 거리를 기초로, 상기 타겟 클래스의 학습 데이터들과 상기 오버샘플링할 추가 학습 데이터들 간의 비율에 해당하는 최근접 학습 데이터들을 추출하는, 학습 데이터를 생성하는 장치
|
20 |
20
제19항에 있어서, 상기 프로세서는상기 최근접 학습 데이터들 전부가 상기 타겟 클래스의 학습 데이터와 이종의 학습 데이터인 경우, 상기 최근접 학습 데이터들에 대응하는 타겟 클래스의 학습 데이터를 상기 격리 학습 데이터로 구분하고, 상기 최근접 학습 데이터들 중 적어도 하나가 상기 타겟 클래스의 학습 데이터와 동종의 학습 데이터인 경우, 상기 최근접 학습 데이터들에 대응하는 타겟 클래스의 학습 데이터를 상기 노말 학습 데이터로 구분하는, 학습 데이터를 생성하는 장치
|