1 |
1
데이터 처리 장치에 의해 수행되는 불균형 데이터를 위한 데이터 처리 방법으로서, 불균형 원본 데이터를 복수의 클래스 데이터로 구분하고, 상기 구분된 복수의 클래스 데이터를 각각 학습하여 각각의 클래스에 대한 리프리젠테이션 모델(Representation model)을 구축하는 단계; 상기 복수의 클래스 데이터와 상기 구축된 복수의 리프리젠테이션 모델을 각각 조합하여 계산된 클래스 데이터 및 리프리젠테이션 모델 간의 적합도에 따라, 상기 계산된 적합도가 임계값 미만인 클래스 데이터를 제거하여 상기 불균형 원본 데이터를 언더 샘플링(Under-sampling)하는 단계; 상기 언더 샘플링된 불균형 원본 데이터를 분류기를 이용하여 분류하는 단계; 및 상기 분류기의 분류 결과, 분류기의 성능이 기설정된 분류 기준치 미만인 경우 상기 임계값을 업데이트하는 단계를 포함하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
제1항에 있어서,상기 임계값을 업데이트하는 단계는, 상기 임계값을 임계 조정값만큼 조정하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
|
5 |
5
제1항에 있어서,상기 모델을 구축하는 단계는,각 클래스 데이터의 구조적 특징을 학습하여 각 클래스 데이터에 대한 리프리젠테이션 모델을 생성하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
|
6 |
6
제1항에 있어서,상기 모델을 구축하는 단계는,각 클래스 데이터에 대한 리프리젠테이션 모델 생성 시, 각 클래스 데이터에 대한 리프리젠테이션 모델의 입력과 출력을 동일한 데이터로 설정하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
|
7 |
7
제1항에 있어서,상기 리프리젠테이션 모델은, 오토 인코더(Auto-encoder) 구조를 사용하고, 복수의 층 구조와 정류된 선형 유닛(ReLU, Rectified Linear Unit) 함수로 이루어지는 인코더(encoder)와, 복수의 층 구조와 쌍곡선 탄젠트 함수(tanh, Hyperbolic Tangent) 함수로 이루어지는 디코더(decoder)를 포함하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
|
8 |
8
제1항에 있어서,상기 언더 샘플링하는 단계는, 상기 복수의 클래스 데이터 중에서 어느 하나의 클래스 데이터와, 상기 복수의 리프리젠테이션 모델 중에서 어느 하나의 리프리젠테이션 모델을 조합하여 데이터 및 모델 간의 적합도를 계산하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
|
9 |
9
제1항에 있어서,상기 언더 샘플링하는 단계는, 데이터 및 모델 간의 적합도 계산 시, 조합된 클래스 데이터의 인스턴스(instance)와 조합된 리프리젠테이션 모델 간의 복원 에러(reconstruction error)를 데이터 및 모델 간의 적합도로 계산하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
|
10 |
10
제1항에 있어서,상기 복수의 클래스 데이터 중에서 제2 클래스 데이터의 적합도가 특정값을 초과하는 제2 클래스 데이터의 집합 수가, 제1 클래스 데이터의 수 이상이고 제2 클래스 데이터의 수 미만인 경우에 상기 특정값을 탐색하여 임계값으로 정의하는 단계를 더 포함하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
|
11 |
11
불균형 원본 데이터를 저장하는 메모리; 및 상기 메모리와 연결된 프로세서를 포함하고, 상기 프로세서는 불균형 원본 데이터를 복수의 클래스 데이터로 구분하고, 상기 구분된 복수의 클래스 데이터를 각각 학습하여 각각의 클래스에 대한 리프리젠테이션 모델(Representation model)을 구축하고, 상기 복수의 클래스 데이터와 상기 구축된 복수의 리프리젠테이션 모델을 각각 조합하여 계산된 클래스 데이터 및 리프리젠테이션 모델 간의 적합도에 따라, 상기 계산된 적합도가 임계값 미만인 클래스 데이터를 제거하여 상기 불균형 원본 데이터를 언더 샘플링(Under-sampling)하고,상기 언더 샘플링된 불균형 원본 데이터를 분류하는 분류기를 더 포함하고,상기 프로세서는, 상기 분류기의 분류 결과, 분류기의 성능이 기설정된 분류 기준치 미만인 경우 상기 임계값을 업데이트하는, 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
|
12 |
12
삭제
|
13 |
13
삭제
|
14 |
14
제11항에 있어서,상기 프로세서는, 상기 임계값을 임계 조정값만큼 조정하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
|
15 |
15
제11항에 있어서,상기 프로세서는, 각 클래스 데이터의 구조적 특징을 학습하여 각 클래스 데이터에 대한 리프리젠테이션 모델을 생성하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
|
16 |
16
제11항에 있어서,상기 프로세서는, 각 클래스 데이터에 대한 리프리젠테이션 모델 생성 시, 각 클래스 데이터에 대한 리프리젠테이션 모델의 입력과 출력을 동일한 데이터로 설정하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
|
17 |
17
제11항에 있어서,상기 리프리젠테이션 모델은, 오토 인코더(Auto-encoder) 구조를 사용하고, 복수의 층 구조와 정류된 선형 유닛(ReLU, Rectified Linear Unit) 함수로 이루어지는 인코더(encoder)와, 복수의 층 구조와 쌍곡선 탄젠트 함수(tanh, Hyperbolic Tangent) 함수로 이루어지는 디코더(decoder)를 포함하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
|
18 |
18
제11항에 있어서,상기 프로세서는, 상기 복수의 클래스 데이터 중에서 어느 하나의 클래스 데이터와, 상기 복수의 리프리젠테이션 모델 중에서 어느 하나의 리프리젠테이션 모델을 조합하여 데이터 및 모델 간의 적합도를 계산하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
|
19 |
19
제11항에 있어서,상기 프로세서는, 데이터 및 모델 간의 적합도 계산 시, 조합된 클래스 데이터의 인스턴스(instance)와 조합된 리프리젠테이션 모델 간의 복원 에러(reconstruction error)를 데이터 및 모델 간의 적합도로 계산하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
|
20 |
20
제11항에 있어서,상기 프로세서는, 상기 복수의 클래스 데이터 중에서 제2 클래스 데이터의 적합도가 특정값을 초과하는 제2 클래스 데이터의 집합 수가, 제1 클래스 데이터의 수 이상이고 제2 클래스 데이터의 수 미만인 경우에 상기 특정값을 탐색하여 임계값으로 정의하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
|
21 |
21
불균형 데이터를 위한 리프리젠테이션 모델 기반의 언더 샘플링 방법을 컴퓨터에 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체로서, 불균형 원본 데이터를 복수의 클래스 데이터로 구분하고, 상기 구분된 복수의 클래스 데이터를 각각 학습하여 각각의 클래스에 대한 리프리젠테이션 모델(Representation model)을 구축하는 단계; 상기 복수의 클래스 데이터와 상기 구축된 복수의 리프리젠테이션 모델을 각각 조합하여 계산된 클래스 데이터 및 리프리젠테이션 모델 간의 적합도에 따라, 상기 계산된 적합도가 임계값 미만인 클래스 데이터를 제거하여 상기 불균형 원본 데이터를 언더 샘플링(Under-sampling)하는 단계; 상기 언더 샘플링된 불균형 원본 데이터를 분류기를 이용하여 분류하는 단계; 및 상기 분류기의 분류 결과, 분류기의 성능이 기설정된 분류 기준치 미만인 경우 상기 임계값을 업데이트하는 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|