1 |
1
데이터를 분류하는 데이터 분류 장치, 데이터셋(Dataset)을 수집하는 수집부;상기 데이터셋에 포함된 복수의 특징으로부터 적어도 하나의 특징쌍을 생성하는 특징쌍 생성부;상기 생성된 적어도 하나의 특징쌍 각각에 대한 분포도를 생성하는 분포도 생성부;상기 생성된 분포도를 제 1 머신러닝 모델에 입력하여 신규 특징을 생성하기 위한 회귀분석 모델을 선택하는 회귀분석 방법 선택부;상기 선택된 회귀분석 모델을 이용하여 상기 신규 특징을 생성하는 신규 특징 생성부; 및상기 복수의 특징 및 상기 신규 특징을 제 2 머신러닝 모델에 입력하여 상기 데이터셋을 기설정된 복수의 클래스 중 하나로 분류하는 분류부를 포함하는, 데이터 분류 장치
|
2 |
2
제 1 항에 있어서, 상기 제 1 머신러닝 모델은 CNN(Convolutional Neural Networks)에 기초한 것인, 데이터 분류 장치
|
3 |
3
제 1 항에 있어서, 상기 특징쌍 생성부는 상기 데이터셋의 복수의 특징 각각에 대해 제 1 변수 및 제 2 변수의 쌍으로 구성된 적어도 하나의 특징쌍을 생성하는 것인, 데이터 분류 장치
|
4 |
4
제 3 항에 있어서, 상기 분포도 생성부는 상기 생성된 적어도 하나의 특징쌍 각각에 대해 상기 제 1 변수 및 제 2 변수 간의 관계가 시각화되도록 2차원 히스토그램을 생성하는 것인, 데이터 분류 장치
|
5 |
5
제 1 항에 있어서, 상기 신규 특징 생성부는 상기 적어도 하나의 특징쌍에 대해 상기 선택된 회귀분석 모델을 이용한 제 1 분류 결과를 예측하고, 상기 적어도 하나의 특징쌍 및 상기 생성될 신규 특징에 대해 상기 선택된 회귀분석 모델을 이용한 제 2 분류 결과를 예측하는 산출부를 더 포함하는 것인, 데이터 분류 장치
|
6 |
6
제 5 항에 있어서, 상기 신규 특징 생성부는 상기 제 2 분류 결과의 예측 결과에 기초하여 상기 신규 특징을 생성하는 것인, 데이터 분류 장치
|
7 |
7
제 6 항에 있어서, 상기 회귀분석 방법 선택부는 상기 머신러닝을 이용하여 상기 제 2 분류값이 상기 제 1 분류값 보다 큰 값이 되도록 학습하는 것인, 데이터 분류 장치
|
8 |
8
제 1 항에 있어서, 상기 회귀분석 모델은 KRR(Kernel Ridge Regression) 모델 및 LRR(Latent Root Regression) 모델을 포함하는 것인, 데이터 분류 장치
|
9 |
9
데이터 분류 장치에서 데이터를 분류하는 방법에 있어서, 데이터셋(Dataset)을 수집하는 단계;상기 데이터셋에 포함된 복수의 특징으로부터 적어도 하나의 특징쌍을 생성하는 단계;상기 생성된 적어도 하나의 특징쌍 각각에 대한 분포도를 생성하는 단계;상기 생성된 분포도를 제 1 머신러닝 모델에 입력하여 신규 특징을 생성하기 위한 회귀분석 모델을 선택하는 단계;상기 선택된 회귀분석 모델을 이용하여 상기 신규 특징을 생성하는 단계; 및상기 복수의 특징 및 상기 신규 특징을 제 2 머신러닝 모델에 입력하여 상기 데이터셋을 기설정된 복수의 클래스 중 하나로 분류하는 단계를 포함하는, 데이터 분류 방법
|
10 |
10
제 9 항에 있어서, 상기 특징쌍을 생성하는 단계는, 상기 데이터셋의 복수의 특징 각각에 대해 제 1 변수 및 제 2 변수의 쌍으로 구성된 적어도 하나의 특징쌍을 생성하는 단계를 포함하는 것인, 데이터 분류 방법
|
11 |
11
제 10 항에 있어서, 상기 분포도를 생성하는 단계는, 상기 생성된 적어도 하나의 특징쌍 각각에 대해 상기 제 1 변수 및 제 2 변수 간의 관계가 시각화되도록 2차원 히스토그램을 생성하는 단계를 포함하는 것인, 데이터 분류 방법
|
12 |
12
제 9 항에 있어서, 상기 적어도 하나의 특징쌍에 대해 상기 선택된 회귀분석 모델을 이용한 제 1 분류 결과를 예측하는 단계; 및상기 적어도 하나의 특징쌍 및 상기 생성된 신규 특징에 대해 상기 선택된 회귀분석 모델을 이용한 제 2 분류 결과를 예측하는 단계를 더 포함하는 것인, 데이터 분류 방법
|
13 |
13
제 12 항에 있어서, 상기 신규 특징을 생성하는 단계는,상기 제 2 분류 결과의 예측 결과에 기초하여 상기 신규 특징을 생성하는 단계를 더 포함하는 것인, 데이터 분류 방법
|
14 |
14
데이터를 분류하는 명령어들의 시퀀스를 포함하는 컴퓨터 판독가능 매체에 저장된 컴퓨터 프로그램에 있어서,상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 데이터셋(Dataset)을 수집하고,상기 데이터셋에 포함된 복수의 특징으로부터 적어도 하나의 특징쌍을 생성하고,상기 생성된 적어도 하나의 특징쌍 각각에 대한 분포도를 생성하고,상기 생성된 분포도를 제 1 머신러닝 모델에 입력하여 신규 특징을 생성하기 위한 회귀분석 모델을 선택하고,상기 선택된 회귀분석 모델을 이용하여 상기 신규 특징을 생성하고,상기 복수의 특징 및 상기 신규 특징을 제 2 머신러닝 모델에 입력하여 상기 데이터셋을 기설정된 복수의 클래스 중 하나로 분류하도록 하는 명령어들의 시퀀스를 포함하는, 매체에 저장된 컴퓨터 프로그램
|