1 |
1
데이터를 분류하는 데이터 분류 장치에 있어서,복수의 클래스 각각에 대한 분포도를 생성하는 분포도 생성부;데이터셋에 포함되는 연속형 변수를 이산화하기 위한 기준점이 되는 탐색 분할점을 설정하는 탐색 분할점 설정부;상기 탐색 분할점을 기준으로 좌측 영역 및 우측 영역에 대한 기설정된 거리 함수에 의해 도출된 거리값에 기초하여 최종 분할점을 결정하는 최종 분할점 결정부;상기 최종 분할점을 기준으로 상기 연속형 변수의 이산화를 수행하여 범주형 변수를 획득하는 이산화 수행부; 및상기 데이터셋의 적어도 일부 및 상기 범주형 변수를 머신러닝 기반 모델에 입력하여 상기 데이터셋을 기설정된 복수의 클래스 중 하나로 분류하는 데이터 분류부를 포함하는 것인, 데이터 분류 장치
|
2 |
2
제 1 항에 있어서,상기 탐색 분할점 설정부는 상기 분포도의 교점에 기초하여 최초의 탐색 분할점을 설정하는 것인, 데이터 분류 장치
|
3 |
3
제 2 항에 있어서,상기 탐색 분할점 설정부는 상기 탐색 분할점의 위치를 변경하고, 상기 최종 분할점 결정부는 상기 변경된 위치에서의 탐색 분할점을 기준으로 상기 좌측 영역에 대한 제 1 거리값 및 상기 우측 영역에 대한 제 2 거리값의 합을 계산하는 것인, 데이터 분류 장치
|
4 |
4
제 3 항에 있어서,상기 탐색 분할점 설정부는 상기 탐색 분할점의 위치의 변경을 반복하고,상기 최종 분할점 결정부는 상기 제 1 거리값 및 상기 제 2 거리값의 합의 계산을 반복하는 것인, 데이터 분류 장치
|
5 |
5
제 3 항에 있어서,상기 최종 분할점 결정부는 상기 제 1 거리값 및 상기 제 2 거리값의 합이 최소인 탐색 분할점을 상기 최종 분할점으로 결정하는 것인, 데이터 분류 장치
|
6 |
6
제 1 항에 있어서,상기 기설정된 거리 함수는 하기의 수식으로 정의되는 것인, 데이터 분류 장치
|
7 |
7
제 3 항에 있어서,상기 제 1 거리값은 하기의 수식에 의해 도출되는 것인, 데이터 분류 장치
|
8 |
8
제 3 항에 있어서,상기 제 2 거리값은 하기의 수식에 의해 도출되는 것인, 데이터 분류 장치
|
9 |
9
데이터를 분류하는 데이터 분류 방법에 있어서,복수의 클래스 각각에 대한 분포도를 생성하는 단계;데이터셋에 포함되는 연속형 변수를 이산화하기 위한 기준점이 되는 탐색 분할점을 설정하는 단계;상기 탐색 분할점을 기준으로 좌측 영역 및 우측 영역에 대한 기설정된 거리 함수에 의해 도출된 거리값에 기초하여 최종 분할점을 결정하는 단계;상기 최종 분할점을 기준으로 상기 연속형 변수의 이산화를 수행하여 범주형 변수를 획득하는 단계; 및상기 데이터셋의 적어도 일부 및 상기 범주형 변수를 머신러닝 기반 모델에 입력하여 상기 데이터셋을 기설정된 복수의 클래스 중 하나로 분류하는 단계를 포함하는 것인, 데이터 분류 방법
|
10 |
10
제 9 항에 있어서,상기 탐색 분할점을 설정하는 단계는 상기 분포도의 교점에 기초하여 최초의 탐색 분할점을 설정하는 단계를 포함하는 것인, 데이터 분류 방법
|
11 |
11
제 10 항에 있어서,상기 탐색 분할점을 설정하는 단계는 상기 탐색 분할점의 위치를 변경하는 단계를 포함하고, 상기 최종 분할점을 결정하는 단계는 상기 변경된 위치에서의 탐색 분할점을 기준으로 상기 좌측 영역에 대한 제 1 거리값 및 상기 우측 영역에 대한 제 2 거리값의 합을 계산하는 단계를 포함하는 것인, 데이터 분류 방법
|
12 |
12
제 11 항에 있어서,상기 탐색 분할점을 설정하는 단계는 상기 탐색 분할점의 위치의 변경을 반복하는 단계를 포함하고,상기 최종 분할점을 결정하는 단계는 상기 제 1 거리값 및 상기 제 2 거리값의 합의 계산을 반복하는 단계를 포함하는 것인, 데이터 분류 방법
|
13 |
13
제 11 항에 있어서,상기 최종 분할점을 결정하는 단계는 상기 제 1 거리값 및 상기 제 2 거리값의 합이 최소인 탐색 분할점을 상기 최종 분할점으로 결정하는 단계를 포함하는 것인, 데이터 분류 방법
|
14 |
14
데이터를 분류하는 명령어들의 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램에 있어서,상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우,복수의 클래스 각각에 대한 분포도를 생성하고,데이터셋에 포함되는 연속형 변수를 이산화하기 위한 기준점이 되는 탐색 분할점을 설정하고,상기 탐색 분할점을 기준으로 좌측 영역 및 우측 영역에 대한 기설정된 거리 함수에 의해 도출된 거리값에 기초하여 최종 분할점을 결정하고,상기 최종 분할점을 기준으로 상기 연속형 변수의 이산화를 수행하여 범주형 변수를 획득하고,상기 데이터셋의 적어도 일부 및 상기 범주형 변수를 머신러닝 기반 모델에 입력하여 상기 데이터셋을 기설정된 복수의 클래스 중 하나로 분류하도록 하는 명령어들의 시퀀스를 포함하는, 매체에 저장된 컴퓨터 프로그램
|