1 |
1
결정트리 및 심층신경망을 이용한 대량의 데이터를 분류하기 위한 장치에 있어서, 각각이 복수의 데이터의 입력값이 입력되는 복수의 입력노드를 포함하는 입력계층과, 상기 복수의 입력노드 중 어느 하나의 입력노드에 가중치를 적용하고, 가중치가 적용된 입력값에 대해 제1 활성화 함수를 통한 연산을 수행하여 복수의 구간을 구분하는 구분값을 산출하는 복수의 구분노드를 포함하는 구분계층과, 상기 복수의 구분노드 각각의 구분값에 가중치를 적용하고, 가중치가 적용된 구분값을 합산하고, 합산된 복수의 구분값에 제2 활성화 함수를 통한 연산을 수행하여 연산값을 산출하는 복수의 연산노드를 포함하는 완전연결계층과, 상기 완전연결계층의 복수의 연산노드 각각의 연산값에 대해 가중치를 적용하고, 가중치가 적용된 복수의 연산값을 합산한 출력값을 산출하는 복수의 출력노드를 포함하는 출력계층을 포함하는 분류모델(CM)을 실행시키는 분류부;를 포함하며, 상기 제1 활성화 함수를 통한 연산은 수학식 에 따라 수행되며, 상기 x는 상기 입력값이고, 연속 변수(continuous variable)이고, 상기 w는 상기 가중치이며, 이고, 상기 n은 상기 복수의 구간의 개수이고, 상기 복수의 구간의 구분점이 이고, 상기 복수의 구간의 구분점이 와 같이 단조 증가할 때, 상기 b는 바이어스이며, 이고, 상기 인 것을 특징으로 하는 대량의 데이터를 분류하기 위한 장치
|
2 |
2
삭제
|
3 |
3
제1항에 있어서, 상기 일 때, 수학식 에 따라 교차엔트로피 손실이 최소가 되도록 경사하강법을 통해 상기 구분계층 및 상기 완전연결계층 양자 모두를 포함하는 상기 분류모델의 가중치 및 바이어스를 최적화하는 학습부;를 더 포함하며, 상기 E는 교차엔트로피 손실이고, 상기 i는 출력노드의 인덱스이고, 상기 y는 출력값이고, 상기 y'는 기댓값인 것을 특징으로 하는 대량의 데이터를 분류하기 위한 장치
|
4 |
4
제1항에 있어서, 상기 복수의 구분노드 각각의 가중치 및 바이어스를 통해 상기 복수의 입력노드 각각으로부터 상기 복수의 구분노드로 분할되는 분할 기준을 도출하고, 상기 도출된 분할 기준을 시각화하는 시각화처리부;를 더 포함하는 것을 특징으로 하는 대량의 데이터를 분류하기 위한 장치
|
5 |
5
제1항에 있어서, 상기 출력계층은 상기 복수의 출력노드의 출력값을 결합하여 잠재벡터를 산출하고, 상기 장치는 상기 산출된 잠재벡터를 기초로 소정의 판정 기준에 따라 데이터의 분류를 판정한 판정값을 도출하고, 상기 잠재벡터를 소정의 벡터공간에 사상하고, 사상된 벡터공간에서 중심벡터와의 거리를 기초로 상기 판정값의 강도를 산출하고, 산출된 판정값의 강도를 시각화하는 시각화처리부;를 더 포함하는 것을 특징으로 하는 대량의 데이터를 분류하기 위한 장치
|
6 |
6
제5항에 있어서, 상기 시각화처리부는 상기 산출된 판정값의 강도를 상기 출력노드의 엔트로피로 나누어 상기 출력값의 신뢰도를 산출하고, 산출된 신뢰도를 시각화하는 것을 특징으로 하는 대량의 데이터를 분류하기 위한 장치
|
7 |
7
제1항에 있어서, 복수의 데이터에서 고유값(eigen value)이 가장 큰 2개의 고유벡터(eigen vector)를 도출하고, 상기 복수의 데이터를 상기 도출된 고유벡터의 2개의 축에 사상하여 특징벡터를 생성하고, 생성된 특징벡터를 상기 입력값으로 상기 입력계층에 입력하는 전처리부; 를 더 포함하는 것을 특징으로 하는 대량의 데이터를 분류하기 위한 장치
|
8 |
8
제1항에 있어서, 복수의 데이터를 소정의 벡터공간에 임베딩하여 복수의 데이터 각각의 특징을 도출한 복수의 특징벡터를 생성하고, 생성된 특징벡터를 상기 입력값으로 상기 입력계층에 입력하는 전처리부; 를 더 포함하는 것을 특징으로 하는 대량의 데이터를 분류하기 위한 장치
|
9 |
9
결정트리 및 심층신경망을 이용한 대량의 데이터를 분류하기 위한 장치에 있어서, 복수의 데이터를 특징벡터로 변환하여 입력값을 생성하는 전처리부; 결정트리의 계층인 구분계층과 심층신경망의 계층인 완전연결계층을 포함하는 분류모델을 통해 상기 입력값이 학습된 분류에 속할 확률을 산출하여 출력값으로 출력하는 분류부; 및 상기 분류부의 출력값을 기초로 상기 입력값이 속하는 분류를 판정하여 판정값을 산출하는 시각화부;를 포함하며, 상기 분류모델은 각각이 복수의 데이터의 입력값이 입력되는 복수의 입력노드를 포함하는 입력계층과, 상기 복수의 입력노드 중 어느 하나의 입력노드에 가중치를 적용하고, 가중치가 적용된 입력값에 대해 제1 활성화 함수를 통한 연산을 수행하여 복수의 구간을 구분하는 구분값을 산출하는 복수의 구분노드를 포함하는 구분계층과, 상기 복수의 구분노드 각각의 구분값에 가중치를 적용하고, 가중치가 적용된 구분값을 합산하고, 합산된 복수의 구분값에 제2 활성화 함수를 통한 연산을 수행하여 연산값을 산출하는 복수의 연산노드를 포함하는 완전연결계층과, 상기 완전연결계층의 복수의 연산노드 각각의 연산값에 대해 가중치를 적용하고, 가중치가 적용된 복수의 연산값을 합산한 출력값을 산출하는 복수의 출력노드를 포함하는 출력계층을 포함하며, 상기 출력계층은 상기 복수의 출력노드의 출력값을 결합하여 잠재벡터를 산출하고, 산출된 잠재벡터를 기초로 소정의 판정 기준에 따라 데이터의 분류를 판정한 판정값을 도출하고, 상기 장치는 상기 잠재벡터를 소정의 벡터공간에 사상하고, 사상된 벡터공간에서 중심벡터와의 거리를 기초로 상기 판정값의 강도를 산출하고, 산출된 판정값의 강도를 시각화하며, 상기 산출된 판정값의 강도를 상기 출력노드의 엔트로피로 나누어 상기 출력값의 신뢰도를 산출하고, 산출된 신뢰도를 시각화하며, 각 구분노드의 가중치 및 바이어스를 통해 입력층의 복수의 입력노드 각각으로부터 분류모델의 복수의 구분노드로 분할되는 분할 기준을 도출하고, 도출된 도출된 분할 기준을 시각화하는 시각화처리부;를 더 포함하는 것을 특징으로 하는 대량의 데이터를 분류하기 위한 장치
|
10 |
10
삭제
|
11 |
11
제9항에 있어서, 상기 제1 활성화 함수를 통한 연산은 수학식 에 따라 수행되며, 상기 x는 상기 입력값이고, 연속 변수(continuous variable)이고, 상기 w는 상기 가중치이며, 이고, 상기 n은 상기 복수의 구간의 개수이고, 상기 복수의 구간의 구분점이 이고, 상기 복수의 구간의 구분점이 와 같이 단조 증가할 때, 상기 b는 바이어스이며, 이고, 상기 인 것을 특징으로 하는 대량의 데이터를 분류하기 위한 장치
|
12 |
12
제11항에 있어서, 상기 일 때, 수학식 에 따라 교차엔트로피 손실이 최소가 되도록 경사하강법을 통해 상기 구분계층 및 상기 완전연결계층 양자 모두를 포함하는 상기 분류모델의 가중치 및 바이어스를 최적화하는 학습부;를 더 포함하며, 상기 E는 교차엔트로피 손실이고, 상기 i는 출력노드의 인덱스이고, 상기 y는 출력값이고, 상기 y'는 기댓값인 것을 특징으로 하는 대량의 데이터를 분류하기 위한 장치
|
13 |
13
삭제
|
14 |
14
결정트리 및 심층신경망을 이용한 대량의 데이터를 분류하기 위한 방법에 있어서, 분류부의 분류모델이 실행되고, 상기 분류모델의 입력계층의 복수의 입력노드 각각에 입력값이 입력되면, 상기 분류모델의 구분계층의 복수의 구분노드가 상기 복수의 입력노드 중 어느 하나의 입력노드에 가중치를 적용하고, 가중치가 적용된 입력값에 대해 제1 활성화 함수를 통한 연산을 수행하여 복수의 구간을 구분하는 구분값을 산출하는 단계; 상기 분류모델의 완전연결계층의 복수의 연산노드가 상기 복수의 구분노드 각각의 구분값에 가중치를 적용하고, 가중치가 적용된 구분값을 합산하고, 합산된 복수의 구분값에 제2 활성화 함수를 통한 연산을 수행하여 연산값을 산출하는 단계; 및 상기 분류모델의 출력계층의 복수의 출력노드가 상기 완전연결계층의 복수의 연산노드 각각의 연산값에 대해 가중치를 적용하고, 가중치가 적용된 복수의 연산값을 합산한 출력값을 산출하는 단계;를 포함하며, 상기 구분값을 산출하는 단계는 상기 분류모델의 구분계층의 복수의 구분노드 각각이 수학식 에 따라 상기 구분값을 산출하며, 상기 x는 상기 입력값이고, 연속 변수(continuous variable)이고, 상기 w는 상기 가중치이며, 이고, 상기 n은 상기 복수의 구간의 개수이고, 상기 복수의 구간의 구분점이 이고, 상기 복수의 구간의 구분점이 와 같이 단조 증가할 때, 상기 b는 바이어스이며, 이고, 상기 인 것을 특징으로 하는 대량의 데이터를 분류하기 위한 방법
|
15 |
15
삭제
|
16 |
16
제14항에 있어서, 상기 구분값을 산출하는 단계 전, 학습부가 수학식 에 따라 교차엔트로피 손실이 최소가 되도록 경사하강법을 통해 상기 구분계층 및 상기 완전연결계층 양자 모두를 포함하는 상기 분류모델의 가중치 및 바이어스를 최적화하는 학습 단계;를 더 포함하며, 상기 E는 교차엔트로피 손실이고, 상기 i는 출력노드의 인덱스이고, 상기 y는 출력값이고, 상기 y'는 기댓값인 것을 특징으로 하는 대량의 데이터를 분류하기 위한 방법
|
17 |
17
제14항에 있어서, 상기 출력값을 산출하는 단계 후, 시각화처리부가 상기 구분노드 각각의 가중치 및 바이어스를 통해 상기 입력계층의 복수의 입력노드 각각으로부터 상기 구분노드의 복수의 구분노드로 분할되는 분할 기준을 도출하는 단계; 및 상기 시각화처리부가 상기 도출된 분할 기준을 시각화하는 단계; 를 더 포함하는 것을 특징으로 하는 대량의 데이터를 분류하기 위한 방법
|
18 |
18
제14항에 있어서, 상기 출력값을 산출하는 단계 후, 상기 출력계층이 상기 복수의 출력노드의 출력값을 결합하여 잠재벡터를 산출하는 단계; 시각화처리부가 상기 산출된 잠재벡터를 기초로 소정의 판정 기준에 따라 데이터의 분류를 판정한 판정값을 도출하는 단계; 및 상기 시각화처리부가 상기 잠재벡터를 소정의 벡터공간에 사상하고, 사상된 벡터공간에서 중심벡터와의 거리를 기초로 상기 판정값의 강도를 산출하고, 산출된 판정값의 강도를 시각화하는 단계; 및 상기 시각화처리부가 상기 산출된 판정값의 강도를 상기 출력노드의 엔트로피로 나누어 상기 출력값의 신뢰도를 산출하고, 산출된 신뢰도를 시각화하는 단계;를 더 포함하는 것을 특징으로 하는 대량의 데이터를 분류하기 위한 방법
|
19 |
19
컴퓨터에 제14항, 제16항, 제17항 및 제18항 중 어느 한 항에 따른 대량의 데이터를 분류하기 위한 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록매체
|