1 |
1
중요도 점수 산출부가, 다중 레이블 데이터에 대한 각각의 모든 특징과 기설정된 기준에 따라 전체 레이블 집합으로부터 선택된 각각의 모든 중요 레이블 간의 상호정보량(M(f;ly))에 기초하여, 상기 모든 특징 각각에 대한 특징별 중요도 점수(C(f))를 산출하는 단계;근사중요도 점수 산출부가, 상기 각각의 모든 특징과 상기 기설정된 기준에 따라 선택된 각각의 모든 비중요 레이블 간의 근사상호정보량()에 기초하여, 상기 모든 특징 각각에 대한 특징별 근사중요도 점수()를 산출하는 단계; 및전체중요도 점수 산출부가, 상기 특징별 중요도 점수(C(f)) 및 상기 특징별 근사중요도 점수()를 상기 각각의 모든 특징별로 서로 합산하여, 상기 모든 특징 각각에 대한 특징별 전체중요도 점수()를 산출하는 단계를 포함하는, 다중 레이블 데이터의 중요 특징 선별 방법
|
2 |
2
제1항에 있어서,상기 특징별 중요도 점수를 산출하는 단계 이전에,레이블 분류부가, 상기 다중 레이블 데이터의 모든 레이블을 포함하는 집합인 상기 전체 레이블 집합에 포함된 각각의 레이블을 기설정된 기준에 따라 분류하는 단계; 및상기 레이블 분류부가, 소정 개수의 상기 중요 레이블을 포함하는 집합인 중요 레이블 집합 및 하나 이상의 상기 비중요 레이블을 포함하는 집합인 비중요 레이블 집합을 생성하는 단계를 더 포함하고, 상기 모든 특징은 상기 다중 레이블 데이터의 모든 특징을 포함하는 집합인 전체 특징 집합에 포함되는, 다중 레이블 데이터의 중요 특징 선별 방법
|
3 |
3
제2항에 있어서,상기 기설정된 기준에 따라 분류하는 단계에서,상기 레이블 분류부는, 상기 전체 레이블 집합에 포함된 각각의 레이블에 대한 레이블별 엔트로피(Entropy)를 산출하고, 상기 전체 레이블 집합에 포함된 각각의 레이블을 상기 레이블별 엔트로피에 따라 분류하는, 다중 레이블 데이터의 중요 특징 선별 방법
|
4 |
4
제3항에 있어서,상기 중요 레이블 집합 및 상기 비중요 레이블 집합을 생성하는 단계는,상기 레이블 분류부가, 상기 전체 레이블 집합 중 상기 레이블별 엔트로피가 큰 순서대로 선택된 상기 소정 개수의 중요 레이블을 포함하는 집합인 상기 중요 레이블 집합을 생성하는 단계; 및상기 레이블 분류부가, 상기 전체 레이블 집합 중 상기 소정 개수의 중요 레이블을 제외한 나머지 레이블인 상기 하나 이상의 비중요 레이블을 포함하는 집합인 상기 비중요 레이블 집합을 생성하는 단계를 포함하는 것을 특징으로 하는, 다중 레이블 데이터의 중요 특징 선별 방법
|
5 |
5
제1항에 있어서,상기 특징별 전체중요도 점수를 산출하는 단계 이후에,특징 선별부가, 상기 특징별 전체중요도 점수가 높은 순서대로 상기 다중 레이블 데이터의 모든 특징을 포함하는 집합인 전체 특징 집합으로부터 기설정된 개수의 중요 특징을 선별하는 단계를 포함하는, 다중 레이블 데이터의 중요 특징 선별 방법
|
6 |
6
제1항에 있어서,상기 특징별 중요도 점수는,아래 수학식 3을 통해 산출되는 것을 특징으로 하는, 다중 레이블 데이터의 중요 특징 선별 방법
|
7 |
7
제1항에 있어서,상기 특징별 근사중요도 점수는,상기 비중요 레이블 각각에 대한 레이블별 엔트로피 및 상기 모든 특징 각각에 대한 특징별 엔트로피에 기초하여 산출되는 것을 특징으로 하는, 다중 레이블 데이터의 중요 특징 선별 방법
|
8 |
8
제7항에 있어서,상기 특징별 근사중요도 점수는,아래 수학식 4를 통해 산출되는 것을 특징으로 하는, 다중 레이블 데이터의 중요 특징 선별 방법
|
9 |
9
제1항에 있어서,상기 특징별 전체중요도 점수는,아래 수학식 8을 통해 산출되는 것을 특징으로 하는, 다중 레이블 데이터의 중요 특징 선별 방법
|
10 |
10
다중 레이블 데이터에 대한 각각의 모든 특징과 기설정된 기준에 따라 전체 레이블 집합으로부터 선택된 각각의 모든 중요 레이블 간의 상호정보량(M(f;ly))에 기초하여, 상기 모든 특징 각각에 대한 특징별 중요도 점수(C(f))를 산출하는 중요도 점수 산출부;상기 각각의 모든 특징과 상기 기설정된 기준에 따라 선택된 각각의 모든 비중요 레이블 간의 근사상호정보량()에 기초하여, 상기 모든 특징 각각에 대한 특징별 근사중요도 점수()를 산출하는 근사중요도 점수 산출부; 및상기 특징별 중요도 점수(C(f)) 및 상기 특징별 근사중요도 점수()를 상기 각각의 모든 특징별로 서로 합산하여, 상기 모든 특징 각각에 대한 특징별 전체중요도 점수()를 산출하는 전체중요도 점수 산출부를 포함하는, 다중 레이블 데이터의 중요 특징 선별 장치
|
11 |
11
제10항에 있어서,상기 다중 레이블 데이터의 모든 레이블을 포함하는 집합인 상기 전체 레이블 집합에 포함된 각각의 레이블을 기설정된 기준에 따라 분류하고, 소정 개수의 상기 중요 레이블을 포함하는 집합인 중요 레이블 집합 및 하나 이상의 상기 비중요 레이블을 포함하는 집합인 비중요 레이블 집합을 생성하는 레이블 분류부를 더 포함하고, 상기 모든 특징은 상기 다중 레이블 데이터의 모든 특징을 포함하는 집합인 전체 특징 집합에 포함되는, 다중 레이블 데이터의 중요 특징 선별 장치
|
12 |
12
제11항에 있어서,상기 레이블 분류부는, 상기 전체 레이블 집합에 포함된 각각의 레이블에 대한 레이블별 엔트로피(Entropy)를 산출하고, 상기 전체 레이블 집합에 포함된 각각의 레이블을 상기 레이블별 엔트로피에 따라 분류하는, 다중 레이블 데이터의 중요 특징 선별 장치
|
13 |
13
제12항에 있어서,상기 레이블 분류부는, 상기 전체 레이블 집합 중 상기 레이블별 엔트로피가 큰 순서대로 선택된 상기 소정 개수의 중요 레이블을 포함하는 집합인 상기 중요 레이블 집합을 생성하고, 상기 전체 레이블 집합 중 상기 소정 개수의 중요 레이블을 제외한 나머지 레이블인 상기 하나 이상의 비중요 레이블을 포함하는 집합인 상기 비중요 레이블 집합을 생성하는 것을 특징으로 하는, 다중 레이블 데이터의 중요 특징 선별 장치
|
14 |
14
제10항에 있어서,상기 특징별 전체중요도 점수가 높은 순서대로 상기 다중 레이블 데이터의 모든 특징을 포함하는 집합인 전체 특징 집합으로부터 기설정된 개수의 중요 특징을 선별하는 특징 선별부를 포함하는, 다중 레이블 데이터의 중요 특징 선별 장치
|
15 |
15
제10항에 있어서,상기 특징별 근사중요도 점수는,상기 비중요 레이블 각각에 대한 레이블별 엔트로피 및 상기 모든 특징 각각에 대한 특징별 엔트로피에 기초하여 산출되는 것을 특징으로 하는, 다중 레이블 데이터의 중요 특징 선별 장치
|
16 |
16
한 개 이상의 다중 카테고리 문서에 대한 각각의 모든 단어와 기설정된 기준에 따라 전체 카테고리 집합으로부터 선택된 각각의 모든 중요 카테고리 간의 상호정보량(M(f;ly))에 기초하여, 상기 모든 단어 각각에 대한 단어별 중요도 점수(C(f))를 산출하는 중요도 점수 산출부;상기 각각의 모든 단어와 상기 기설정된 기준에 따라 선택된 각각의 모든 비중요 카테고리 간의 근사상호정보량()에 기초하여, 상기 모든 단어 각각에 대한 단어별 근사중요도 점수()를 산출하는 근사중요도 점수 산출부; 및상기 단어별 중요도 점수(C(f)) 및 상기 단어별 근사중요도 점수()를 상기 각각의 모든 단어별로 서로 합산하여, 상기 모든 단어 각각에 대한 단어별 전체중요도 점수()를 산출하는 전체중요도 점수 산출부를 포함하는, 다중 카테고리 문서의 중요 단어 선별 장치
|