1 |
1
문서에 포함된 복수 개의 단어 각각이 상기 문서에서 출현된 빈도수를 반영하는 빈도수 벡터를 산출하는 빈도수 산출부와,상기 복수 개의 단어 각각이 상기 문서에서 출현되는 순서를 반영하는 제1 분산 정보 벡터를 산출하는 제1 분산 정보 산출부와,상기 복수 개의 단어 중에서 적어도 하나의 단어를 포함하는 단어의 집합을 상기 순서에 따라서 순차적으로 선정하고, 상기 선정된 단어의 집합 각각이 갖는 특징을 반영하는 제2 분산 정보 벡터를 산출하는 제2 분산 정보 산출부와,상기 빈도수 벡터, 상기 제1 분산 정보 벡터 및 상기 제2 분산 정보 벡터를 결합하여 결합 벡터를 생성하고, 상기 결합 벡터를 기초로 상기 문서가 분류되는 카테고리가 기 정의된 복수 개의 카테고리 중에서 어느 카테고리인지를 추측하는 앙상블부를 포함하는문서 분류 장치
|
2 |
2
제 1 항에 있어서,상기 문서 분류 장치는,상기 복수 개의 단어 각각이 상기 문서에서 갖는 의미를 정량화된 값으로 산출하며, 상기 복수 개의 단어를 행렬의 행과 열 중에서 어느 하나에 맵핑하고 상기 복수 개의 단어 각각에 대한 의미를 상기 행과 열 중에서 나머지 하나에 맵핑함으로써 상기 문서를 상기 행렬로 변환하는 변환부를 더 포함하고,상기 빈도수 산출부는, 상기 행과 열 중에서 상기 복수 개의 단어가 맵핑된 것을 서로 간에 합산하여 상기 빈도수 벡터를 산출하며,상기 제1 분산 정보 산출부는, 상기 복수 개의 단어가 맵핑된 것이 상기 순서에 따라서 순차적으로 입력될 때마다 상기 제1 분산 정보 벡터를 업데이트시키되, 직전에 업데이트된 제1 분산 정보 벡터를 함께 고려하여 업데이트시키고,상기 제2 분산 정보 산출부는, 상기 복수 개의 단어가 맵핑된 것을 상기 순서에 따라서 순차적으로 적어도 하나 이상 선정하여 상기 단어의 집합을 생성하고, 상기 생성된 단어의 집합 각각이 갖는 특징을 반영하는 제2 분산 정보 벡터를 산출하는문서 분류 장치
|
3 |
3
제 1 항에 있어서,상기 앙상블부는,상기 결합 벡터에 비선형 함수를 적용시키는 비선형 함수 적용부와,상기 비선형 함수가 적용된 결과에 로지스틱 회귀 분석을 적용하는 회귀 분석 적용부와,상기 로지스틱 회귀 분석이 적용된 결과를 기초로 상기 문서가 분류되는 카테고리를 추측하는 추측부를 포함하는문서 분류 장치
|
4 |
4
제 3 항에 있어서,상기 비선형 함수는 하이퍼블릭 탄젠트 함수인문서 분류 장치
|
5 |
5
문서 분류 장치에 의하여 수행되는 문서 분류 방법으로서,상기 문서에 포함된 복수 개의 단어 각각이 상기 문서에서 출현된 빈도수를 반영하는 빈도수 벡터를 산출하는 단계와,상기 복수 개의 단어 각각이 상기 문서에서 출현되는 순서를 반영하는 제1 분산 정보 벡터를 산출하는 단계와,상기 복수 개의 단어 중에서 적어도 하나의 단어를 포함하는 단어의 집합을 상기 순서에 따라서 순차적으로 선정하고, 상기 선정된 단어의 집합 각각이 갖는 특징을 반영하는 제2 분산 정보 벡터를 산출하는 단계와,상기 빈도수 벡터, 상기 제1 분산 정보 벡터 및 상기 제2 분산 정보 벡터를 결합하여 결합 벡터를 생성하는 단계와,상기 결합 벡터를 기초로 상기 문서가 분류되는 카테고리가 기 정의된 복수 개의 카테고리 중에서 어느 카테고리인지를 추측하는 단계를 포함하는문서 분류 방법
|
6 |
6
문서에 포함된 복수 개의 단어 각각이 상기 문서에서 출현된 빈도수를 반영하는 빈도수 벡터를 산출하는 단계와,상기 복수 개의 단어 각각이 상기 문서에서 출현되는 순서를 반영하는 제1 분산 정보 벡터를 산출하는 단계와,상기 복수 개의 단어 중에서 적어도 하나의 단어를 포함하는 단어의 집합을 상기 순서에 따라서 순차적으로 선정하고, 상기 선정된 단어의 집합 각각이 갖는 특징을 반영하는 제2 분산 정보 벡터를 산출하는 단계와,상기 빈도수 벡터, 상기 제1 분산 정보 벡터 및 상기 제2 분산 정보 벡터를 결합하여 결합 벡터를 생성하는 단계와,상기 결합 벡터를 기초로 상기 문서가 분류되는 카테고리가 기 정의된 복수 개의 카테고리 중에서 어느 카테고리인지를 추측하는 단계를 수행하도록 프로그램된컴퓨터 판독가능한 기록매체에 저장된 컴퓨터 프로그램
|