1 |
1
카테고리별로 문서를 분류하는 문서분류방법에 있어서:가중치 계산모듈이 실행데이터와 학습데이터 사이의 유사 정도에 따라, 상기 학습데이터에 대한 가중치를 계산하는 단계;문서분류 학습모듈이 상기 학습데이터에 대한 가중치를 반영하여, 상기 학습데이터에 대한 문서분류 학습동작을 수행하는 단계; 및문서분류기가 상기 문서분류 학습동작의 수행 결과에 기초하여, 상기 실행데이터를 분류하는 단계를 포함하는 문서분류방법
|
2 |
2
제 1 항에 있어서,상기 학습데이터는 각 카테고리별로 분류된 복수의 문서들을 포함하며, 상기 학습데이터의 복수의 문서들은 상기 실행데이터와의 유사 정도에 따라 각각 서로 다른 가중치를 갖는 문서분류방법
|
3 |
3
제 2 항에 있어서,상기 학습데이터의 복수의 문서들과 상기 실행데이터 사이의 유사 정도는 상기 학습데이터의 복수의 문서들에 포함된 소정 단어들의 출현 확률과 상기 실행데이터에 포함된 소정 단어들의 출현 확률에 따라 결정되는 문서분류방법
|
4 |
4
제 1 항에 있어서,상기 문서분류 학습모듈이 문서분류 학습동작을 수행하는 단계는상기 학습데이터에 대한 가중치를 반영하여, 학습데이터 분포를 계산하는 단계; 및상기 학습데이터 분포가 실행데이터 분포와 유사한지의 여부를 판단하는 단계를 더 포함하는 문서분류방법
|
5 |
5
제 4 항에 있어서,상기 학습데이터 분포와 상기 실행데이터 분포 사이의 유사 정도는 상기 실행데이터 분포에 대한 가능도(likelihood)의 값이 수렴하는지의 여부에 따라 결정되는 문서분류방법
|
6 |
6
제 5 항에 있어서,상기 실행데이터 분포에 대한 가능도의 값이 수렴하지 않는 경우, 상기 실행데이터가 분류된 후에, 상기 분류된 실행데이터를 포함하는 학습데이터에 대한 가중치를 다시 결정하는 문서분류방법
|
7 |
7
카테고리별로 문서를 분류하는 문서분류장치에 있어서:학습데이터의 문서들에 대한 가중치를 계산하는 가중치 계산모듈;상기 가중치를 반영하여, 학습데이터 분포를 계산하는 문서분류 학습모듈; 및상기 문서분류 학습모듈에서 계산된 상기 학습데이터 분포에 기초하여, 실행데이터를 분류하는 문서분류기를 포함하는 문서분류장치
|
8 |
8
제 7 항에 있어서,상기 가중치 계산모듈은 상기 학습데이터 및 상기 실행데이터의 소정 단어들의 출현 확률의 유사 정도에 따라, 학습데이터의 문서들에 대한 가중치를 계산하는 문서분류장치
|
9 |
9
제 8 항에 있어서,상기 학습데이터의 문서들에 대한 가중치는 각각 서로 다른 것을 특징으로 하는 문서분류장치
|
10 |
10
제 7 항에 있어서,상기 문서분류 학습모듈은 상기 학습데이터 분포가 실행데이터 분포와 유사하지 않은 경우, 상기 실행데이터를 상기 학습데이터의 카테고리에 임시로 분류한 후에, 상기 학습데이터의 문서들에 대한 가중치를 다시 결정하는 문서분류장치
|
11 |
11
제 10 항에 있어서,상기 학습데이터 분포와 상기 실행데이터 분포 사이의 유사 정도는 상기 실행데이터 분포에 대한 가능도의 값이 수렴하는지의 여부에 따라 결정되는 문서분류장치
|
12 |
12
제 11 항에 있어서,상기 실행데이터 분포에 대한 가능도의 값이 수렴하지 않는 경우, 상기 문서분류 학습모듈은 상기 실행데이터를 임시로 분류하고, 상기 임시로 분류된 실행데이터를 포함하는 학습데이터의 카테고리에 관한 정보를 상기 가중치 계산모듈에 전송하는 문서분류장치
|
13 |
13
제 12 항에 있어서,상기 가중치 계산모듈은 상기 임시로 분류된 실행데이터를 포함하는 상기 학습데이터의 카테고리에 관한 정보에 기초하여, 상기 학습데이터의 문서들에 대한 가중치를 다시 계산하는 문서분류장치
|