1 |
1
데이터베이스에 저장된 학습 대상 문서들을 대상으로 기 설정된 기준에 따라 부분 분류 체계를 생성하는 분류 체계 생성부;각 부분 분류 체계에 포함된 학습 집합의 학습 대상 문서 수가 임계치 이상인지의 여부를 판단하여, 학습 집합의 학습 대상 문서 수가 임계치 이상인 부분 분류체계의 경우, 해당 부분 분류체계의 학습 대상 문서로부터 자질들을 추출하고, 학습 집합의 학습 대상 문서 수가 임계치 이상이 아닌 부분 분류체계의 경우, 해당 부분 분류 체계의 학습 대상 문서로부터 자질들을 추출하고, 외부 언어 자원을 활용하여 자질들을 확장하는 자질 추출부; 및 상기 자질 추출부에서 추출 또는 확장된 자질들을 해당 부분 분류 체계에 대한 학습 모델로 생성하는 분류기 생성부;를 포함하는 분류기 장치
|
2 |
2
제1항에 있어서,새로운 문서가 입력된 경우, 입력 문서에서 자질들을 추출하고, 상기 생성된 학습 모델 중에서 상기 추출된 자질들을 포함하는 학습 모델로 상기 문서를 분류하는 문서 분류부를 더 포함하는 것을 특징으로 하는 분류기 장치
|
3 |
3
삭제
|
4 |
4
제1항에 있어서, 상기 자질 추출부는 시소러스 또는 워드넷의 외부 언어 자원을 활용하여 자질들을 확장하되, 시소러스를 이용하여 자질을 확장하는 경우, 시소러스로부터 각 자질들의 RT(related term), NT(narrow term), BT(broad term) 등의 추가 정보를 활용하여 자질들을 확장하고, 워드넷을 이용하여 자질을 확장하는 경우, 워드넷의 synset을 이용하여 자질들을 확장하는 것을 특징으로 하는 분류기 장치
|
5 |
5
데이터베이스에 저장된 학습 대상 문서들을 대상으로 기 설정된 기준에 따라 부분 분류 체계를 생성하고, 각 부분 분류 체계에 포함된 학습 집합의 학습 대상 문서 수가 임계치 이상인지의 여부를 판단하여, 학습 집합의 학습 대상 문서 수가 임계치 이상인 부분 분류체계의 경우, 해당 부분 분류체계의 학습 대상 문서로부터 자질들을 추출하여 해당 분분 분류 체계에 대한 학습 모델을 생성하고, 학습 집합의 학습 대상 문서 수가 임계치 이상이 아닌 부분 분류체계의 경우, 해당 부분 분류 체계의 학습 대상 문서로부터 자질들을 추출하고, 외부 언어 자원을 활용하여 자질들을 확장하여 해당 부분 분류 체계에 대한 학습 모델로 생성하는 분류기 장치; 및새로운 문서가 입력된 경우, 그 문서에서 자질들을 추출하고, 상기 추출된 자질들을 포함하는 학습 모델로 상기 문서를 분류하는 문서 분류 장치;를 포함하는 다차원 문서 분류 시스템
|
6 |
6
분류기 장치가 다차원 문서 분류를 위한 방법에 있어서, (a) 각 데이터베이스에 저장된 학습 대상 문서들을 대상으로 기 설정된 기준에 따라 부분 분류 체계를 생성하는 단계;(b) 각 부분 분류 체계에 포함된 학습 집합의 학습 대상 문서 수가 임계치 이상인지의 여부를 판단하여, 학습 집합의 학습 대상 문서 수가 임계치 이상인 부분 분류체계의 경우, 해당 부분 분류체계의 학습 대상 문서로부터 자질들을 추출하고, 학습 집합의 학습 대상 문서 수가 임계치 이상이 아닌 부분 분류체계의 경우, 해당 부분 분류 체계의 학습 대상 문서로부터 자질들을 추출하고, 외부 언어 자원을 활용하여 자질들을 확장하는 단계;(c) 상기 추출 또는 확장된 자질들을 해당 부분 분류 체계에 대한 학습 모델로 생성하는 단계;를 포함하는 다차원 문서 분류 방법
|
7 |
7
제6항에 있어서, 상기 (c) 단계 이후, 새로운 문서가 입력된 경우, 입력 문서에서 자질들을 추출하고, 상기 생성된 학습 모델중에서 상기 추출된 자질들을 포함하는 학습 모델로 문서를 분류하는 단계를 더 포함하는 것을 특징으로 하는 다차원 문서 분류 방법
|
8 |
8
삭제
|
9 |
9
제6항에 있어서, 상기 외부 언어 자원을 활용하여 자질들을 확장하는 단계는, 시소러스를 이용하여 자질을 확장하는 경우, 시소러스로부터 각 자질들의 RT(related term), NT(narrow term), BT(broad term) 등의 추가 정보를 활용하여 자질들을 확장하고, 워드넷을 이용하여 자질을 확장하는 경우, 워드넷의 synset을 이용하여 자질들을 확장하는 것을 특징으로 하는 다차원 문서 분류 방법
|
10 |
10
분류기 장치에 의해 실행될 때, 각 데이터베이스에 저장된 학습 대상 문서들을 대상으로 기 설정된 기준에 따라 부분 분류 체계를 생성하는 단계;각 부분 분류 체계에 포함된 학습 집합의 학습 대상 문서 수가 임계치 이상인지의 여부를 판단하여, 학습 집합의 학습 대상 문서 수가 임계치 이상인 부분 분류체계의 경우, 해당 부분 분류체계의 학습 대상 문서로부터 자질들을 추출하고, 학습 집합의 학습 대상 문서 수가 임계치 이상이 아닌 부분 분류체계의 경우, 해당 부분 분류 체계의 학습 대상 문서로부터 자질들을 추출하고, 외부 언어 자원을 활용하여 자질들을 확장하는 단계; 및상기 추출 또는 확장된 자질들을 해당 부분 분류 체계에 대한 학습 모델로 생성하는 단계를 포함하는 다차원 문서 분류 방법이 프로그램으로 기록되고 컴퓨터에서 판독 가능한 기록매체
|