1 |
1
복수의 문서들을 포함하는 전역 문서 집합을 분할하여 복수의 지역 문서 집합들을 생성하고 지역 토픽 모델링(Topic Modeling)을 수행하여 지역 토픽 정보를 생성하는 지역 토픽 정보 생성부;상기 복수의 지역 문서 집합들 각각에 있는 대표문서를 통해 축소된 전역 문서 집합을 생성하고 전역 토픽 모델링을 수행하여 전역 토픽 정보를 생성하는 전역 토픽 정보 생성부; 및상기 지역 및 전역 토픽 정보 간의 문서 매핑을 통해 생성된 토픽 변환 정보를 상기 복수의 문서들 각각에 배정하는 문서 토픽 배정부를 포함하는 문서의 토픽 모델링 장치
|
2 |
2
제1항에 있어서, 상기 지역 토픽 정보 생성부는상기 지역 토픽 모델링을 수행하여 상기 복수의 지역 문서 집합들 각각에 대해 적어도 하나의 주요 지역 토픽을 추출하고 지역 문서 집합에 속한 지역 문서 및 상기 적어도 하나의 주요 지역 토픽 간의 지역 토픽 행렬을 생성하는 것을 특징으로 하는 문서의 토픽 모델링 장치
|
3 |
3
제1항에 있어서, 상기 전역 토픽 정보 생성부는상기 복수의 지역 문서 집합들 각각에 대해 토픽별 가중치가 높은 순서에 따라 적어도 하나의 지역 대표문서를 추출하여 상기 축소된 전역 문서 집합을 생성하는 것을 특징으로 하는 문서의 토픽 모델링 장치
|
4 |
4
제1항에 있어서, 상기 전역 토픽 정보 생성부는상기 전역 토픽 모델링을 수행하여 상기 축소된 전역 문서 집합에 대해 적어도 하나의 주요 전역 토픽을 추출하고 상기 축소된 전역 문서 집합에 속한 지역 대표문서 및 상기 적어도 하나의 주요 전역 토픽 간의 전역 토픽 행렬을 생성하는 것을 특징으로 하는 문서의 토픽 모델링 장치
|
5 |
5
제1항에 있어서, 상기 문서 토픽 배정부는상기 지역 토픽 모델링을 통해 생성된 지역 토픽 행렬에서 지역 대표문서와 연관된 토픽 성분 정보를 추출하고 상기 토픽 성분 정보 및 상기 전역 토픽 모델링을 통해 생성된 전역 토픽 행렬 간의 곱 연산을 통해 적어도 하나의 토픽 변환 행렬을 생성하는 것을 특징으로 하는 문서의 토픽 모델링 장치
|
6 |
6
제5항에 있어서, 상기 문서 토픽 배정부는상기 지역 토픽 행렬 각각에 대해 상기 적어도 하나의 토픽 변환 행렬과의 곱 연산을 통해 상기 복수의 문서들에 전역 토픽 가중치를 배정하는 것을 특징으로 하는 문서의 토픽 모델링 장치
|
7 |
7
문서의 토픽 모델링 장치에서 수행되는 토픽 모델링 방법에 있어서,(a) 복수의 문서들을 포함하는 전역 문서 집합을 분할하여 복수의 지역 문서 집합들을 생성하고 지역 토픽 모델링(Topic Modeling)을 수행하여 지역 토픽 정보를 생성하는 단계;(b) 상기 복수의 지역 문서 집합들 각각에 있는 대표문서를 통해 축소된 전역 문서 집합을 생성하고 전역 토픽 모델링을 수행하여 전역 토픽 정보를 생성하는 단계; 및(c) 상기 지역 및 전역 토픽 정보 간의 문서 매핑을 통해 생성된 토픽 변환 정보를 상기 복수의 문서들 각각에 배정하는 단계를 포함하는 문서의 토픽 모델링 방법
|
8 |
8
제7항에 있어서, 상기 (a) 단계는상기 지역 토픽 모델링을 수행하여 상기 복수의 지역 문서 집합들 각각에 대해 적어도 하나의 주요 지역 토픽을 추출하고 지역 문서 집합에 속한 지역 문서 및 상기 적어도 하나의 주요 지역 토픽 간의 지역 토픽 행렬을 생성하는 단계인 것을 특징으로 하는 문서의 토픽 모델링 방법
|
9 |
9
제7항에 있어서, 상기 (b) 단계는상기 복수의 지역 문서 집합들 각각에 대해 토픽별 가중치가 높은 순서에 따라 적어도 하나의 지역 대표문서를 추출하여 상기 축소된 전역 문서 집합을 생성하는 단계인 것을 특징으로 하는 문서의 토픽 모델링 방법
|
10 |
10
제7항에 있어서, 상기 (b) 단계는상기 전역 토픽 모델링을 수행하여 상기 축소된 전역 문서 집합에 대해 적어도 하나의 주요 전역 토픽을 추출하고 상기 축소된 전역 문서 집합에 속한 지역 대표문서 및 상기 적어도 하나의 주요 전역 토픽 간의 전역 토픽 행렬을 생성하는 단계인 것을 특징으로 하는 문서의 토픽 모델링 방법
|
11 |
11
제7항에 있어서, 상기 (c) 단계는상기 지역 토픽 모델링을 통해 생성된 지역 토픽 행렬에서 지역 대표문서와 연관된 토픽 성분 정보를 추출하고 상기 토픽 성분 정보 및 상기 전역 토픽 모델링을 통해 생성된 전역 토픽 행렬 간의 곱 연산을 통해 적어도 하나의 토픽 변환 행렬을 생성하는 단계인 것을 특징으로 하는 문서의 토픽 모델링 방법
|
12 |
12
제11항에 있어서, 상기 (c) 단계는상기 지역 토픽 행렬 각각에 대해 상기 적어도 하나의 토픽 변환 행렬과의 곱 연산을 통해 상기 복수의 문서들에 전역 토픽 가중치를 배정하는 단계인 것을 특징으로 하는 문서의 토픽 모델링 방법
|
13 |
13
문서의 토픽 모델링 장치에서 수행되는 토픽 모델링 방법을 기록하는 컴퓨터 판독 가능한 기록매체에 있어서,복수의 문서들을 포함하는 전역 문서 집합을 분할하여 복수의 지역 문서 집합들을 생성하고 지역 토픽 모델링(Topic Modeling)을 수행하여 지역 토픽 정보를 생성하는 과정;상기 복수의 지역 문서 집합들 각각에 있는 대표문서를 통해 축소된 전역 문서 집합을 생성하고 전역 토픽 모델링을 수행하여 전역 토픽 정보를 생성하는 과정; 및상기 지역 및 전역 토픽 정보 간의 문서 매핑을 통해 생성된 토픽 변환 정보를 상기 복수의 문서들 각각에 배정하는 과정을 포함하는 기록매체
|