1 |
1
토픽 분석 방법에 있어서, 문서에 포함된 텍스트 데이터를 전처리하는 전처리 단계; 및 잠재 디리클레 할당(Latent Dirichlet allocation, LDA)모델 구조에 계층적 디리클레 프로세스(Dirichlet Process, DP) 구조를 추가한 향상된 잠재 디리클레 할당 모델을 이용하여 상기 전처리된 텍스트 데이터에서 상기 토픽을 분석하는 단계;를 포함하되, 상기 향상된 잠재 디리클레 할당 모델에 대해 θ,Φ 를 부분 붕괴한 분포를 이용하여 부분 붕괴된 깁스 샘플러(Partially Collapsed Gibbs Samplers, PCG)를 이용해 샘플링을 실행하고, θ는 각 문서의 토픽 혼합 비율을 나타내는 모수이고, Φ는 각 토픽의 단어 혼합 비율을 나타내는 모수인 것 을 특징으로 하는 향상된 잠재 디리클레 할당 모델을 이용한 토픽 분석 방법
|
2 |
2
제1항에 있어서, 상기 향상된 잠재 디리클레 할당 모델의 하이퍼파라미터(hyperparameter)인 α 및 β는 사전에 지정된 상수가 아닌 것 을 특징으로 하는 향상된 잠재 디리클레 할당 모델을 이용한 토픽 분석 방법
|
3 |
3
제1항에 있어서, 상기 향상된 잠재 디리클레 할당 모델의 하이퍼파라미터인 α 및 β는 자동으로 추정되는 것 을 특징으로 하는 향상된 잠재 디리클레 할당 모델을 이용한 토픽 분석 방법
|
4 |
4
제1항에 있어서, 상기 향상된 잠재 디리클레 할당 모델의 하이퍼파라미터인 α 및 β는 디리클레 분포의 서로 다른 차원 파라미터인 것 을 특징으로 하는 향상된 잠재 디리클레 할당 모델을 이용하는 토픽 분석 방법
|
5 |
5
제1항에 있어서, 상기 향상된 잠재 디리클레 할당 모델은 이질적인 문서의 분석을 위해 상기 이질적인 문서의 텍스트 데이터를 군집화하여 각 군집마다 하이퍼파라미터를 할당하는 것 을 특징으로 하는 향상된 잠재 디리클레 할당 모델을 이용한 토픽 분석 방법
|
6 |
6
문서에 포함된 텍스트 데이터를 전처리하는 전처리부; 상기 전처리된 텍스트 데이터를 잠재 디리클레 할당모델 구조에 계층적 디리클레 프로세스 구조를 추가한 향상된 잠재 디리클레 할당 모델을 이용하여 토픽을 분석하는 토픽 분석부; 및 상기 향상된 잠재 디리클레 할당 모델에 대해 θ,Φ를 부분 붕괴한 분포를 이용하여 부분 붕괴된 깁스 샘플러(Partially Collapsed Gibbs Samplers, PCG)를 이용해 샘플링을 실행하는 샘플링부;를 포함하고,θ는 각 문서의 토픽 혼합 비율을 나타내는 모수이고, Φ는 각 토픽의 단어 혼합 비율을 나타내는 모수인 것 을 특징으로 하는 향상된 잠재 디리클레 할당 모델을 이용한 토픽 분석 장치
|
7 |
7
제6항에 있어서, 상기 향상된 잠재 디리클레 할당 모델의 하이퍼파라미터인 α 및 β는 사전에 지정된 상수가 아닌 것 을 특징으로 하는 향상된 잠재 디리클레 할당 모델을 이용한 토픽 분석 장치
|
8 |
8
제6항에 있어서, 상기 향상된 잠재 디리클레 할당 모델의 하이퍼파라미터인 α 및 β는 자동으로 추정되는 것 을 특징으로 하는 향상된 잠재 디리클레 할당 모델을 이용한 토픽 분석 장치
|
9 |
9
제6항에 있어서, 상기 향상된 잠재 디리클레 할당 모델의 하이퍼파라미터인 α 및 β는 디리클레 분포의 서로 다른 차원 파라미터인 것 을 특징으로 하는 향상된 잠재 디리클레 할당 모델을 이용하는 토픽 분석 장치
|
10 |
10
제6항에 있어서, 상기 향상된 잠재 디리클레 할당 모델은 이질적인 문서의 분석을 위해 상기 이질적인 문서의 텍스트 데이터를 군집화하여 각 군집마다 하이퍼파라미터를 할당하는 것 을 특징으로 하는 향상된 잠재 디리클레 할당 모델을 이용한 토픽 분석 장치
|
11 |
11
제1항 내지 제5항 중 어느 한 항에 따른 향상된 잠재 디리클레 할당 모델을 이용한 토픽 분석 방법을 수행시키기 위한 컴퓨터 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체
|