1 |
1
확률 분포를 계산할 수 있는 장치를 이용하여, 평가 대상에 대한 의견이 기술된 하나 이상의 문서 집합에서 시맨틱 토픽(semantic topic)을 추출하는 방법에 있어서,(a) 전역 토픽-감상 쌍에 대한 어휘 분포 및 지역 토픽-감상 쌍에 대한 어휘 분포를 추출하는 단계;(b) 상기 문서 집합의 각 문서에 대해, 전역 토픽 분포(global topic distribution) 및 전역 토픽에 대한 감상 분포(sentiment distribution), 지역 토픽 분포(local topic distribution) 및 지역 토픽에 대한 감상 분포를 추출하는 단계;(c) 상기 (a) 및 (b) 단계에서 추출된 각 분포에 대해 통계적 추론을 수행하는 단계; 및(d) 상기 문서 집합의 각 문서의 각 단어에 대해, 상기 전역 토픽 분포 및 전역 토픽에 대한 감상 분포 또는 지역 토픽 분포 및 지역 토픽에 대한 감상 분포로부터, 전역 또는 지역 토픽을 추출하고 상기 전역 또는 지역 토픽과 연관된 감상을 추출하며, 상기 추출된 토픽 및 감상을 기초로, 상기 전역 토픽-감상 쌍에 대한 어휘 분포 또는 지역 토픽-감상 쌍에 대한 어휘 분포로부터 단어를 추출하는 단계;를 포함하되,상기 전역 토픽은 상기 평가 대상의 속성(aspect) 중 상기 평가 대상을 다른 평가 대상과 구분하여 분류하는 데 사용할 수 있는 속성을 나타내며,상기 지역 토픽은 상기 평가 대상의 감상 지향 등급 산정 가능 속성(sentiment oriented ratable aspect)을 나타내는 시맨틱 토픽 추출 방법
|
2 |
2
삭제
|
3 |
3
제 1 항에 있어서,상기 각 확률 분포는 다항 분포(multinomial distribution) 또는 카테고리 분포(categorical distribution)인 시맨틱 토픽 추출 방법
|
4 |
4
제 1 항에 있어서,상기 각 확률 분포는 디리클레 사전확률(Dirichlet prior)에 기초하여 구축되는 시맨틱 토픽 추출 방법
|
5 |
5
제 1 항에 있어서,상기 통계적 추론에는 깁스 샘플링(Gibbs sampling) 기법이 사용되는 시맨틱 토픽 추출 방법
|
6 |
6
제 1 항에 있어서,상기 (b) 단계는상기 각 문서 내에서 서로 중첩(overlap)되는 하나 이상의 슬라이딩 윈도우(sliding window)를 이동시키는 단계; 및상기 슬라이딩 윈도우 내 문장에서 추출한 단어에 기초하여 상기 지역 토픽 분포 및 지역 토픽에 대한 감상 분포를 추출하는 단계;를 포함하되,상기 슬라이딩 윈도우는 상기 지역 토픽을 나타내는 단어 및 상기 지역 토픽에 대한 감상을 나타내는 단어가 함께 추출될 수 있도록 크기가 설정되는 시맨틱 토픽 추출 방법
|
7 |
7
시맨틱 토픽(semantic topic)을 추출하는 장치에 있어서,평가 대상에 대한 의견이 기술된 하나 이상의 문서 집합을 저장하는 문서 저장부; 및상기 문서 저장부에 저장된 문서 집합으로부터 상기 평가 대상의 감상 지향 등급 산정 가능 속성(sentiment oriented ratable aspect)을 포함하는 토픽(topic) 및 상기 토픽에 대한 감상(sentiment)을 추출하는 토픽 추출부;를 포함하되,상기 토픽 추출부는토픽-감상 쌍에 대한 어휘 분포를 추출하고, 상기 문서 집합의 각 문서에 대해, 토픽 분포(topic distribution) 및 감상 분포(sentiment distribution)를 추출하고, 상기 문서 집합의 각 문서의 각 단어에 대해, 상기 추출된 각 분포로부터 토픽 및 감상을 추출하는 것이며,상기 토픽-감상 쌍에 대한 어휘 분포는 전역 토픽-감상 쌍에 대한 어휘 분포 및 지역 토픽-감상 쌍에 대한 어휘 분포를 포함하고,상기 토픽 분포는 전역 토픽 분포(global topic distribution) 및 지역 토픽 분포(local topic distribution)를 포함하며,상기 감상 분포는 전역 토픽에 대한 감상 분포 및 지역 토픽에 대한 감상 분포를 포함하는 것이고,상기 전역 토픽은 상기 평가 대상의 속성(aspect) 중 상기 평가 대상을 다른 평가 대상과 구분하여 분류하는 데 사용할 수 있는 속성을 나타내며,상기 지역 토픽은 상기 평가 대상의 감상 지향 등급 산정 가능 속성(sentiment oriented ratable aspect)을 나타내는 것인 시맨틱 토픽 추출 장치
|
8 |
8
제 7 항에 있어서,상기 각 확률 분포는 디리클레 사전확률(Dirichlet prior)에 기초하여 구축되는 시맨틱 토픽 추출 장치
|
9 |
9
제 7 항에 있어서,상기 토픽 추출부는 기 추출된 각 분포의 통계적 추론에 깁스 샘플링(Gibbs sampling)을 사용하는 시맨틱 토픽 추출 장치
|
10 |
10
삭제
|
11 |
11
삭제
|