1 |
1
트위터 데이터를 수집하고, 기설정된 카테고리별로 뉴스 데이터를 수집하는 데이터 수집부;상기 트위터 데이터에서 명사를 추출하여 트위터 명사 집단을 형성하고, 상기 뉴스 데이터에서 명사를 추출하여 상기 카테고리별로 뉴스 명사 집단을 형성하는 전처리부; 상기 트위터 명사 집단을 분류하여 복수의 클러스터를 형성하는 클러스터링부; 및상기 카테고리별로 형성된 뉴스 명사 집단을 이용하여, 상기 클러스터의 카테고리를 생성하는 카테고리 생성부;를 포함하는 카테고리 생성 시스템
|
2 |
2
제 1 항에 있어서, 상기 트위터 데이터는,한글 형식의 트위터 데이터인 카테고리 생성 시스템
|
3 |
3
제 1 항에 있어서, 상기 전처리부는, 형태소 분석기를 이용하여 상기 트위터 명사 집단 및 뉴스 명사 집단을 형성하는 카테고리 생성 시스템
|
4 |
4
제 1 항에 있어서, 상기 클러스터링부는,LDA(Latent Dirichlet Allocatopn) 모델을 이용하여 상기 복수의 클러스터를 형성하는 카테고리 생성 시스템
|
5 |
5
제 1 항에 있어서, 상기 전처리부는, 상기 트위터 명사 집단에서 의미를 가지지 않는 단어인 불용어 명사를 제외시켜 상기 트위터 명사 집단을 재형성하는 카테고리 생성 시스템
|
6 |
6
제 5 항에 있어서, 상기 클러스터링부는, 상기 재형성된 트위터 명사 집단을 분류하여 복수의 클러스터를 형성하는 카테고리 생성 시스템
|
7 |
7
제 1 항에 있어서,상기 카테고리 생성부는,상기 카테고리별로 형성된 뉴스 명사 집단과 상기 클러스터에 속한 명사들간의 일치여부를 판단하여, 상기 클러스터의 카테고리를 생성하는 카테고리 생성 시스템
|
8 |
8
제 1 항에 있어서,상기 카테고리 생성부는,상기 카테고리별로 형성된 뉴스 명사 집단 각각에 대해 상기 클러스터에 속한 명사들과의 일치여부를 판단하고, 일치하는 명사들을 포함하는 상기 뉴스 명사 집단의 카테고리를 상기 클러스터의 카테고리로 생성하는 카테고리 생성 시스템
|
9 |
9
제 1 항에 있어서, 상기 카테고리 생성부는, 상기 카테고리별로 형성된 뉴스 명사 집단을 이용하여, 상기 클러스터를 재형성하는 카테고리 생성 시스템
|
10 |
10
트위터 데이터를 수집하고;상기 트위터 데이터에서 명사를 추출하여 트위터 명사 집단을 형성하고;상기 트위터 명사 집단을 분류하여 복수의 클러스터를 형성하고;기설정된 카테고리별로 뉴스 데이터를 수집하고;상기 뉴스 데이터에서 명사를 추출하여 상기 카테고리별로 뉴스 명사 집단을 형성하고; 및 상기 카테고리별로 형성된 뉴스 명사 집단을 이용하여, 상기 클러스터의 카테고리를 생성하는;것을 포함하는 카테고리 생성 방법
|