1 |
1
수집모듈이 DB로부터 텍스트 데이터를 수집하는 단계;클러스터링모듈이 상기 수집된 텍스트 데이터를 토픽별로 클러스터링하는 단계;탐지모듈이 상기 토픽별로 클러스터링된 텍스트 데이터에서 이벤트를 포함하는 토픽 문장을 탐지하는 단계;추출모듈이 상기 탐지한 토픽 문장과 연관된 지식을 추출하는 단계;워드벡터 생성모듈이 개별 텍스트 컬렉션으로부터 워드벡터들을 생성하는 단계;네트워크 생성모듈이 상기 추출된 연관된 지식과 상기 생성된 워드벡터들을 결합하여 이기종 정보 네트워크를 생성하는 단계;확장단어 생성모듈이 입력단어에 대응하여 상기 생성된 네트워크 내의 타겟 텍스트 컬렉션으로부터 상기 워드벡터를 활용하여 확장단어를 생성하는 단계; 및문서추천모듈이 상기 확장단어를 기반으로 상기 타겟 텍스트 컬렉션으로부터 문서를 추천하는 단계;를 포함하는 문서추천방법
|
2 |
2
제 1 항에 있어서, 상기 클러스터링하는 단계는 상기 텍스트 데이터에 대한 토픽 모델링하는 단계; 상기 모델링된 토픽의 키워드를 정제하는 단계; 상기 정제된 키워드를 활용하여 상기 텍스트 데이터를 정제하는 단계;및 상기 정제된 텍스트 데이터의 제목을 라벨링하는 단계;를 더 포함하는 문서추천방법
|
3 |
3
제 1 항에 있어서, 상기 연관된 지식의 추출은 상기 이벤트를 기초로 상기 탐지된 문장 내의 개체명들을 추출하는 것을 특징으로 하는 문서추천방법
|
4 |
4
제 1 항에 있어서, 상기 이기종 정보 네트워크는 상기 개별 텍스트 컬렉션으로부터 생성된 워드벡터 내에 존재하는 단어들을 연결하여 생성하는 것을 특징으로 하는 문서추천방법
|
5 |
5
제 1 항에 있어서, 상기 확장단어는 상기 입력단어와 인접한 상기 워드 벡터 내의 연관된 단어인 것을 특징으로 하는 문서추천방법
|
6 |
6
제 1 항에 있어서, 상기 워드벡터는 상기 개별 텍스트 컬렉션에 개시된 연관된 단어들로 구성되는 것을 특징으로 하는 문서추천방법
|
7 |
7
DB로부터 텍스트 데이터를 수집하는 수집모듈; 상기 수집된 텍스트 데이터를 토픽별로 클러스터링하는 클러스터링모듈; 상기 토픽별로 클러스터링된 텍스트 데이터에서 이벤트를 포함하는 토픽 문장을 탐지하는 탐지모듈; 상기 탐지한 토픽 문장과 연관된 지식을 추출하는 추출모듈; 개별 텍스트 컬렉션으로부터 워드벡터들을 생성하는 워드벡터 생성모듈; 상기 추출된 연관된 지식과 상기 생성된 워드 백터들을 결합하여 이기종 정보 네트워크를 생성하는 네트워크 생성모듈; 입력단어에 대응하여 상기 생성된 네트워크 내의 타겟 텍스트 컬렉션으로부터 상기 워드벡터를 활용하여 확장단어를 생성하는 확장단어 생성모듈; 및 상기 확장단어를 기반으로 상기 타겟 텍스트 컬렉션으로부터 문서를 추천하는 문서추천모듈;를 포함하는 문서추천장치
|
8 |
8
제 7 항에 있어서, 상기 클러스터링모듈은, 상기 텍스트 데이터에 대한 토픽 모델링하는 모델링모듈; 상기 모델링된 토픽의 키워드를 정제하는 키워드정제모듈; 상기 정제된 키워드를 활용하여 상기 텍스트 데이터를 정제하는 텍스트 데이터 정제모듈;및 상기 정제된 텍스트 데이터의 제목을 라벨링하는 라벨링모듈;을 더 포함하는 문서추천장치
|
9 |
9
제 7 항에 있어서, 상기 연관된 지식의 추출은 상기 이벤트를 기초로 상기 탐지된 문장 내의 개체명들을 추출하는 것을 특징으로 하는 문서추천장치
|
10 |
10
제 7 항에 있어서, 상기 이기종 정보 네트워크는 상기 개별 텍스트 컬렉션으로부터 생성된 워드벡터 내에 존재하는 단어들을 연결하여 생성하는 것을 특징으로 하는 문서추천장치
|
11 |
11
제 7 항에 있어서, 상기 확장단어는 상기 입력단어와 인접한 상기 워드 벡터 내의 연관된 단어인 것을 특징으로 하는 문서추천장치
|
12 |
12
제 7 항에 있어서, 상기 워드벡터는 상기 개별 텍스트 컬렉션에 개시된 연관된 단어들로 구성되는 것을 특징으로 하는 문서추천장치
|
13 |
13
삭제
|