1 |
1
사용자에 의해 입력된 텍스트 문서 상에 자동으로 링크를 생성하는 장치로서,상기 텍스트 문서를 미리 저장된 알고리즘을 통해 분석하여, 상기 텍스트 문서의 토픽 및 키워드를 추출하는 링크 포인트 생성부, 그리고상기 토픽에 대응하는 벡터를 생성하고, 생성된 벡터와, 상기 텍스트 문서와 타문서의 토픽에 대응하는 벡터 간 유사도를 산출하며, 상기 유사도에 기반하여 상기 링크를 생성하는 링크 생성부를 포함하는 링크 생성 장치
|
2 |
2
제1항에서,상기 링크 생성부는,상기 유사도에 기반하여 상기 텍스트 문서의 키워드와 상기 타문서 또는 외부 도메인 지식의 키워드 간 링크를 생성하는 키워드 링크 생성부를 포함하는, 링크 생성 장치
|
3 |
3
제1항에서,상기 링크 생성부는,상기 유사도에 기반하여 상기 텍스트 문서와 상기 타문서 간 링크를 생성하는 문서 링크 생성부를 포함하는, 링크 생성 장치
|
4 |
4
제1항에서,상기 링크 포인트 생성부에 의해 추출된 토픽은 복수의 토픽과, 각 토픽별 상기 텍스트 문서의 주제일 확률값을 포함하는 벡터 형태이며,상기 링크 생성부는 상기 각 토픽별 상기 확률값을 제1값으로 나누고, 상기 복수의 토픽의 확률값 중 상기 사용자에 의해 미리 선택된 토픽의 확률값에 제2값을 더하여 상기 토픽에 대응하는 벡터를 생성하는, 링크 생성 장치
|
5 |
5
제1항에서,상기 링크 생성부는,코사인 유사도(cosine similarity)를 이용하여 상기 유사도를 산출하는, 링크 생성 장치
|
6 |
6
제1항에서,상기 링크 생성부는상기 유사도가 미리 설정된 기준값 보다 크면, 상기 텍스트 문서의 키워드와 상기 타문서 또는 외부 도메인 지식의 키워드 간 링크를 생성하거나, 또는 상기 텍스트 문서와 상기 타문서 간 링크를 생성하는, 링크 생성 장치
|
7 |
7
제1항에서,상기 알고리즘은 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 알고리즘인, 링크 생성 장치
|
8 |
8
제1항에서,상기 사용자로부터 제한 토픽 또는 제한 키워드를 제공받는 제한 입력부을 더 포함하고,상기 링크 생성부는 상기 제한 토픽에 대응하는 벡터를 생성하고, 생성된 벡터와, 상기 텍스트 문서와 타문서의 토픽에 대응하는 벡터 간 유사도를 산출하며, 상기 유사도가 미리 설정된 기준값 보다 크고 상기 타문서에 미리 설정된 키워드가 포함되어 있는 경우 상기 링크를 생성하는, 링크 생성 장치
|
9 |
9
제1항에서,페이지랭크에 기반하여 상위 순위의 랭크를 갖는 문서들을 포함하는 연관 문서 풀(pool)을 생성하고, 상기 텍스트 문서와 상기 연관 문서 풀의 상기 상위 순위의 랭크를 갖는 문서들 간 연관도를 산출하며, 상기 연관도에 기반하여 상기 링크 생성부에 의해 생성된 링크의 연결 대상을 갱신하는 링크 업데이트부를 더 포함하는, 링크 생성 장치
|
10 |
10
제1항에서,상기 링크 포인트 생성부는,상기 텍스트 문서를 미리 저장된 알고리즘을 통해 분석하여, 확률값을 갖는 복수의 토픽 및 각 토픽에 대응하는 제1 개수의 키워드를 추출하고, 각 토픽별 확률값에 기반하여 상기 제1 개수의 키워드 중에서 제2 개수의 키워드를 추출하는, 링크 생성 장치
|
11 |
11
사용자에 의해 입력된 텍스트 문서 상에 자동으로 링크를 생성하는 방법으로서,상기 텍스트 문서를 미리 저장된 알고리즘을 통해 분석하여, 상기 텍스트 문서의 토픽 및 키워드를 추출하는 단계,상기 토픽에 대응하는 벡터를 생성하는 단계,생성된 벡터와, 상기 텍스트 문서와 타문서의 토픽에 대응하는 벡터 간 유사도를 산출하는 단계, 그리고상기 유사도에 기반하여 상기 링크를 생성하는 단계를 포함하는 링크 생성 방법
|
12 |
12
제11항에서,상기 링크를 생성하는 단계는,상기 유사도에 기반하여 상기 텍스트 문서의 키워드와 상기 타문서 또는 외부 도메인 지식의 키워드 간 링크를 생성하는, 링크 생성 방법
|
13 |
13
제11항에서,상기 링크를 생성하는 단계는,상기 유사도에 기반하여 상기 텍스트 문서와 상기 타문서 간 링크를 생성하는, 링크 생성 방법
|
14 |
14
제11항에서,상기 텍스트 문서의 토픽 및 키워드를 추출하는 단계에서 추출된 토픽은 복수의 토픽과, 각 토픽별 상기 텍스트 문서의 주제일 확률값을 포함하는 벡터 형태이며,상기 토픽에 대응하는 벡터를 생성하는 단계는,상기 각 토픽별 상기 확률값을 제1값으로 나누고, 상기 복수의 토픽의 확률값 중 상기 사용자에 의해 미리 선택된 토픽의 확률값에 제2값을 더하여 상기 토픽에 대응하는 벡터를 생성하는, 링크 생성 방법
|
15 |
15
제11항에서,상기 유사도를 산출하는 단계는,코사인 유사도를 이용하여 상기 유사도를 산출하는, 링크 생성 방법
|
16 |
16
제11항에서,상기 링크를 생성하는 단계는,상기 유사도가 미리 설정된 기준값 보다 크면, 상기 텍스트 문서의 키워드와 상기 타문서 또는 외부 도메인 지식의 키워드 간 링크를 생성하거나, 또는 상기 텍스트 문서와 상기 타문서 간 링크를 생성하는, 링크 생성 방법
|
17 |
17
제11항에서,상기 링크를 생성하는 단계 이후,페이지랭크에 기반하여 상위 순위의 랭크를 갖는 문서들을 포함하는 연관 문서 풀(pool)을 생성하는 단계, 그리고상기 텍스트 문서와 상기 연관 문서 풀의 상기 상위 순위의 랭크를 갖는 문서들 간 연관도를 산출하며, 상기 연관도에 기반하여 상기 링크 생성부에 의해 생성된 링크의 연결 대상을 갱신하는 단계를 더 포함하는, 링크 생성 방법
|
18 |
18
사용자에 의해 입력된 텍스트 문서 상에 자동으로 링크를 생성하는 장치로서,프로세서 및 메모리를 포함하고,상기 프로세서는 상기 메모리에 저장된 프로그램을 실행하여,상기 텍스트 문서를 미리 저장된 알고리즘을 통해 분석하여, 상기 텍스트 문서의 토픽 및 키워드를 추출하는 단계,상기 토픽에 대응하는 벡터를 생성하는 단계,생성된 벡터와, 상기 텍스트 문서와 타문서의 토픽에 대응하는 벡터 간 유사도를 산출하는 단계, 그리고상기 유사도에 기반하여 상기 링크를 생성하는 단계를 수행하는, 링크 생성 장치
|