1 |
1
서버가 문서를 자동으로 요약하는 방법에 있어서,(a) 문서에 포함된 각 문장의 단어를 나타내는 노드(node)들을 문장 내 동시 출현 관계에 대한 가중치를 가지는 제 1 엣지(edge)로 연결하여 제 1 그래프(Gword)를 생성하는 단계;(b) 상기 제 1 그래프(Gword)를 이용하여, 상기 각 문장을 나타내는 노드들을 문장간 유사도에 대한 가중치를 가지는 제 2 엣지로 연결하여 제 2 그래프(Gsentence)를 생성하는 단계; 및(c) 상기 제 2 그래프(Gsentence)에 랭크 알고리즘을 적용하여 상기 복수의 문장 중에서 주요 문장을 추출하는 단계를 포함하는 것을 특징으로 하는 문서 자동 요약 방법
|
2 |
2
제 1 항에 있어서,상기 (a) 단계는,상기 제 1 그래프(Gword)에 포함된 단어들에 대하여 단어간 의미적 유사도를 계산하는 단계를 포함하고,상기 (b) 단계는,상기 단어간 의미적 유사도를 반영하여 상기 문장간 유사도를 계산하는 단계를 포함하는 것을 특징으로 하는 문서 자동 요약 방법
|
3 |
3
제 2 항에 있어서,상기 (a) 단계는,상기 단어들의 유의어를 추출하는 단계; 및상기 유의어를 나타내는 노드를 상기 제 1 그래프(Gword)에 추가하는 단계를 포함하는 것을 특징으로 하는 문서 자동 요약 방법
|
4 |
4
제 3 항에 있어서,상기 유의어를 나타내는 노드를 상기 제 1 그래프(Gword)에 추가하는 단계는,상기 제 1 그래프(Gword)에 기 포함된 노드와 상기 유의어를 나타내는 노드를 제 3 엣지로 연결하되,상기 제 3 엣지는 노드간 유의 정도를 나타내는 가중치를 가지는 것을 특징으로 하는 문서 자동 요약 방법
|
5 |
5
제 2 항에 있어서,상기 (a) 단계는,상기 제 1 그래프(Gword) 내에서 노드간 최단 경로를 구한 후 해당 노드들을 연결하는 엣지의 가중치들을 곱하여 상기 단어간 의미적 유사도를 계산하는 것을 특징으로 하는 문서 자동 요약 방법
|
6 |
6
제 2 항에 있어서,상기 (b) 단계는,코사인 유사도를 이용하여 상기 문장간 유사도를 계산하되,벡터 함수를 이용하여 상기 단어간 의미적 유사도를 상기 문장간 유사도에 적용하는 단계를 포함하며,상기 벡터 함수로부터 반환되는 벡터의 단어 차원은,제 1 문장과 제 2 문장에 등장한 단어들의 합집합의 크기인 n개의 차원을 가지고, 각 단어의 차원에 상기 제 1 문장에 등장한 단어의 등장 빈도를 카운트하는 단계; 및상기 등장 빈도를 카운트한 벡터에서 값이 0인 차원의 단어와 상기 제 1 문장에 출현한 단어와 유사도를 계산하여 유사도의 평균을 구하고 문장의 길이로 표준화한 값을 해당 차원의 값으로 지정하는 단계를 통해 반환되는 것을 특징으로 하는 문서 자동 요약 방법
|
7 |
7
제 2 항에 있어서,상기 (c) 단계는,TextRank의 랭킹 알고리즘을 사용하여 문장들의 랭크 점수를 내림차순으로 정렬한 후 상위 n개의 문장을 추출하여 상기 문서의 요약으로 제공하되,상기 TextRank의 랭킹 알고리즘은 PageRank의 랭킹 알고리즘에 상기 제 2 엣지를 반영하여 문장의 랭크 점수를 계산하는 것을 특징으로 하는 문서 자동 요약 방법
|
8 |
8
문서를 자동으로 요약하는 서버에 있어서,문서에 포함된 각 문장의 단어를 나타내는 1 노드(node)들을 문장 내 동시 출현 관계에 대한 가중치를 가지는 제 1 엣지(edge)로 연결하여 제 1 그래프(Gword)를 생성하는 단어간 관계 그래프 생성부;상기 제 1 그래프(Gword)를 이용하여, 상기 각 문장을 나타내는 노드들을 문장간 유사도에 대한 가중치를 가지는 제 2 엣지로 연결하여 제 2 그래프(Gsentence)를 생성하는 문장간 관계 그래프 생성부; 및상기 제 2 그래프(Gsentence)에 랭크 알고리즘을 적용하여 상기 복수의 문장 중에서 주요 문장을 추출하는 랭크 알고리즘 적용부를 포함하는 것을 특징으로 하는 서버
|
9 |
9
제 8 항에 있어서,상기 단어간 관계 그래프 생성부는,상기 제 1 그래프(Gword)에 포함된 단어들에 대하여 단어간 의미적 유사도를 계산하고,상기 문장간 관계 그래프 생성부는,상기 단어간 의미적 유사도를 반영하여 상기 문장간 유사도를 계산하는 것을 특징으로 하는 서버
|
10 |
10
제 9 항에 있어서,상기 단어들의 유의어를 추출하는 유의어 추출부를 더 포함하되,상기 단어간 관계 그래프 생성부는 상기 유의어를 나타내는 노드를 상기 제 1 그래프(Gword)에 추가하며,상기 제 1 그래프(Gword)에 추가되는 상기 유의어를 나타내는 노드는 상기 제 1 그래프(Gword)에 기 포함된 노드와 유의 정도를 나타내는 가중치를 가지는 제 3 엣지로 연결되는 것을 특징으로 하는 서버
|