1 |
1
문서의 상대적 특징을 반영한 문서 요약 방법에 있어서, 상기 방법은대상 문서와 배경 문서들을 그래프로 모델링하는 단계;문장 간 유사도에 기반하여 문장들을 클러스터링하는 단계; 및상기 대상 문서와 배경 문서들 간 공통 특징들과 고유 특징들 중 적어도 하나를 포함하여 문장들을 랭킹(ranking)하는 단계를 포함하되,상기 문장 간 유사도에 기반하여 문장들을 클러스터링하는 단계는각 클러스터가 유사한 문장들로 구성되는 스펙트럴 클러스터링을 하는 단계; 및 각 클러스터별 불순도(impurity)를 측정하는 엔트로피를 계산하는 단계를 포함하는 문서의 상대적 특징을 반영한 문서 요약 방법
|
2 |
2
제1항에 있어서,상기 대상 문서와 배경 문서들을 그래프로 모델링하는 단계는사용자 요청에 대응하는 대상 문서 및 상기 대상 문서와 유사한 콘텐츠를 가지는 배경 문서들을 수집하는 단계; 상기 대상 문서와 배경 문서들로부터 문장들을 분리하는 단계;상기 문장들에서 불용어를 제거하는 단계;상기 문장들 각각의 텍스트에서 어간을 추출하여 해당 문장을 변형하는 단계; 상기 분리된 문장들 간 유사도를 계산하는 단계; 및상기 분리된 문장들과 상기 유사도를 그래프로 표현하는 단계를 포함하는 문서의 상대적 특징을 반영한 문서 요약 방법
|
3 |
3
제2항에 있어서,상기 분리된 문장들 간 유사도를 계산하는 단계는 자카드 유사도(Jaccard Similarity)를 이용하는 것을 특징으로 하는 문서의 상대적 특징을 반영한 문서 요약 방법
|
4 |
4
삭제
|
5 |
5
제1항에 있어서,상기 엔트로피는 다음 수학식, (, : 해당 클러스터의 정규화된 엔트로피, : 번째 문서로부터의 문장 개수, : 해당 클러스터의 문장들의 총 수, : 해당 클러스터 내 문서의 수)을 이용하여 계산하는 것을 특징으로 하는 문서의 상대적 특징을 반영한 문서 요약 방법
|
6 |
6
제1항에 있어서,상기 문장들을 랭킹(ranking)하는 단계는문장 간 유사도, 클러스터의 크기, 클러스터의 엔트로피 중 적어도 하나를 포함하여 문장 간 가중치를 계산하는 단계; 및텍스트랭크(TextRank) 알고리즘에 기반하여 문장 점수를 계산하는 단계를 포함하는 문서의 상대적 특징을 반영한 문서 요약 방법
|
7 |
7
제6항에 있어서, 상기 문장 간 가중치는 다음 수학식(, : 와 를 포함하는 클러스터 의 엔트로피, : 두 문장 간 자카드 유사도(Jaccard Similarity), , : 클러스터 의 크기, : 다양성 파라미터) 을 이용하여 계산하는 것을 특징으로 하는 문서의 상대적 특징을 반영한 문서 요약 방법
|
8 |
8
제7항에 있어서,상기 문장 점수는 다음 수학식(: 0
|
9 |
9
제1항에 있어서, 상기 방법은문장 랭킹 순위가 높은 문장들을 추출하여 요약문을 생성하는 단계를 더 포함하는 문서의 상대적 특징을 반영한 문서 요약 방법
|
10 |
10
대상 문서와 배경 문서들을 그래프로 모델링하고, 문장 간 유사도에 기반하여 문장들을 클러스터링하고, 대상 문서와 배경 문서들 간 공통 특징들과 고유 특징들 중 적어도 하나를 포함하여 문장들을 랭킹(ranking)하는 문장 점수 계산부를 포함하되,대상 문서와 배경 문서들을 그래프로 모델링하는 문서 모델링 수단;문장 간 유사도에 기반하여 문장들을 클러스터링하는 클러스터링 수단; 및대상 문서와 배경 문서들 간 공통 특징들과 고유 특징들 중 적어도 하나를 포함하여 문장들을 랭킹(ranking)하는 문장 랭킹 수단을 포함하고,상기 클러스터링 수단은각 클러스터가 유사한 문장들로 구성되는 스펙트럴 클러스터링을 하고, 각 클러스터별 불순도(impurity)를 측정하는 엔트로피를 계산하는 것을 특징으로 하는 문서의 상대적 특징을 반영한 문서 요약 시스템
|
11 |
11
삭제
|
12 |
12
제10항에 있어서, 상기 문서 모델링 수단은 사용자 요청에 대응하는 대상 문서 및 상기 대상 문서와 유사한 콘텐츠를 가지는 배경 문서들을 수집하고, 상기 대상 문서와 배경 문서들로부터 문장들을 분리하고, 상기 문장들에서 불용어를 제거하고, 상기 문장들 각각의 텍스트에서 어간을 추출하여 해당 문장을 변형하고, 상기 분리된 문장들 간 유사도를 계산하고, 상기 분리된 문장들과 상기 유사도를 그래프로 표현하는 것을 특징으로 하는 문서의 상대적 특징을 반영한 문서 요약 시스템
|
13 |
13
제12항에 있어서,상기 분리된 문장들 간 유사도는 자카드 유사도(Jaccard Similarity)를 이용하여 계산하는 것을 특징으로 하는 문서의 상대적 특징을 반영한 문서 요약 시스템
|
14 |
14
삭제
|
15 |
15
제10항에 있어서,상기 엔트로피는 다음 수학식, (, : 해당 클러스터의 정규화된 엔트로피, : 번째 문서로부터의 문장 개수, : 해당 클러스터의 문장들의 총 수, : 해당 클러스터 내 문서의 수)을 이용하여 계산하는 것을 특징으로 하는 문서의 상대적 특징을 반영한 문서 요약 시스템
|
16 |
16
제10항에 있어서,상기 문장 랭킹(ranking)수단은문장 간 유사도, 클러스터의 크기, 클러스터의 엔트로피 중 적어도 하나를 포함하여 문장 간 가중치를 계산하고, 텍스트랭크(TextRank) 알고리즘에 기반하여 문장 점수를 계산하는 것을 특징으로 하는 문서의 상대적 특징을 반영한 문서 요약 시스템
|
17 |
17
제16항에 있어서,상기 문장 간 가중치는 다음 수학식(, : 와 를 포함하는 클러스터 의 엔트로피, : 두 문장 간 자카드 유사도(Jaccard Similarity), , : 클러스터 의 크기, : 다양성 파라미터) 을 이용하여 계산하는 것을 특징으로 하는 문서의 상대적 특징을 반영한 문서 요약 시스템
|
18 |
18
제17항에 있어서,상기 문장 점수는 다음 수학식(: 0
|
19 |
19
제10항에 있어서,상기 시스템은문서 요약에 대한 사용자 요청을 수신하는 사용자 요청 수신부; 및문장 랭킹 순위가 높은 문장들을 추출하여 요약문을 생성하는 요약문 생성부를 더 포함하는 문서의 상대적 특징을 반영한 문서 요약 시스템
|