1 |
1
재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법에 있어서, 상기 방법은다중 문서에 대해 언폴딩 재귀 오토인코더(Unfolding Recursive Autoencoder, URAE)를 통한 문장 벡터를 모델링하는 단계; 상기 문장 벡터에 대해 텍스트 랭크를 적용하는 단계;핵심 키워드를 포함하는 문장을 파악하는 단계; 상기 텍스트 랭크를 적용하여 계산된 각 문장 벡터의 점수와 상기 핵심 키워드를 포함하는 문장의 점수를 합산하여 최종 문장 점수를 계산하는 단계; 및상기 최종 문장 점수를 기준으로 문장을 추출하되, 이미 추출된 문장과의 유사도가 낮은 문장을 우선적으로 추출하여 요약문을 생성하는 단계를 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
|
2 |
2
제1항에 있어서,상기 핵심 키워드를 포함하는 문장을 파악하는 단계는특정 단어가 텍스트에 나타나는 빈도 및 상기 특정 단어가 나타나는 문서 수를 고려하여 가중치를 부여하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
|
3 |
3
제2항에 있어서,상기 문장 벡터를 모델링하는 단계는문장을 구문에 따라 파싱하여 이진 트리로 표현하는 단계;상기 이진 트리를 이용하여 부모 노드마다 오토 인코딩 학습을 재귀적으로 진행하는 단계를 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
|
4 |
4
제3항에 있어서, 상기 문장 벡터를 모델링하는 단계는모든 비단말 노드에서 복원 에러의 합이 최소화 되도록 학습을 진행하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
|
5 |
5
제4항에 있어서, 상기 문장 벡터를 모델링하는 단계는상기 학습을 통해 최상위 노드의 문장 벡터가 모든 자식 노드의 의미 및 구문 정보를 포함하는 고차원적인 벡터가 되는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
|
6 |
6
제5항에 있어서,상기 문장 벡터에 대해 텍스트 랭크를 적용하는 단계는각 문장 벡터를 그래프의 정점으로, 정점 간 간선을 문장 간의 유사도로 표현하는 단계; 및각 문장벡터의 점수를 계산하는 단계를 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
|
7 |
7
제6항에 있어서,상기 각 문장 벡터의 점수를 계산하는 단계는연결된 다른 정점들의 점수가 클수록 각 문장 벡터의 점수가 증가하게 하여 정점들에 대한 반복 계산을 통해 수렴된 값으로 결정하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
|
8 |
8
제7항에 있어서,상기 최종 문장 점수를 계산하는 단계는다음 수학식( : 문장 의 최종 문장 점수, : 주어진 문서에서 단어 w의 TF-IDF 값, : 가중치 파라미터)를 통해 최종 점수를 계산하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
|
9 |
9
삭제
|
10 |
10
제8항에 있어서,상기 방법은사용자가 입력한 질의에 해당하는 문서 및 문장을 추출하는 단계를 더 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
|
11 |
11
다중 문서에 대해 언폴딩 재귀 오토인코더(Unfolding Recursive Autoencoder, URAE)를 통해 문장 벡터를 모델링하고, 상기 문장 벡터에 대해 텍스트랭크를 적용하고, 핵심 키워드를 포함하는 문장을 파악하고, 상기 텍스트랭크를 적용하여 계산된 각 문장 벡터의 점수와 상기 핵심 키워드를 포함하는 문장의 점수를 합산하여 최종 문장 점수를 계산하는 문장 점수 계산부; 및상기 최종 문장 점수를 기준으로 문장을 추출하되, 이미 추출된 문장과의 유사도가 낮은 문장을 우선적으로 추출하여 요약문을 생성하는 요약문 생성부를 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
|
12 |
12
제 11항에 있어서,상기 문장 점수 계산부는언폴딩 재귀 오토인코더(Unfolding Recursive Autoencoder, URAE)를 통한 문장 벡터를 모델링하는 문장 벡터 모델링 수단; 상기 문장 벡터에 대해 텍스트 랭크를 적용하는 텍스트랭크 적용 수단;핵심 키워드를 포함하는 문장을 파악하기 위한 TF-IDF 계산 수단; 및 상기 텍스트랭크를 적용하여 계산된 각 문장 벡터의 점수와 상기 핵심 키워드를 포함하는 문장의 점수를 합산하여 최종 문장 점수를 계산하는 최종 점수 계산 수단을 포함하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
|
13 |
13
제12항에 있어서,상기 TF-IDF 계산 수단은특정 단어가 텍스트에 나타나는 빈도 및 특정 단어가 나타나는 문서 수를 고려하여 핵심 키워드를 포함하는 문장을 파악하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
|
14 |
14
제13항에 있어서,상기 텍스트랭크 적용 수단은각 문장 벡터를 그래프의 정점으로, 정점 간 간선을 문장 간의 유사도로 표현하고, 연결된 다른 정점들의 점수가 클수록 각 문장 벡터의 점수가 증가하게 하여 정점들에 대한 반복 계산을 통해 수렴된 값으로 각 문장벡터의 점수를 계산하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
|
15 |
15
제14항에 있어서,상기 최종 문장 점수 계산 수단은다음 수학식 ( : 문장 의 최종 문장 점수, : 주어진 문서에서 단어 w의 TF-IDF 값, : 가중치 파라미터)를 통해 최종 점수를 계산하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
|
16 |
16
삭제
|
17 |
17
제15항에 있어서,상기 시스템은사용자가 입력한 요약문 생성을 위한 질의를 수신하는 사용자 질의 수신부를 더 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
|
18 |
18
제17항에 있어서,상기 점수 계산부는 상기 사용자 질의에 해당하는 문서 및 문장을 추출하는 문서 및 문장 추출 수단을 더 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
|