1 |
1
주제 키워드 기반으로 문서의 요약문을 생성하는 시스템으로서,상기 문서에서 주제 키워드(topic keyword)를 추출하는 키워드 추출부,언어 모델을 사용하여 상기 문서에 대한 요약문을 생성하는 요약문 생성부, 그리고상기 언어 모델이 상기 요약문을 생성하는 중에 상기 주제 키워드가 등장할 수 있도록 확률 모델을 사용하여 상기 주제 키워드가 등장할 제1 확률 분포를 계산하는 키워드 확률 계산부를 포함하며,상기 요약문 생성부는 상기 제1 확률 분포에 따라 상기 주제 키워드가 등장하는 요약문을 생성하는,주제 키워드 기반 문서 요약 시스템
|
2 |
2
제1항에 있어서,상기 언어 모델은 대용량의 문서 데이터로 학습된 기 학습 언어 모델(Pre-trained Language Model)을 요약 모델로서 파인 튜닝(Fine-tuning)한 언어 모델로서 시퀀스-투-시퀀스(Sequence-to-Sequence) 모델 형태의 MASS(MAsked Sequence-to-Sequence) 언어 모델인,주제 키워드 기반 문서 요약 시스템
|
3 |
3
제2항에 있어서,상기 확률 모델은 조건부 언어 모델(Conditional Language Model)에서 사용되는 PPLM(Plug and Play Language Model)의 어트리뷰트(Attribute) 모델인,주제 키워드 기반 문서 요약 시스템
|
4 |
4
제3항에 있어서,상기 요약 모델은 상기 요약문의 생성 과정에서 토큰을 생성할 때 사용하는 단어장의 제2 확률 분포에 상기 확률 모델에 의한 제1 확률 분포를 추가 적용하여 상기 요약문에 상기 주제 키워드를 등장시키는 데 사용하는,주제 키워드 기반 문서 요약 시스템
|
5 |
5
제4항에 있어서,상기 요약 모델에 따른 요약은 상기 제1 확률 모델과 상기 제2 확률 모델의 곱에 의해 계산되는 확률에 의해 수행되는,주제 키워드 기반 문서 요약 시스템
|
6 |
6
제5항에 있어서,상기 어트리뷰트 모델은 다음의 관계식 여기서, 는 키워드 집합이고, 는 입력 정보 가 주어질 때 어트리뷰트 가 등장할 확률을 나타내는 어트리뷰트 모델임으로 정의되고,상기 시퀀스-투-시퀀스는 다음의 관계식 여기서, 는 입력 정보이고, 는 생성하는 토큰 시퀀스임을 따르는,주제 키워드 기반 문서 요약 시스템
|
7 |
7
제5항에 있어서,상기 요약 모델은 상기 요약문 생성을 위해 다음의 관계식 에 따른 확률을 갖는 토큰 y를 산출하는,주제 키워드 기반 문서 요약 시스템
|
8 |
8
제7항에 있어서,상기 입력 정보 와 상기 어트리뷰트 가 독립인 경우, 상기 는 다음의 관계식 에 따라 계산되는,주제 키워드 기반 문서 요약 시스템
|
9 |
9
제3항에 있어서,상기 요약 모델은 상기 주제 키워드에 관한 토큰이 등장하는 경우 토큰의 변화에 따른 손실 함수를 통해 다시 업데이트되는,주제 키워드 기반 문서 요약 시스템
|
10 |
10
제3항에 있어서,상기 요약 모델은 어텐션(attention) 기반의 인코더 네트워크 및 디코더 네트워크로서 구성되는,주제 키워드 기반 문서 요약 시스템
|
11 |
11
제10항에 있어서,상기 디코더 네트워크는 상기 제1 확률 분포를 생성하고, 상기 어트리뷰트 모델에 의해 생성되는 상기 제2 확률 분포와의 합의 계산에 따라 주제 키워드 기반의 요약을 수행하는,주제 키워드 기반 문서 요약 시스템
|
12 |
12
요약 시스템이 주제 키워드 기반으로 문서의 요약문을 생성하는 방법으로서,상기 문서에서 주제 키워드를 추출하는 단계,언어 모델을 사용하여 상기 문서에 대한 요약문을 생성하는 단계,상기 요약문을 생성하는 중에 상기 주제 키워드가 등장할 수 있도록 확률 모델을 사용하여 상기 주제 키워드가 등장할 제1 확률 분포를 계산하는 단계, 그리고상기 제1 확률 분포에 따라 상기 주제 키워드가 등장하는 요약문을 생성하는 단계를 포함하는 주제 키워드 기반 문서 요약 방법
|
13 |
13
제12항에 있어서,상기 언어 모델은 대용량의 문서 데이터로 학습된 기 학습 언어 모델을 파인 튜닝한 언어 모델로서 시퀀스-투-시퀀스 모델 형태의 MASS 언어 모델이고,상기 확률 모델은 조건부 언어 모델에서 사용되는 PPLM의 어트리뷰트 모델인,주제 키워드 기반 문서 요약 방법
|
14 |
14
제13항에 있어서,상기 주제 키워드가 등장하는 요약문을 생성하는 단계는,상기 주제 키워드에 관한 토큰을 등장시키는 경우 상기 토큰의 변화에 따른 손실 함수를 통해 상기 언어 모델을 다시 업데이트하는 단계를 포함하는, 주제 키워드 기반 문서 요약 방법
|