1 |
1
삭제
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
삭제
|
5 |
5
삭제
|
6 |
6
삭제
|
7 |
7
삭제
|
8 |
8
삭제
|
9 |
9
요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치의 문장 유사관계 예측 모델 학습 방법에 있어서,원 문장으로부터 핵심 문장을 선별하고, 상기 핵심 문장으로부터 학습을 위한 파생 문장을 생성하는 단계;상기 파생 문장과 상기 원 문장을 페어링하여 의사 레이블(pseudo label)을 생성하는 단계; 및상기 의사 레이블을 데이터 셋으로 언어 모델 메트릭 학습(metric learning)을 수행하여 상기 원 문장의 요약 문서를 출력하도록 문장 유사관계 예측 모델을 학습시키는 단계;를 포함하되,상기 파생 문장을 생성하는 단계는,상기 문장 유사관계 예측 모델의 학습을 위한 전처리 단계를 포함하고,상기 전처리 단계는,상기 원 문장으로부터 출현 빈도 기반의 어휘 중요도를 산출하는 단계;상기 어휘 중요도를 기초로 출현 확률 기반의 문장별 정보량을 산출하는 단계; 및상기 문장별 정보량을 기초로 상기 핵심 문장을 선별하는 단계;를 포함하는요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법
|
10 |
10
제 9 항에 있어서,상기 의사 레이블을 생성하는 단계는,상기 원 문장과 상기 파생 문장이 서로 동일하면 의사 레이블 1을 생성하는 단계; 및상기 원 문장과 상기 파생 문장이 서로 동일하지 않으면 의사 레이블 0을 생성하는 단계;를 포함하는요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법
|
11 |
11
제 9 항에 있어서,상기 문장 유사관계 예측 모델을 학습시키는 단계는,기 구축된 문장 유사관계 예측 모델의 데이터 셋을 활용한 전이 학습(transfer learning)을 수행하는 단계를 포함하는요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법
|
12 |
12
삭제
|
13 |
13
삭제
|
14 |
14
제 9 항에 있어서,상기 어휘 중요도는 TF-IDF(term frequency-inverst document frequency) 기법을 이용하여 산출되는요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법
|
15 |
15
제 9 항에 있어서,상기 문장별 정보량은 섀넌 엔트로피(shannon entropy)를 이용하여 산출되는요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법
|
16 |
16
제 9 항에 있어서,상기 언어 모델 메트릭 학습은 문장 간의 삼중항 손실(triplet loss) 함수를 기반으로 수행되는요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법
|
17 |
17
요약 문서를 생성하도록 학습되는 문장 유사관계 예측 모델이 저장된 저장부; 및원 문장이 입력되면 상기 원 문장의 요약 문서를 출력하도록 상기 문장 유사관계 예측 모델을 학습시키는 처리부;를 포함하되,상기 문장 유사관계 예측 모델은,상기 원 문장으로부터 핵심 문장을 선별하고, 상기 핵심 문장으로부터 학습을 위한 파생 문장을 생성하는 파생 문장 생성부; 및상기 파생 문장과 상기 원 문장을 페어링하여 의사 레이블을 생성하는 레이블 생성부;를 더 포함하고,상기 문장 유사관계 예측 모델은, 상기 의사 레이블을 데이터 셋으로 언어 모델 메트릭 학습을 수행하여 상기 원 문장의 요약 문서를 출력하도록 학습되며,상기 저장부는,상기 문장 유사관계 예측 모델의 학습을 수행하기 전에 문장 선별 및 정제 기능을 수행하는 전처리부를 포함하고,상기 전처리부는,상기 원 문장으로부터 출현 빈도 기반의 어휘 중요도를 산출하는 중요도 산출부;상기 어휘 중요도를 기초로 출현 확률 기반의 문장별 정보량을 산출하는 정보량 산출부; 및상기 문장별 정보량을 기초로 상기 핵심 문장을 선별하는 핵심 문장 선별부;를 포함하는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
|
18 |
18
제 17 항에 있어서,상기 레이블 생성부는,상기 원 문장과 상기 파생 문장이 서로 동일하면 의사 레이블 1을 생성하고,상기 원 문장과 상기 파생 문장이 서로 동일하지 않으면 의사 레이블 0을 생성하는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
|
19 |
19
제 17 항에 있어서,상기 처리부는,상기 문장 유사관계 예측 모델의 학습에 앞서,기 구축된 문장 유사관계 예측 모델의 데이터 셋을 활용한 전이 학습을 수행하는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
|
20 |
20
삭제
|
21 |
21
삭제
|
22 |
22
제 17 항에 있어서,상기 어휘 중요도는 TF-IDF 기법을 이용하여 산출되는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
|
23 |
23
제 17 항에 있어서,상기 문장별 정보량은 섀넌 엔트로피를 이용하여 산출되는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
|
24 |
24
제 17 항에 있어서,상기 언어 모델 메트릭 학습은 문장 간의 삼중항 손실 함수를 기반으로 수행되는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
|
25 |
25
제 17 항 내지 제 19 항, 제 22 항 내지 제 24 항 중 어느 한 항에 있어서,상기 문장 유사관계 예측 모델은 자기 지도 학습(self-supervised learning) 기반의 예측 모델을 포함하는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
|
26 |
26
컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서,상기 컴퓨터 프로그램은,요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하고,상기 방법은,원 문장으로부터 핵심 문장을 선별하고, 상기 핵심 문장으로부터 학습을 위한 파생 문장을 생성하는 단계;상기 파생 문장과 상기 원 문장을 페어링하여 의사 레이블을 생성하는 단계; 및상기 의사 레이블을 데이터 셋으로 언어 모델 메트릭 학습을 수행하여 상기 원 문장의 요약 문서를 출력하도록 문장 유사관계 예측 모델을 학습시키는 단계;를 포함하되,상기 파생 문장을 생성하는 단계는,상기 문장 유사관계 예측 모델의 학습을 위한 전처리 단계를 포함하고,상기 전처리 단계는,상기 원 문장으로부터 출현 빈도 기반의 어휘 중요도를 산출하는 단계;상기 어휘 중요도를 기초로 출현 확률 기반의 문장별 정보량을 산출하는 단계; 및상기 문장별 정보량을 기초로 상기 핵심 문장을 선별하는 단계;를 포함하는컴퓨터 판독 가능한 기록매체
|
27 |
27
삭제
|