맞춤기술찾기

이전대상기술

문장 유사관계 예측 모델을 이용한 요약 문서 생성 방법 및 장치, 요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법 및 장치

  • 기술번호 : KST2023010239
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 문장 유사관계 예측 모델을 이용한 요약 문서 생성 기술에 관한 것으로, 문장 유사관계 예측 모델을 이용하여 원 문서의 문장들과 유사관계가 존재하는 문장이 포함된 문서 그룹을 취합하는 단계; 문서 그룹에서 원 문서와 임계치 미만의 관련도를 갖는 문서를 필터링하는 문서 필터링 단계; 문서 필터링 단계의 결과로 획득된 문서 셋에 존재하는 문장들 중에서 중복 문장을 필터링하는 문장 필터링 단계; 및 문장 필터링 단계의 결과로 획득된 문장을 통합하여 요약 문서를 출력하는 단계;를 포함할 수 있다.
Int. CL G06F 16/34 (2019.01.01) G06F 40/205 (2020.01.01) G06F 40/258 (2020.01.01) G06F 40/279 (2020.01.01) G06N 3/08 (2023.01.01) G06N 3/04 (2023.01.01)
CPC G06F 16/345(2013.01) G06F 40/205(2013.01) G06F 40/258(2013.01) G06F 40/279(2013.01) G06N 3/08(2013.01) G06N 3/04(2013.01)
출원번호/일자 1020220154678 (2022.11.17)
출원인 국방과학연구소
등록번호/일자 10-2600839-0000 (2023.11.07)
공개번호/일자
공고번호/일자 (20231110) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 발송처리완료
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.11.17)
심사청구항수 14

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 국방과학연구소 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 전호철 대전광역시 유성구
2 박규동 대전광역시 유성구
3 손미애 경기도 수원시 장안구
4 김민환 경기도 수원시 장안구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 국방과학연구소 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.11.17 수리 (Accepted) 1-1-2022-1228040-83
2 [우선심사신청]심사청구서·우선심사신청서
2022.11.22 수리 (Accepted) 1-1-2022-1248631-14
3 우선심사신청관련 서류제출서
Submission of Document Related to Request for Accelerated Examination
2022.12.26 수리 (Accepted) 1-1-2022-1399732-24
4 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2022.12.26 수리 (Accepted) 1-1-2022-1399808-06
5 [우선심사신청]선행기술조사의뢰서
[Request for Preferential Examination] Request for Prior Art Search
2023.01.02 수리 (Accepted) 9-1-9999-9999999-89
6 [우선심사신청]선행기술조사보고서
[Request for Preferential Examination] Report of Prior Art Search
2023.01.04 수리 (Accepted) 9-1-2023-0000288-72
7 의견제출통지서
Notification of reason for refusal
2023.06.30 발송처리완료 (Completion of Transmission) 9-5-2023-0593110-00
8 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2023.08.31 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2023-0964034-83
9 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2023.08.31 수리 (Accepted) 1-1-2023-0964033-37
10 등록결정서
Decision to grant
2023.11.03 발송처리완료 (Completion of Transmission) 9-5-2023-0996820-94
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
삭제
2 2
삭제
3 3
삭제
4 4
삭제
5 5
삭제
6 6
삭제
7 7
삭제
8 8
삭제
9 9
요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치의 문장 유사관계 예측 모델 학습 방법에 있어서,원 문장으로부터 핵심 문장을 선별하고, 상기 핵심 문장으로부터 학습을 위한 파생 문장을 생성하는 단계;상기 파생 문장과 상기 원 문장을 페어링하여 의사 레이블(pseudo label)을 생성하는 단계; 및상기 의사 레이블을 데이터 셋으로 언어 모델 메트릭 학습(metric learning)을 수행하여 상기 원 문장의 요약 문서를 출력하도록 문장 유사관계 예측 모델을 학습시키는 단계;를 포함하되,상기 파생 문장을 생성하는 단계는,상기 문장 유사관계 예측 모델의 학습을 위한 전처리 단계를 포함하고,상기 전처리 단계는,상기 원 문장으로부터 출현 빈도 기반의 어휘 중요도를 산출하는 단계;상기 어휘 중요도를 기초로 출현 확률 기반의 문장별 정보량을 산출하는 단계; 및상기 문장별 정보량을 기초로 상기 핵심 문장을 선별하는 단계;를 포함하는요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법
10 10
제 9 항에 있어서,상기 의사 레이블을 생성하는 단계는,상기 원 문장과 상기 파생 문장이 서로 동일하면 의사 레이블 1을 생성하는 단계; 및상기 원 문장과 상기 파생 문장이 서로 동일하지 않으면 의사 레이블 0을 생성하는 단계;를 포함하는요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법
11 11
제 9 항에 있어서,상기 문장 유사관계 예측 모델을 학습시키는 단계는,기 구축된 문장 유사관계 예측 모델의 데이터 셋을 활용한 전이 학습(transfer learning)을 수행하는 단계를 포함하는요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법
12 12
삭제
13 13
삭제
14 14
제 9 항에 있어서,상기 어휘 중요도는 TF-IDF(term frequency-inverst document frequency) 기법을 이용하여 산출되는요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법
15 15
제 9 항에 있어서,상기 문장별 정보량은 섀넌 엔트로피(shannon entropy)를 이용하여 산출되는요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법
16 16
제 9 항에 있어서,상기 언어 모델 메트릭 학습은 문장 간의 삼중항 손실(triplet loss) 함수를 기반으로 수행되는요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법
17 17
요약 문서를 생성하도록 학습되는 문장 유사관계 예측 모델이 저장된 저장부; 및원 문장이 입력되면 상기 원 문장의 요약 문서를 출력하도록 상기 문장 유사관계 예측 모델을 학습시키는 처리부;를 포함하되,상기 문장 유사관계 예측 모델은,상기 원 문장으로부터 핵심 문장을 선별하고, 상기 핵심 문장으로부터 학습을 위한 파생 문장을 생성하는 파생 문장 생성부; 및상기 파생 문장과 상기 원 문장을 페어링하여 의사 레이블을 생성하는 레이블 생성부;를 더 포함하고,상기 문장 유사관계 예측 모델은, 상기 의사 레이블을 데이터 셋으로 언어 모델 메트릭 학습을 수행하여 상기 원 문장의 요약 문서를 출력하도록 학습되며,상기 저장부는,상기 문장 유사관계 예측 모델의 학습을 수행하기 전에 문장 선별 및 정제 기능을 수행하는 전처리부를 포함하고,상기 전처리부는,상기 원 문장으로부터 출현 빈도 기반의 어휘 중요도를 산출하는 중요도 산출부;상기 어휘 중요도를 기초로 출현 확률 기반의 문장별 정보량을 산출하는 정보량 산출부; 및상기 문장별 정보량을 기초로 상기 핵심 문장을 선별하는 핵심 문장 선별부;를 포함하는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
18 18
제 17 항에 있어서,상기 레이블 생성부는,상기 원 문장과 상기 파생 문장이 서로 동일하면 의사 레이블 1을 생성하고,상기 원 문장과 상기 파생 문장이 서로 동일하지 않으면 의사 레이블 0을 생성하는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
19 19
제 17 항에 있어서,상기 처리부는,상기 문장 유사관계 예측 모델의 학습에 앞서,기 구축된 문장 유사관계 예측 모델의 데이터 셋을 활용한 전이 학습을 수행하는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
20 20
삭제
21 21
삭제
22 22
제 17 항에 있어서,상기 어휘 중요도는 TF-IDF 기법을 이용하여 산출되는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
23 23
제 17 항에 있어서,상기 문장별 정보량은 섀넌 엔트로피를 이용하여 산출되는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
24 24
제 17 항에 있어서,상기 언어 모델 메트릭 학습은 문장 간의 삼중항 손실 함수를 기반으로 수행되는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
25 25
제 17 항 내지 제 19 항, 제 22 항 내지 제 24 항 중 어느 한 항에 있어서,상기 문장 유사관계 예측 모델은 자기 지도 학습(self-supervised learning) 기반의 예측 모델을 포함하는요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 장치
26 26
컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서,상기 컴퓨터 프로그램은,요약 문서 생성을 위한 문장 유사관계 예측 모델 학습 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하고,상기 방법은,원 문장으로부터 핵심 문장을 선별하고, 상기 핵심 문장으로부터 학습을 위한 파생 문장을 생성하는 단계;상기 파생 문장과 상기 원 문장을 페어링하여 의사 레이블을 생성하는 단계; 및상기 의사 레이블을 데이터 셋으로 언어 모델 메트릭 학습을 수행하여 상기 원 문장의 요약 문서를 출력하도록 문장 유사관계 예측 모델을 학습시키는 단계;를 포함하되,상기 파생 문장을 생성하는 단계는,상기 문장 유사관계 예측 모델의 학습을 위한 전처리 단계를 포함하고,상기 전처리 단계는,상기 원 문장으로부터 출현 빈도 기반의 어휘 중요도를 산출하는 단계;상기 어휘 중요도를 기초로 출현 확률 기반의 문장별 정보량을 산출하는 단계; 및상기 문장별 정보량을 기초로 상기 핵심 문장을 선별하는 단계;를 포함하는컴퓨터 판독 가능한 기록매체
27 27
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.