맞춤기술찾기

이전대상기술

사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 방법 및 장치

  • 기술번호 : KST2023005644
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 방법 및 장치에 관한 것으로, 상기 방법은 텍스트의 문맥 정보를 사전학습하여 구축된 언어모델로부터 임베딩 행렬(embedding matrix)를 추출하는 임베딩 행렬 추출단계; 상기 임베딩 행렬이 적용된 추상 요약 모델을 정의하고 학습 데이터셋을 기초로 텍스트 요약문 생성을 위한 요약 학습을 수행하여 상기 추상 요약 모델을 구축하는 추상 요약 모델 구축단계; 및 상기 추상 요약 모델을 이용하여 입력 텍스트에 대한 요약문을 생성하는 텍스트 요약문 생성단계;를 포함한다.
Int. CL G06F 16/34 (2019.01.01) G06F 40/211 (2020.01.01) G06F 40/284 (2020.01.01) G06N 20/00 (2019.01.01)
CPC G06F 16/345(2013.01) G06F 40/211(2013.01) G06F 40/284(2013.01) G06N 20/00(2013.01)
출원번호/일자 1020220009998 (2022.01.24)
출원인 국민대학교산학협력단
등록번호/일자
공개번호/일자 10-2023-0103782 (2023.07.07) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020210192752   |   2021.12.30
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.01.24)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 국민대학교산학협력단 대한민국 서울특별시 성북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김남규 서울특별시 중랑구
2 송의석 서울특별시 동작구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 임태빈 대한민국 서울특별시 서초구 반포대로**길 ** ***동 ***,***호(서초동, 한빛위너스)(현신특허사무소)
2 정부연 대한민국 서울특별시 서초구 반포대로**길 **(서초동, 한빛위너스) ***동 ***, ***호(현신특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.01.24 수리 (Accepted) 1-1-2022-0086865-12
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
텍스트의 문맥 정보를 사전학습하여 구축된 언어모델로부터 임베딩 행렬(embedding matrix)를 추출하는 임베딩 행렬 추출단계;상기 임베딩 행렬이 적용된 추상 요약 모델을 정의하고 학습 데이터셋을 기초로 텍스트 요약문 생성을 위한 요약 학습을 수행하여 상기 추상 요약 모델을 구축하는 추상 요약 모델 구축단계; 및상기 추상 요약 모델을 이용하여 입력 텍스트에 대한 요약문을 생성하는 텍스트 요약문 생성단계;를 포함하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 방법
2 2
제1항에 있어서, 상기 임베딩 행렬 추출단계는사전학습된 코버트(KoBERT) 모델의 입력 계층(layer)에서 토큰 임베딩 행렬을 상기 임베딩 행렬로서 추출하는 단계를 포함하는 것을 특징으로 하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 방법
3 3
제2항에 있어서, 상기 임베딩 행렬 추출단계는상기 입력 계층의 임베딩 계층들에서 적어도 토큰 임베딩 행렬을 포함하는 임베딩 조합을 통해 상기 임베딩 행렬을 생성하는 단계를 포함하는 것을 특징으로 하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 방법
4 4
제1항에 있어서, 상기 추상 요약 모델 구축단계는트랜스포머(transformer) 모델을 상기 추상 요약 모델로서 정의하고 상기 트랜스포머 모델의 임베딩 계층에 상기 임베딩 행렬을 적용하는 단계를 포함하는 것을 특징으로 하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 방법
5 5
제4항에 있어서, 상기 추상 요약 모델 구축단계는상기 트랜스포머 모델의 인코더 임베딩 행렬과 디코더(decoder) 임베딩 행렬을 각각 상기 임베딩 행렬로 대체하는 단계를 포함하는 것을 특징으로 하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 방법
6 6
제4항에 있어서, 상기 추상 요약 모델 구축단계는상기 학습 데이터셋의 원문 텍스트를 상기 트랜스포머 모델의 인코더(encoder)에 입력하는 단계;상기 인코더의 임베딩 계층을 통해 상기 원문 텍스트에 대한 단어 벡터를 생성하는 단계;상기 단어 벡터를 상기 인코더의 인코더 계층에 통과시켜 상기 디코더에 전달하는 단계;상기 디코더를 통해 상기 원문 텍스트에 대응되는 요약 텍스트를 생성하는 단계; 및상기 원문 텍스트의 정답 텍스트와 상기 요약 텍스트 간의 차이를 비교하여 상기 인코더 및 상기 디코더를 갱신하는 단계를 포함하는 것을 특징으로 하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 방법
7 7
제1항에 있어서, 상기 텍스트 요약문 생성단계는상기 입력 텍스트를 복수의 부분 텍스트들로 분할하는 단계;상기 복수의 부분 텍스트들 각각을 상기 추상 요약 모델에 입력하여 복수의 부분 요약문들을 생성하는 단계; 및상기 복수의 부분 요약문들을 통합하여 상기 요약문을 생성하는 단계를 포함하는 것을 특징으로 하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 방법
8 8
제1항에 있어서,상기 요약문의 품질을 평가하는 요약문 품질 평가단계;를 더 포함하는 것을 특징으로 하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 방법
9 9
제8항에 있어서, 상기 요약문 품질 평가단계는상기 요약문과 사용자에 의해 입력된 정답문 사이의 단어 일치 정도에 따라 적어도 하나의 평가 지표를 산출하는 단계를 포함하는 것을 특징으로 하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 방법
10 10
텍스트의 문맥 정보를 사전학습하여 구축된 언어모델로부터 임베딩 행렬(embedding matrix)를 추출하는 임베딩 행렬 추출부;상기 임베딩 행렬이 적용된 추상 요약 모델을 정의하고 학습 데이터셋을 기초로 텍스트 요약문 생성을 위한 요약 학습을 수행하여 상기 추상 요약 모델을 구축하는 추상 요약 모델 구축부; 및상기 추상 요약 모델을 이용하여 입력 텍스트에 대한 요약문을 생성하는 텍스트 요약문 생성부;를 포함하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 장치
11 11
제10항에 있어서, 상기 임베딩 행렬 추출부는사전학습된 코버트(KoBERT) 모델의 입력 계층(layer)에서 토큰 임베딩 행렬을 상기 임베딩 행렬로서 추출하는 것을 특징으로 하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 장치
12 12
제10항에 있어서, 상기 추상 요약 모델 구축부는트랜스포머(transformer) 모델을 상기 추상 요약 모델로서 정의하고 상기 트랜스포머 모델의 임베딩 계층에 상기 임베딩 행렬을 적용하는 것을 특징으로 하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 장치
13 13
제12항에 있어서, 상기 추상 요약 모델 구축부는상기 트랜스포머 모델의 인코더 임베딩 행렬과 디코더(decoder) 임베딩 행렬을 각각 상기 임베딩 행렬로 대체하는 것을 특징으로 하는 사전학습 언어모델을 활용한 트랜스포머 기반 텍스트 요약 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 교육부 국민대학교 BK21플러스사업(R&D) 사회적 건강도 증진을 위한 데이터 사이언스 전문인력 양성팀