맞춤기술찾기

이전대상기술

재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법 및 문서 요약 시스템

  • 기술번호 : KST2019022898
  • 담당센터 : 경기기술혁신센터
  • 전화번호 : 031-8006-1570
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법 및 문서 요약 시스템을 제공한다. 상기 방법은 언폴딩 재귀 오토인코더(Unfolding Recursive Autoencoder, URAE)를 통한 문장 벡터를 모델링하는 단계, 상기 문장 벡터에 대해 텍스트 랭크를 적용하는 단계, 핵심 키워드를 포함하는 문장을 파악하는 단계와 상기 텍스트 랭크를 적용하여 계산된 각 문장 벡터의 점수와 상기 핵심 키워드를 포함하는 문장의 점수를 합산하여 최종 문장 점수를 계산하는 단계를 포함한다.
Int. CL G06F 17/21 (2006.01.01) G06F 17/27 (2006.01.01) G06F 16/00 (2019.01.01)
CPC G06F 40/103(2013.01) G06F 40/103(2013.01) G06F 40/103(2013.01)
출원번호/일자 1020150190005 (2015.12.30)
출원인 성균관대학교산학협력단
등록번호/일자 10-1717230-0000 (2017.03.10)
공개번호/일자
공고번호/일자 (20170316) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2015.12.30)
심사청구항수 16

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 성균관대학교산학협력단 대한민국 경기도 수원시 장안구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김다해 대한민국 경기도 안양시 만안구
2 이재동 대한민국 경기도 수원시 장안구
3 김누리 대한민국 경기도 수원시 장안구
4 방한별 대한민국 경기도 수원시 장안구
5 김수아 대한민국 경기도 의왕시 부곡복지관길 *
6 이지형 대한민국 서울특별시 용산구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 인비전 특허법인 대한민국 서울특별시 강남구 테헤란로 **길**, *층(대치동, 동산빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 성균관대학교산학협력단 경기도 수원시 장안구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2015.12.30 수리 (Accepted) 1-1-2015-1289538-39
2 [출원서등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2016.01.13 수리 (Accepted) 1-1-2016-0037256-82
3 의견제출통지서
Notification of reason for refusal
2016.08.31 발송처리완료 (Completion of Transmission) 9-5-2016-0627949-88
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2016.10.24 수리 (Accepted) 1-1-2016-1033127-31
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2016.10.24 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2016-1033140-25
6 [공지예외적용 보완 증명서류]서류제출서
2016.10.24 수리 (Accepted) 1-1-2016-1033174-77
7 [출원서 등 보정(보완)]보정서
2016.10.24 수리 (Accepted) 1-1-2016-1033162-29
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2017.02.23 수리 (Accepted) 4-1-2017-5028829-43
9 등록결정서
Decision to grant
2017.03.02 발송처리완료 (Completion of Transmission) 9-5-2017-0160269-19
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법에 있어서, 상기 방법은다중 문서에 대해 언폴딩 재귀 오토인코더(Unfolding Recursive Autoencoder, URAE)를 통한 문장 벡터를 모델링하는 단계; 상기 문장 벡터에 대해 텍스트 랭크를 적용하는 단계;핵심 키워드를 포함하는 문장을 파악하는 단계; 상기 텍스트 랭크를 적용하여 계산된 각 문장 벡터의 점수와 상기 핵심 키워드를 포함하는 문장의 점수를 합산하여 최종 문장 점수를 계산하는 단계; 및상기 최종 문장 점수를 기준으로 문장을 추출하되, 이미 추출된 문장과의 유사도가 낮은 문장을 우선적으로 추출하여 요약문을 생성하는 단계를 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
2 2
제1항에 있어서,상기 핵심 키워드를 포함하는 문장을 파악하는 단계는특정 단어가 텍스트에 나타나는 빈도 및 상기 특정 단어가 나타나는 문서 수를 고려하여 가중치를 부여하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
3 3
제2항에 있어서,상기 문장 벡터를 모델링하는 단계는문장을 구문에 따라 파싱하여 이진 트리로 표현하는 단계;상기 이진 트리를 이용하여 부모 노드마다 오토 인코딩 학습을 재귀적으로 진행하는 단계를 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
4 4
제3항에 있어서, 상기 문장 벡터를 모델링하는 단계는모든 비단말 노드에서 복원 에러의 합이 최소화 되도록 학습을 진행하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
5 5
제4항에 있어서, 상기 문장 벡터를 모델링하는 단계는상기 학습을 통해 최상위 노드의 문장 벡터가 모든 자식 노드의 의미 및 구문 정보를 포함하는 고차원적인 벡터가 되는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
6 6
제5항에 있어서,상기 문장 벡터에 대해 텍스트 랭크를 적용하는 단계는각 문장 벡터를 그래프의 정점으로, 정점 간 간선을 문장 간의 유사도로 표현하는 단계; 및각 문장벡터의 점수를 계산하는 단계를 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
7 7
제6항에 있어서,상기 각 문장 벡터의 점수를 계산하는 단계는연결된 다른 정점들의 점수가 클수록 각 문장 벡터의 점수가 증가하게 하여 정점들에 대한 반복 계산을 통해 수렴된 값으로 결정하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
8 8
제7항에 있어서,상기 최종 문장 점수를 계산하는 단계는다음 수학식( : 문장 의 최종 문장 점수, : 주어진 문서에서 단어 w의 TF-IDF 값, : 가중치 파라미터)를 통해 최종 점수를 계산하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
9 9
삭제
10 10
제8항에 있어서,상기 방법은사용자가 입력한 질의에 해당하는 문서 및 문장을 추출하는 단계를 더 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법
11 11
다중 문서에 대해 언폴딩 재귀 오토인코더(Unfolding Recursive Autoencoder, URAE)를 통해 문장 벡터를 모델링하고, 상기 문장 벡터에 대해 텍스트랭크를 적용하고, 핵심 키워드를 포함하는 문장을 파악하고, 상기 텍스트랭크를 적용하여 계산된 각 문장 벡터의 점수와 상기 핵심 키워드를 포함하는 문장의 점수를 합산하여 최종 문장 점수를 계산하는 문장 점수 계산부; 및상기 최종 문장 점수를 기준으로 문장을 추출하되, 이미 추출된 문장과의 유사도가 낮은 문장을 우선적으로 추출하여 요약문을 생성하는 요약문 생성부를 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
12 12
제 11항에 있어서,상기 문장 점수 계산부는언폴딩 재귀 오토인코더(Unfolding Recursive Autoencoder, URAE)를 통한 문장 벡터를 모델링하는 문장 벡터 모델링 수단; 상기 문장 벡터에 대해 텍스트 랭크를 적용하는 텍스트랭크 적용 수단;핵심 키워드를 포함하는 문장을 파악하기 위한 TF-IDF 계산 수단; 및 상기 텍스트랭크를 적용하여 계산된 각 문장 벡터의 점수와 상기 핵심 키워드를 포함하는 문장의 점수를 합산하여 최종 문장 점수를 계산하는 최종 점수 계산 수단을 포함하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
13 13
제12항에 있어서,상기 TF-IDF 계산 수단은특정 단어가 텍스트에 나타나는 빈도 및 특정 단어가 나타나는 문서 수를 고려하여 핵심 키워드를 포함하는 문장을 파악하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
14 14
제13항에 있어서,상기 텍스트랭크 적용 수단은각 문장 벡터를 그래프의 정점으로, 정점 간 간선을 문장 간의 유사도로 표현하고, 연결된 다른 정점들의 점수가 클수록 각 문장 벡터의 점수가 증가하게 하여 정점들에 대한 반복 계산을 통해 수렴된 값으로 각 문장벡터의 점수를 계산하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
15 15
제14항에 있어서,상기 최종 문장 점수 계산 수단은다음 수학식 ( : 문장 의 최종 문장 점수, : 주어진 문서에서 단어 w의 TF-IDF 값, : 가중치 파라미터)를 통해 최종 점수를 계산하는 것을 특징으로 하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
16 16
삭제
17 17
제15항에 있어서,상기 시스템은사용자가 입력한 요약문 생성을 위한 질의를 수신하는 사용자 질의 수신부를 더 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
18 18
제17항에 있어서,상기 점수 계산부는 상기 사용자 질의에 해당하는 문서 및 문장을 추출하는 문서 및 문장 추출 수단을 더 포함하는 재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 성균관대학교(자연과학캠퍼스) 차세대정보·컴퓨팅기술개발사업 의미 분석을 통한 연구내용 기반 상시 모니터링 시스템 개발
2 미래창조과학부 성균관대학교 산학협력단 SW컴퓨팅산업원천기술개발사업 스마트 TV 2.0 소프트웨어 플랫폼