맞춤기술찾기

이전대상기술

문서 내 언급되지 않은 정보를 가시화하기 위한 방법 및 시스템

  • 기술번호 : KST2020005890
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 자연언어처리 기술 연구에 있어, 문서 내에서 직접적으로 언급되지는 않았으나 주변에 언급된 정보의 조합을 통해 유추 가능한 정보에 대한 자동 정보 추출 방법 및 시스템에 대한 연구가 진행되어 왔다. 그러나, 인간이 자연적으로 인지 가능한 “해당하는 문서에 특정 정보가 누락되어 있는 것 같다”는 판단을 자동으로 수행하고 해당하는 판단 전반에 있어 누락된 것으로 예상되는 정보 모두를 자연어 형태로 사용자에게 출력 제공할 수 있는 시스템을 구축하기 위한 구체적인 방법이 제안된 적은 없다. 본 발명은 주어진 문서에 있어 동시에 언급될 가능성이 가장 높지만 문서 내에 언급되지 않은 정보를 자동으로 파악하여 사용자에게 제공하는 방법 및 시스템에 대한 것이다. 구체적으로, 본 발명은 사용자로부터 입력 받은 문서 내에 언급되지 않은 정보 중 입력 문서 내에 언급된 정보들과 함께 언급될 확률이 높은 정보를 문장 형태로 추가하며, 추가된 문장들과 기존 입력 문서에 포함되었던 문장들을 병합한 문서를 사용자에게 출력 제공한다. 본 발명을 통해 사용자는 특정 문서에 대해 문서의 저술과정에 의도적으로 혹은 의도치 않게 생략되었을 가능성이 있는 정보를 판단함에 있어 자동화된 방식으로 보조 받을 수 있으며, 이를 통해 문서에 대한 자세한 독해 과정 및 관련 정보 조사에 요구되는 사용자의 인지적 부담이 완화될 수 있다.
Int. CL G06F 40/20 (2020.01.01)
CPC G06F 40/35(2013.01) G06F 40/35(2013.01)
출원번호/일자 1020180141265 (2018.11.16)
출원인 한국과학기술원
등록번호/일자
공개번호/일자 10-2020-0057206 (2020.05.26) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박종철 대전광역시 유성구
2 양원석 대전광역시 유성구
3 김정호 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.11.16 수리 (Accepted) 1-1-2018-1140035-96
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.04.24 수리 (Accepted) 4-1-2019-5081392-49
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.05.15 수리 (Accepted) 4-1-2020-5108396-12
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.12 수리 (Accepted) 4-1-2020-5131486-63
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
언급되지 않은 정보를 가시화하는 방법에 있어서,사용자로부터 입력받은 입력 문서 내에서 직접 언급되지 않은 정보 중 입력 문서 내에서 언급된 정보들과 함께 언급되었을 확률이 높은 정보를 문장 형태로 추가하며, 추가된 문장들과 기존 입력 문서에 포함되었던 문장들을 병합한 문서를 사용자에게 출력 제공함을 통해, 주어진 문서와 함께 언급될 가능성이 가장 높았으나 문서 내에서 직접 언급되지 않은 정보를 자동으로 사용자에게 제공하는 방법
2 2
제 1 항에 있어서, 언급되지 않은 정보를 가시화하는 방법은상기 함께 언급될 확률이 높은 정보를 계산함에 있어, 문장, 기초 담화 단위, 사건을 의미 벡터로 변환하여 텍스트 집합의 쌍 혹은 텍스트의 쌍에 대한 상호 유사도를 측정하며, 상기 의미 벡터 변환에 있어 해쉬맵을 활용하여 특정 해쉬맵에 대한 복수 동시 등장 관계를 활용하는 방법
3 3
제 2 항에 있어서,상기 특정 해쉬맵에 대한 복수 동시 등장 관계는 하기 제1 항목 내지 제6 항목 중 하나 이상의 항목을 포함하는 방법:벡터 쌍에 있어서, 벡터 쌍은 두 개의 다른 문장 의미 벡터로 구성되며, 상기 두 개의 다른 문장 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 다른 두 문장에 있어, 한 문장을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 다른 한 문장을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제1 항목벡터 쌍에 있어서, 벡터 쌍은 두 개의 다른 담화 의미 벡터로 구성되며, 상기 두 개의 다른 담화 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 다른 두 기초 담화 단위에 있어, 한 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 다른 한 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제2 항목벡터 쌍에 있어서, 벡터 쌍은 두 개의 다른 사건 의미 벡터로 구성되며, 상기 두 개의 다른 사건 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 다른 두 사건에 있어, 한 사건을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 다른 한 사건을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제3 항목벡터 쌍에 있어서, 벡터 쌍은 하나의 문장 의미 벡터와 하나의 담화 의미 벡터로 구성되며, 상기 두 개의 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 하나의 문장과 하나의 기초 담화 단위에 있어, 해당하는 문장을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 해당하는 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제4 항목벡터 쌍에 있어서, 벡터 쌍은 하나의 문장 의미 벡터와 하나의 사건 의미 벡터로 구성되며, 상기 두 개의 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 하나의 문장과 하나의 사건에 있어, 해당하는 문장을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 해당하는 사건을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제5 항목벡터 쌍에 있어서, 벡터 쌍은 하나의 담화 의미 벡터와 하나의 사건 의미 벡터로 구성되며, 상기 두 개의 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 하나의 기초 담화 단위와 하나의 사건에 있어, 해당하는 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 해당하는 사건을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제6 항목
4 4
제 1 항에 있어서,언급되지 않은 정보를 가시화하는 방법은주어진 문서 집합에 대해 기초 담화 단위를 추출하는 언급된 구문 추출 단계(S310);상기 주어진 문서 집합에 대해 사건 정보를 추출하는 언급된 사건 추출 단계(S320);상기 주어진 문서 집합 내에 포함된 각 문장을 문장 의미 벡터로 변환하며, 문서에 포함된 기초 담화 단위와 사건 정보를 각기 담화 의미 벡터 및 사건 의미 벡터로 변환하는 의미 벡터 변환 단계(S330);두 개의 다른 의미 벡터에 상응하는 두 개의 다른 텍스트가 같은 문서 내에서 동시에 발생하는 빈도를 파악하는 동시 언급 빈도 계산 단계(S340);분석의 대상이 되는 입력 문서를 사용자로부터 입력받는 입력 단계(S410);입력 문서에서 기초 담화 단위 및 사건 정보를 추출하는 전처리 단계(S420);상기 입력 문서 내에 존재하는 텍스트에 대해, 입력 문서 내에 존재하지 않는 텍스트 중 최대 동시 언급 확률을 갖는 텍스트 집합을 생성하는 동시 발생 정보 처리 단계(S430);상기 최대 동시 언급 확률을 갖는 텍스트 집합 내에 존재하는 기초 담화 단위 및 사건을 모두 문장 형태로 변환하여 상기 최대 동시 언급 확률을 갖는 텍스트 집합에 포함된 모든 항목이 문장 형태를 갖도록 변환하는 문장 변환 단계(S440); 상기 입력 문서 내에 존재하지 않는 텍스트 중 최대 동시 언급 확률을 갖는 텍스트 집합을 입력 문서 내에 기존에 존재하던 문장들에 추가하여 병합할 때 최대화된 문서 일관성을 갖는 문서를 생성하기 위해, 상대적으로 추가 문장들이 가져야 하는 위치를 계산하는 문장 추가 위치 계산 단계(S450);사용자로부터 입력받은 문서 내에 포함되어 있던 문장과, 포함되어 있지 않던 새로 추가된 문장을 볼드체, 컬러 코딩 등의 방식을 통해 구분하여 병합한 문서를 사용자에게 출력 제공하며, 새로 추가된 문장 각각에 대해 원문 출처를 사용자에게 출력 제공하며, 각각의 원문 출처에 대해 클릭 방식의 상호작용을 통해 사용자가 새로 추가된 정보의 원문에 해당하는 문서에 접근할 수 있도록 하는 출력 단계(S460);를 포함하는 방법
5 5
언급되지 않은 정보를 가시화하는 시스템에 있어서,사용자로부터 입력받은 입력 문서 내에 언급되지 않은 정보 중 입력 문서 내에 언급된 정보들과 함께 언급될 확률이 높은 정보를 문장 형태로 추가하며, 추가된 문장들과 기존 입력 문서에 포함되어 있던 문장들을 병합한 문서를 사용자에게 출력 제공함을 통해, 주어진 문서와 함께 언급될 가능성이 가장 높았으나 문서 내에 언급되지 않았던 정보를 자동으로 사용자에게 제공하는 시스템
6 6
재 5 항에 있어서, 언급되지 않은 정보를 가시화하는 시스템은상기 함께 언급될 확률이 높은 정보를 계산함에 있어, 문장, 기초 담화 단위, 사건을 의미 벡터로 변환하여 텍스트 집합의 쌍 혹은 텍스트의 쌍에 대한 상호 유사도를 측정하며, 상기 의미 벡터 변환에 있어 해쉬맵을 활용하여 특정 해쉬맵에 대한 복수 동시 등장 관계를 활용하는 시스템
7 7
제 6 항에 있어서,상기 특정 해쉬맵에 대한 복수 동시 등장 관계는 하기 제1 항목 내지 제6 항목 중 하나 이상의 항목을 포함하는 시스템:벡터 쌍에 있어서, 벡터 쌍은 두 개의 다른 문장 의미 벡터로 구성되며, 상기 두 개의 다른 문장 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 다른 두 문장에 있어, 한 문장을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 다른 한 문장을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제1 항목벡터 쌍에 있어서, 벡터 쌍은 두 개의 다른 담화 의미 벡터로 구성되며, 상기 두 개의 다른 담화 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 다른 두 기초 담화 단위에 있어, 한 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 다른 한 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제2 항목 벡터 쌍에 있어서, 벡터 쌍은 두 개의 다른 사건 의미 벡터로 구성되며, 상기 두 개의 다른 사건 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 다른 두 사건에 있어, 한 사건을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 다른 한 사건을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제3 항목 벡터 쌍에 있어서, 벡터 쌍은 하나의 문장 의미 벡터와 하나의 담화 의미 벡터로 구성되며, 상기 두 개의 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 하나의 문장과 하나의 기초 담화 단위에 있어, 해당하는 문장을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 해당하는 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제4 항목 벡터 쌍에 있어서, 벡터 쌍은 하나의 문장 의미 벡터와 하나의 사건 의미 벡터로 구성되며, 상기 두 개의 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 하나의 문장과 하나의 사건에 있어, 해당하는 문장을 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 해당하는 사건을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제5 항목 벡터 쌍에 있어서, 벡터 쌍은 하나의 담화 의미 벡터와 하나의 사건 의미 벡터로 구성되며, 상기 두 개의 의미 벡터는, 입력 중에 문장 혹은 기초 담화 단위 혹은 사건을 포함하고 출력 중에 의미 벡터를 포함하는 특정 해쉬맵에 있어, 한 문서 내에 존재하는 하나의 기초 담화 단위와 하나의 사건에 있어, 해당하는 기초 담화 단위를 포함하는 입력에 대한 출력에 포함되는 의미 벡터와, 해당하는 사건을 포함하는 입력에 대한 출력에 포함되는 벡터 쌍이 존재하는 경우 벡터 쌍 내 두 벡터의 관계에 해당하는 제6 항목
8 8
제 5 항에 있어서,언급되지 않은 정보를 가시화하는 시스템은동시 언급 기준 코퍼스(110); 동시 언급 정보 처리부(120); 사용자 입력 문서 처리부(130)를 포함하고상기 동시 언급 기준 코퍼스(110)는 동일한 문서 내에 함께 등장하는 문장들의 상호 연관성을 분석함에 있어 그 분석 기반이 되는 문서 집합을 저장하고,상기 동시 언급 정보 처리부(120)는상기 동시 언급 기준 코퍼스(110)의 각 문서에서 기초 담화 단위를 추출하는 언급된 구문 추출부(121);상기 동시 언급 기준 코퍼스(110)의 각 문서에서 사건 정보를 추출하는 언급된 사건 추출부(122);상기 동시 언급 기준 코퍼스(110)의 각 문서에 내에 포함된 각 문장을 문장 의미 벡터로 변환하며, 문서에 포함된 기초 담화 단위와 사건 정보를 각각 담화 의미 벡터 및 사건 의미 벡터로 변환하는 의미 벡터 변환부(123);두 개의 다른 의미 벡터에 상응하는 두 개의 다른 텍스트가 같은 문서 내에서 동시에 발생하는 빈도를 파악하는 동시 언급 빈도 계산부(124);상기 동시 언급 기준 코퍼스(110) 전반에 걸쳐, 두 개의 다른 의미 벡터에 상응하는 두 개의 다른 텍스트가 같은 문서 내에서 동시에 발생하는 빈도를 저장하는 동시 발생 정보 데이터베이스(125);로 구성되며,상기 사용자 입력 문서 처리부(130)는분석의 대상이 되는 입력 문서를 사용자로부터 입력받는 입력부(131);상기 입력 문서에서 기초 담화 단위 및 사건 정보를 추출하는 전처리부(132);상기 입력 문서 내에 존재하는 텍스트에 대한 동시 발생 정보를 동시 발생 정보 데이터베이스(125)로부터 불러오며 이를 통해 입력 문서 내에 존재하는 텍스트에 대해, 입력 문서 내에 존재하지 않는 텍스트 중 최대 동시 언급 확률을 갖는 텍스트 집합을 생성하는 동시 발생 정보 처리부(133);상기 입력 문서 내에 존재하지 않는 텍스트 중 최대 동시 언급 확률을 갖는 텍스트 집합 내에 존재하는 기초 담화 단위 및 사건에 상응하는 문장을 문장 변환 데이터베이스(137)로부터 불러와, 기초 담화 단위 및 사건을 모두 문장 형태로 변환하여 상기 최대 동시 언급 확률을 갖는 텍스트 집합에 포함된 모든 항목이 문장 형태를 갖도록 변환하는 문장 변환부(134);상기 입력 문서 내에 존재하지 않는 텍스트 중 최대 동시 언급 확률을 갖는 텍스트 집합을 입력 문서 내에 기존에 존재하던 문장들에 추가하여 병합할 때 최대화된 문서 일관성을 갖는 문서를 생성하기 위해, 상대적으로 추가 문장들이 가져야 하는 위치를 계산하는 문장 추가 위치 계산부(135);상기 입력 문서 내에 포함되어 있던 문장과, 포함되어 있지 않던 새로 추가된 문장을 볼드체, 컬러 코딩 등의 방식을 통해 구분하여 병합한 문서를 사용자에게 출력 제공하며, 새로 추가된 문장 각각에 대해 원문 출처를 사용자에게 출력 제공하며, 각각의 원문 출처에 대해 클릭 방식의 상호작용을 통해 사용자가 새로 추가된 정보의 원문에 해당하는 문서에 접근할 수 있도록 하는 출력부(136);상기 문장 변환부(134)에서 기초 담화 단위와 사건에 해당하는 상기 단위 텍스트를 문장으로 변환하기 위한 담화-문장 및 사건-문장 쌍을 저장하는 문장 변환 데이터베이스(137);로 구성되는 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 정보통신.방송 연구개발사업 (EZBARO)(SW 스타랩)언어학적 분석 및 증거문서 자동 수집을 통한 신뢰도 분포 자동 예측 및 자동 증강(2018)