맞춤기술찾기

이전대상기술

딥러닝 기반의 지식 구조 생성 방법을 활용한 의료 문헌 구절 검색 방법 및 시스템

  • 기술번호 : KST2019020128
  • 담당센터 :
  • 전화번호 :
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 딥러닝 기반의 지식 구조 생성 방법을 활용한 의료 문헌 구절 검색 방법 및 시스템이 제시된다. 일 실시예에 따른 의료 문헌 구절 검색 방법은, 의료 문헌으로부터 문단 단위의 구절을 추출하는 단계; 추출된 상기 구절을 인덱싱하며 입력되는 초기 질의어와 적합한 구절을 검색하여, 초기 구절 검색 결과를 획득하는 단계; 상기 초기 구절 검색 결과에서 기설정된 수의 상위 구절들을 자연어 처리를 통해 핵심 개념들을 추출한 후, 상기 핵심 개념들 간의 연관성 정보를 추출하는 단계; 상기 핵심 개념들 간의 연관성 정보를 이용하여 지식 구조를 생성하는 단계; 구축된 상기 지식 구조의 핵심 개념을 탐색하는 단계; 탐색된 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이의 개념을 질의어 셋(set)에 추가하는 단계; 및 확장된 상기 질의어 셋을 활용하여 의료 구절 검색을 재수행하는 단계를 포함하여 이루어질 수 있다.
Int. CL G16H 70/00 (2018.01.01) G06F 16/00 (2019.01.01) G06N 3/08 (2006.01.01)
CPC G16H 70/00(2013.01) G16H 70/00(2013.01) G16H 70/00(2013.01)
출원번호/일자 1020180041996 (2018.04.11)
출원인 한국과학기술원
등록번호/일자
공개번호/일자 10-2019-0118744 (2019.10.21) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.04.11)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이문용 대전광역시 유성구
2 한기준 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.04.11 수리 (Accepted) 1-1-2018-0359019-11
2 선행기술조사의뢰서
Request for Prior Art Search
2018.12.10 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2019.02.14 발송처리완료 (Completion of Transmission) 9-6-2019-0032531-01
4 의견제출통지서
Notification of reason for refusal
2019.04.05 발송처리완료 (Completion of Transmission) 9-5-2019-0249843-95
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.04.24 수리 (Accepted) 4-1-2019-5081392-49
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.05.24 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0534030-54
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.05.24 수리 (Accepted) 1-1-2019-0534029-18
8 등록결정서
Decision to grant
2019.10.30 발송처리완료 (Completion of Transmission) 9-5-2019-0789085-14
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.05.15 수리 (Accepted) 4-1-2020-5108396-12
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.12 수리 (Accepted) 4-1-2020-5131486-63
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
구절 추출부에서 의료 문헌으로부터 문단 단위의 구절을 추출하는 단계; 구절 검색부에서 추출된 상기 구절을 인덱싱하며 입력되는 초기 질의어와 적합한 구절을 검색하여, 초기 구절 검색 결과를 획득하는 단계; 연관성 정보 추출부에서 상기 초기 구절 검색 결과에서 기설정된 수의 상위 구절들을 자연어 처리를 통해 핵심 개념들을 추출한 후, 상기 핵심 개념들 간의 연관성 정보를 추출하는 단계; 지식 구조 생성부에서 상기 핵심 개념들 간의 연관성 정보를 이용하여 지식 구조를 생성하는 단계; 핵심 개념 탐색부에서 구축된 상기 지식 구조의 핵심 개념을 탐색하는 단계; 질의어 확장부에서 탐색된 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이의 개념을 질의어 셋(set)에 추가하는 단계; 및 상기 구절 검색부에서 확장된 상기 질의어 셋을 활용하여 의료 구절 검색을 재수행하는 단계 를 포함하고, 상기 의료 문헌으로부터 문단 단위의 구절을 추출하는 단계는, 복수의 의료 문헌에서 파일 형식을 변환한 후, PDFbox 라이브러리를 이용하여 텍스트 및 이미지 추출하며, OpenNLP 라이브러리를 통해 텍스트 문장 및 문단을 구분하는 텍스트 전처리를 수행함에 따라, 추출된 텍스트로부터 문단을 추출하고 상기 문단을 한 구절로 정의하여 상기 문단 단위의 구절을 추출하며, 상기 핵심 개념들 간의 연관성 정보를 이용하여 지식 구조를 생성하는 단계는, 상기 기설정된 수의 상위 구절들로부터 추출된 상기 핵심 개념들 간의 거리 매트릭스를 구축하고 얻어진 각 거리간의 유사도를 각 열(row)의 수치로 사용하여 연관성 행렬을 생성하는 단계; 및 상기 연관성 행렬을 이용하여 상기 지식 구조를 생성하는 단계를 포함하며, 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이의 개념을 질의어 셋(set)에 추가하는 단계는, 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이에 놓여있는 개념어를 질의어 셋(set)에 추가하되, 질의어 확장 이전에 외부 온톨로지를 활용하여 상기 개념어가 UMLS 코드를 가지고 있는 의학 용어인지 여부를 판단하여 의학 용어라고 판단되지 않는 경우 질의어 셋(set)에 추가하지 않는 것을 특징으로 하는, 의료 문헌 구절 검색 방법
2 2
제1항에 있어서,상기 초기 구절 검색 결과를 획득하는 단계는, 사용자가 입력한 초기 질의어와 적합한 구절들을 TF-IDF, BM25, LM 기법을 통해 검색 후, 종합하여 검색 결과를 획득하는 것을 특징으로 하는, 의료 문헌 구절 검색 방법
3 3
제1항에 있어서,상기 핵심 개념들 간의 연관성 정보를 추출하는 단계는, 상기 초기 구절 검색 결과에서 기설정된 수의 상위 구절들을 자연어 처리를 통해 핵심 개념들을 추출하는 단계; 및 추출된 상기 핵심 개념들을 이용하여 딥러닝 기반의 Word2Vec 알고리즘을 수행하여 각 핵심 개념들을 벡터로 변환하는 임베딩 작업을 수행하는 단계를 포함하는, 의료 문헌 구절 검색 방법
4 4
삭제
5 5
제1항에 있어서,상기 지식 구조의 핵심 개념을 탐색하는 단계는, 페이지랭크(PageRank) 알고리즘을 활용하여 상기 지식 구조에서 가장 핵심적인 키워드를 탐색하는 것을 특징으로 하는, 의료 문헌 구절 검색 방법
6 6
삭제
7 7
제1항에 있어서,상기 초기 질의어를 통해 상위에 검색된 복수 개의 의료 관련 구절로부터 통합된 상기 지식 구조를 자동으로 생성하고, 생성된 상기 지식 구조로부터 질의어 확장에 관련된 키워드를 자동으로 추출하는 것을 특징으로 하는, 의료 문헌 구절 검색 방법
8 8
의료 문헌으로부터 문단 단위의 구절을 추출하는 구절 추출부; 추출된 상기 구절을 인덱싱하며 입력되는 초기 질의어와 적합한 구절을 검색하여, 초기 구절 검색 결과를 획득하는 구절 검색부; 상기 초기 구절 검색 결과에서 기설정된 수의 상위 구절들을 자연어 처리를 통해 핵심 개념들을 추출한 후, 상기 핵심 개념들 간의 연관성 정보를 추출하는 연관성 정보 추출부; 상기 핵심 개념들 간의 연관성 정보를 이용하여 지식 구조를 생성하는 지식 구조 생성부; 구축된 상기 지식 구조의 핵심 개념을 탐색하는 핵심 개념 탐색부; 및 탐색된 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이의 개념을 질의어 셋(set)에 추가하는 질의어 확장부를 포함하고, 확장된 상기 질의어 셋을 활용하여 의료 구절 검색을 재수행하며, 상기 구절 추출부는, 복수의 의료 문헌에서 파일 형식을 변환한 후, PDFbox 라이브러리를 이용하여 텍스트 및 이미지 추출하며, OpenNLP 라이브러리를 통해 텍스트 문장 및 문단을 구분하는 텍스트 전처리를 수행함에 따라, 추출된 텍스트로부터 문단을 추출하고 상기 문단을 한 구절로 정의하여 상기 문단 단위의 구절을 추출하며, 상기 지식 구조 생성부는, 상기 기설정된 수의 상위 구절들로부터 추출된 상기 핵심 개념들 간의 거리 매트릭스를 구축하고 얻어진 각 거리간의 유사도를 각 열(row)의 수치로 사용하여 연관성 행렬을 생성하고, 상기 연관성 행렬을 이용하여 상기 지식 구조를 생성하며, 상기 질의어 확장부는, 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이에 놓여있는 개념어를 질의어 셋(set)에 추가하되, 질의어 확장 이전에 외부 온톨로지를 활용하여 상기 개념어가 UMLS 코드를 가지고 있는 의학 용어인지 여부를 판단하여 의학 용어라고 판단되지 않는 경우 질의어 셋(set)에 추가하지 않는 것을 특징으로 하는, 의료 문헌 구절 검색 시스템
9 9
제8항에 있어서,상기 구절 검색부는, 사용자가 입력한 초기 질의어와 적합한 구절들을 TF-IDF, BM25, LM 기법을 통해 검색 후, 종합하여 검색 결과를 획득하는 것을 특징으로 하는, 의료 문헌 구절 검색 시스템
10 10
제8항에 있어서,상기 연관성 정보 추출부는, 상기 초기 구절 검색 결과에서 기설정된 수의 상위 구절들을 자연어 처리를 통해 핵심 개념들을 추출한 후, 딥러닝 기반의 Word2Vec 알고리즘을 수행하여 각 핵심 개념들을 벡터로 변환하는 임베딩 작업을 수행하는 것을 특징으로 하는, 의료 문헌 구절 검색 시스템
11 11
제8항에 있어서,상기 핵심 개념 탐색부는, 페이지랭크(PageRank) 알고리즘을 활용하여 상기 지식 구조에서 가장 핵심적인 키워드를 탐색하는 것을 특징으로 하는, 의료 문헌 구절 검색 시스템
12 12
삭제
13 13
제8항에 있어서,상기 초기 질의어를 통해 상위에 검색된 복수 개의 의료 관련 구절로부터 통합된 상기 지식 구조를 자동으로 생성하고, 생성된 상기 지식 구조로부터 질의어 확장에 관련된 키워드를 자동으로 추출하는 것을 특징으로 하는, 의료 문헌 구절 검색 시스템
14 14
구절 추출부에서 복수의 문헌으로부터 문단 단위의 구절을 추출하는 단계; 구절 검색부에서 추출된 상기 구절을 인덱싱하며 입력되는 초기 질의어와 적합한 구절을 검색하여, 초기 구절 검색 결과를 획득하는 단계; 연관성 정보 추출부에서 상기 초기 구절 검색 결과에서 기설정된 수의 상위 구절들을 자연어 처리를 통해 핵심 개념들을 추출한 후, 상기 핵심 개념들 간의 연관성 정보를 추출하는 단계; 지식 구조 생성부에서 상기 핵심 개념들 간의 연관성 정보를 이용하여 지식 구조를 생성하는 단계; 핵심 개념 탐색부에서 구축된 상기 지식 구조의 핵심 개념을 탐색하는 단계; 질의어 확장부에서 탐색된 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이의 개념을 질의어 셋(set)에 추가하는 단계; 및 상기 구절 검색부에서 확장된 상기 질의어 셋을 활용하여 구절 검색을 재수행하는 단계 를 포함하고, 상기 복수의 문헌으로부터 문단 단위의 구절을 추출하는 단계는, 특정 분야의 상기 복수의 문헌에서 파일 형식을 변환한 후, PDFbox 라이브러리를 이용하여 텍스트 및 이미지 추출하며, OpenNLP 라이브러리를 통해 텍스트 문장 및 문단을 구분하는 텍스트 전처리를 수행함에 따라, 추출된 텍스트로부터 문단을 추출하고 상기 문단을 한 구절로 정의하여 상기 문단 단위의 구절을 추출하며, 상기 핵심 개념들 간의 연관성 정보를 이용하여 지식 구조를 생성하는 단계는, 상기 기설정된 수의 상위 구절들로부터 추출된 상기 핵심 개념들 간의 거리 매트릭스를 구축하고 얻어진 각 거리간의 유사도를 각 열(row)의 수치로 사용하여 연관성 행렬을 생성하는 단계; 및 상기 연관성 행렬을 이용하여 상기 지식 구조를 생성하는 단계를 포함하며, 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이의 개념을 질의어 셋(set)에 추가하는 단계는, 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이에 놓여있는 개념어를 질의어 셋(set)에 추가하되, 질의어 확장 이전에 외부 온톨로지를 활용하여 상기 개념어가 특정 분야의 용어인지 여부를 판단하여 특정 분야의 용어라고 판단되지 않는 경우 질의어 셋(set)에 추가하지 않는 것을 특징으로 하는, 구절 검색 방법
15 15
제14항에 있어서,상기 초기 질의어를 통해 상위에 검색된 복수 개의 관련 구절로부터 통합된 상기 지식 구조를 자동으로 생성하고, 생성된 상기 지식 구조로부터 질의어 확장에 관련된 키워드를 자동으로 추출하는 것을 특징으로 하는, 구절 검색 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 산업통상자원부 한국과학기술원 지식서비스산업핵심기술개발 현장전문가의 경험지식 획득 및 활용을 위한 경험지식플랫폼 개발