1 |
1
구절 추출부에서 의료 문헌으로부터 문단 단위의 구절을 추출하는 단계; 구절 검색부에서 추출된 상기 구절을 인덱싱하며 입력되는 초기 질의어와 적합한 구절을 검색하여, 초기 구절 검색 결과를 획득하는 단계; 연관성 정보 추출부에서 상기 초기 구절 검색 결과에서 기설정된 수의 상위 구절들을 자연어 처리를 통해 핵심 개념들을 추출한 후, 상기 핵심 개념들 간의 연관성 정보를 추출하는 단계; 지식 구조 생성부에서 상기 핵심 개념들 간의 연관성 정보를 이용하여 지식 구조를 생성하는 단계; 핵심 개념 탐색부에서 구축된 상기 지식 구조의 핵심 개념을 탐색하는 단계; 질의어 확장부에서 탐색된 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이의 개념을 질의어 셋(set)에 추가하는 단계; 및 상기 구절 검색부에서 확장된 상기 질의어 셋을 활용하여 의료 구절 검색을 재수행하는 단계 를 포함하고, 상기 의료 문헌으로부터 문단 단위의 구절을 추출하는 단계는, 복수의 의료 문헌에서 파일 형식을 변환한 후, PDFbox 라이브러리를 이용하여 텍스트 및 이미지 추출하며, OpenNLP 라이브러리를 통해 텍스트 문장 및 문단을 구분하는 텍스트 전처리를 수행함에 따라, 추출된 텍스트로부터 문단을 추출하고 상기 문단을 한 구절로 정의하여 상기 문단 단위의 구절을 추출하며, 상기 핵심 개념들 간의 연관성 정보를 이용하여 지식 구조를 생성하는 단계는, 상기 기설정된 수의 상위 구절들로부터 추출된 상기 핵심 개념들 간의 거리 매트릭스를 구축하고 얻어진 각 거리간의 유사도를 각 열(row)의 수치로 사용하여 연관성 행렬을 생성하는 단계; 및 상기 연관성 행렬을 이용하여 상기 지식 구조를 생성하는 단계를 포함하며, 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이의 개념을 질의어 셋(set)에 추가하는 단계는, 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이에 놓여있는 개념어를 질의어 셋(set)에 추가하되, 질의어 확장 이전에 외부 온톨로지를 활용하여 상기 개념어가 UMLS 코드를 가지고 있는 의학 용어인지 여부를 판단하여 의학 용어라고 판단되지 않는 경우 질의어 셋(set)에 추가하지 않는 것을 특징으로 하는, 의료 문헌 구절 검색 방법
|
2 |
2
제1항에 있어서,상기 초기 구절 검색 결과를 획득하는 단계는, 사용자가 입력한 초기 질의어와 적합한 구절들을 TF-IDF, BM25, LM 기법을 통해 검색 후, 종합하여 검색 결과를 획득하는 것을 특징으로 하는, 의료 문헌 구절 검색 방법
|
3 |
3
제1항에 있어서,상기 핵심 개념들 간의 연관성 정보를 추출하는 단계는, 상기 초기 구절 검색 결과에서 기설정된 수의 상위 구절들을 자연어 처리를 통해 핵심 개념들을 추출하는 단계; 및 추출된 상기 핵심 개념들을 이용하여 딥러닝 기반의 Word2Vec 알고리즘을 수행하여 각 핵심 개념들을 벡터로 변환하는 임베딩 작업을 수행하는 단계를 포함하는, 의료 문헌 구절 검색 방법
|
4 |
4
삭제
|
5 |
5
제1항에 있어서,상기 지식 구조의 핵심 개념을 탐색하는 단계는, 페이지랭크(PageRank) 알고리즘을 활용하여 상기 지식 구조에서 가장 핵심적인 키워드를 탐색하는 것을 특징으로 하는, 의료 문헌 구절 검색 방법
|
6 |
6
삭제
|
7 |
7
제1항에 있어서,상기 초기 질의어를 통해 상위에 검색된 복수 개의 의료 관련 구절로부터 통합된 상기 지식 구조를 자동으로 생성하고, 생성된 상기 지식 구조로부터 질의어 확장에 관련된 키워드를 자동으로 추출하는 것을 특징으로 하는, 의료 문헌 구절 검색 방법
|
8 |
8
의료 문헌으로부터 문단 단위의 구절을 추출하는 구절 추출부; 추출된 상기 구절을 인덱싱하며 입력되는 초기 질의어와 적합한 구절을 검색하여, 초기 구절 검색 결과를 획득하는 구절 검색부; 상기 초기 구절 검색 결과에서 기설정된 수의 상위 구절들을 자연어 처리를 통해 핵심 개념들을 추출한 후, 상기 핵심 개념들 간의 연관성 정보를 추출하는 연관성 정보 추출부; 상기 핵심 개념들 간의 연관성 정보를 이용하여 지식 구조를 생성하는 지식 구조 생성부; 구축된 상기 지식 구조의 핵심 개념을 탐색하는 핵심 개념 탐색부; 및 탐색된 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이의 개념을 질의어 셋(set)에 추가하는 질의어 확장부를 포함하고, 확장된 상기 질의어 셋을 활용하여 의료 구절 검색을 재수행하며, 상기 구절 추출부는, 복수의 의료 문헌에서 파일 형식을 변환한 후, PDFbox 라이브러리를 이용하여 텍스트 및 이미지 추출하며, OpenNLP 라이브러리를 통해 텍스트 문장 및 문단을 구분하는 텍스트 전처리를 수행함에 따라, 추출된 텍스트로부터 문단을 추출하고 상기 문단을 한 구절로 정의하여 상기 문단 단위의 구절을 추출하며, 상기 지식 구조 생성부는, 상기 기설정된 수의 상위 구절들로부터 추출된 상기 핵심 개념들 간의 거리 매트릭스를 구축하고 얻어진 각 거리간의 유사도를 각 열(row)의 수치로 사용하여 연관성 행렬을 생성하고, 상기 연관성 행렬을 이용하여 상기 지식 구조를 생성하며, 상기 질의어 확장부는, 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이에 놓여있는 개념어를 질의어 셋(set)에 추가하되, 질의어 확장 이전에 외부 온톨로지를 활용하여 상기 개념어가 UMLS 코드를 가지고 있는 의학 용어인지 여부를 판단하여 의학 용어라고 판단되지 않는 경우 질의어 셋(set)에 추가하지 않는 것을 특징으로 하는, 의료 문헌 구절 검색 시스템
|
9 |
9
제8항에 있어서,상기 구절 검색부는, 사용자가 입력한 초기 질의어와 적합한 구절들을 TF-IDF, BM25, LM 기법을 통해 검색 후, 종합하여 검색 결과를 획득하는 것을 특징으로 하는, 의료 문헌 구절 검색 시스템
|
10 |
10
제8항에 있어서,상기 연관성 정보 추출부는, 상기 초기 구절 검색 결과에서 기설정된 수의 상위 구절들을 자연어 처리를 통해 핵심 개념들을 추출한 후, 딥러닝 기반의 Word2Vec 알고리즘을 수행하여 각 핵심 개념들을 벡터로 변환하는 임베딩 작업을 수행하는 것을 특징으로 하는, 의료 문헌 구절 검색 시스템
|
11 |
11
제8항에 있어서,상기 핵심 개념 탐색부는, 페이지랭크(PageRank) 알고리즘을 활용하여 상기 지식 구조에서 가장 핵심적인 키워드를 탐색하는 것을 특징으로 하는, 의료 문헌 구절 검색 시스템
|
12 |
12
삭제
|
13 |
13
제8항에 있어서,상기 초기 질의어를 통해 상위에 검색된 복수 개의 의료 관련 구절로부터 통합된 상기 지식 구조를 자동으로 생성하고, 생성된 상기 지식 구조로부터 질의어 확장에 관련된 키워드를 자동으로 추출하는 것을 특징으로 하는, 의료 문헌 구절 검색 시스템
|
14 |
14
구절 추출부에서 복수의 문헌으로부터 문단 단위의 구절을 추출하는 단계; 구절 검색부에서 추출된 상기 구절을 인덱싱하며 입력되는 초기 질의어와 적합한 구절을 검색하여, 초기 구절 검색 결과를 획득하는 단계; 연관성 정보 추출부에서 상기 초기 구절 검색 결과에서 기설정된 수의 상위 구절들을 자연어 처리를 통해 핵심 개념들을 추출한 후, 상기 핵심 개념들 간의 연관성 정보를 추출하는 단계; 지식 구조 생성부에서 상기 핵심 개념들 간의 연관성 정보를 이용하여 지식 구조를 생성하는 단계; 핵심 개념 탐색부에서 구축된 상기 지식 구조의 핵심 개념을 탐색하는 단계; 질의어 확장부에서 탐색된 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이의 개념을 질의어 셋(set)에 추가하는 단계; 및 상기 구절 검색부에서 확장된 상기 질의어 셋을 활용하여 구절 검색을 재수행하는 단계 를 포함하고, 상기 복수의 문헌으로부터 문단 단위의 구절을 추출하는 단계는, 특정 분야의 상기 복수의 문헌에서 파일 형식을 변환한 후, PDFbox 라이브러리를 이용하여 텍스트 및 이미지 추출하며, OpenNLP 라이브러리를 통해 텍스트 문장 및 문단을 구분하는 텍스트 전처리를 수행함에 따라, 추출된 텍스트로부터 문단을 추출하고 상기 문단을 한 구절로 정의하여 상기 문단 단위의 구절을 추출하며, 상기 핵심 개념들 간의 연관성 정보를 이용하여 지식 구조를 생성하는 단계는, 상기 기설정된 수의 상위 구절들로부터 추출된 상기 핵심 개념들 간의 거리 매트릭스를 구축하고 얻어진 각 거리간의 유사도를 각 열(row)의 수치로 사용하여 연관성 행렬을 생성하는 단계; 및 상기 연관성 행렬을 이용하여 상기 지식 구조를 생성하는 단계를 포함하며, 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이의 개념을 질의어 셋(set)에 추가하는 단계는, 상기 지식 구조 내 핵심 개념과 상기 초기 질의어 사이에 놓여있는 개념어를 질의어 셋(set)에 추가하되, 질의어 확장 이전에 외부 온톨로지를 활용하여 상기 개념어가 특정 분야의 용어인지 여부를 판단하여 특정 분야의 용어라고 판단되지 않는 경우 질의어 셋(set)에 추가하지 않는 것을 특징으로 하는, 구절 검색 방법
|
15 |
15
제14항에 있어서,상기 초기 질의어를 통해 상위에 검색된 복수 개의 관련 구절로부터 통합된 상기 지식 구조를 자동으로 생성하고, 생성된 상기 지식 구조로부터 질의어 확장에 관련된 키워드를 자동으로 추출하는 것을 특징으로 하는, 구절 검색 방법
|