1 |
1
연관 규칙 생성 장치가 의료 단어 연관 규칙을 생성하는 방법에 있어서, 복수의 의료 기록 문서에서 추출된 복수의 의료 단어를 이용하여 복수의 트랜잭션을 생성하는 단계;상기 의료 기록 문서의 전체 개수, 특정한 의료 기록 문서에서의 상기 의료 단어 각각의 빈도수 및 상기 의료 단어 각각이 포함된 의료 기록 문서의 개수에 기초하여, 상기 복수의 의료 단어 각각에 대한 중요도 지표를 산출하는 단계;상기 중요도 지표에 기초하여, 상기 복수의 트랜잭션을 재구성하여 빈발 패턴 트리를 생성하는 단계; 및상기 빈발 패턴 트리에 기초하여, 상기 복수의 의료 단어간의 연관 규칙을 생성하는 단계를 포함하되, 상기 중요도 지표는, 특정한 의료 기록 문서에서의 상기 의료 단어 각각의 빈도수를 상기 복수의 의료 기록 문서에 포함된 모든 의료 단어의 개수로 나눗셈하여 산출된 정규화된 빈도수와 IDF(Inverse Document Frequency)를 이용하여 산출된 값이고, 상기 연관 규칙을 생성하는 단계는, 상기 빈발 패턴 트리에 기초하여, 상기 복수의 의료 단어에 해당하는 복수의 노드간의 노드 유사도를 산출하고, 상기 빈발 패턴 트리 및 상기 노드 유사도에 기초하여, 복수의 대응 표준 질병명간의 연관 규칙을 생성하는 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
2 |
2
제1항에 있어서, 상기 복수의 트랜잭션을 생성하는 단계는상기 복수의 의료 기록 문서에 포함된 복수의 단어 중에서 상기 연관 규칙 생성과 무관한 불용어를 제거하여 상기 연관 규칙 생성의 대상이 되는 상기 복수의 의료 단어를 추출하는 단계; 및 상기 복수의 의료 단어를 이용하여 상기 복수의 트랜잭션을 생성하는 단계를 포함하는 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
3 |
3
제2항에 있어서, 상기 복수의 의료 단어를 추출하는 단계는 질병의 증상, 수술명, 진단명, 환자의 상태 및 병력에 대한 단어 중 적어도 하나로 구성되는 의료 단어 DB 또는 복수의 상기 불용어로 구성되는 불용어 DB에 기초하여 수행되는 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
4 |
4
제1항에 있어서, 상기 빈발 패턴 트리를 생성하는 단계는상기 복수의 트랜잭션 각각을 구성하는 상기 복수의 의료 단어의 계층 구조상의 배치를 상기 중요도 지표의 지표 값의 내림 차순에 따라 변경함으로써 상기 복수의 트랜잭션을 재구성하는 단계; 및상기 재구성된 복수의 트랜잭션에 기초하여, 상기 빈발 패턴 트리를 생성하는 단계를 포함하는 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
5 |
5
제4항에 있어서, 상기 복수의 트랜잭션을 재구성하는 단계는상기 복수의 의료 단어에 대한 신뢰도, 지지도 및 향상도 중 적어도 하나에 더 기초하여 수행되는 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
6 |
6
제1항에 있어서, 상기 연관 규칙을 생성하는 단계는상기 빈발 패턴 트리에 기초하여, 상기 복수의 의료 단어에 해당하는 복수의 노드간의 노드 유사도를 산출하는 단계; 표준 질병명간의 관계를 정의하는 의료 온톨로지에 기초하여, 상기 복수의 의료 단어 각각에 대응되는 표준 질병명인 복수의 대응 표준 질병명을 검출하는 단계; 및상기 빈발 패턴 트리 및 상기 노드 유사도에 기초하여, 상기 복수의 대응 표준 질병명간의 연관 규칙을 생성하는 단계를 포함하는 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
7 |
7
제6항에 있어서, 상기 복수의 대응 표준 질병명간의 연관 규칙을 생성하는 단계는상기 복수의 대응 표준 질병명을 대응되는 계층 구조의 복수의 노드로 표시하는 단계; 및상기 복수의 노드 사이에 노드간의 유사도를 나타내는 노드 유사도를 표시하는 단계를 포함하는 것을 특징으로 하는 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
8 |
8
제6항에 있어서, 상기 복수의 대응 표준 질병명간의 연관 규칙을 생성하는 단계는상기 복수의 대응 표준 질병명을 대응되는 계층 구조의 복수의 노드로 표시하는 단계; 및상기 복수의 노드 사이에 노드간의 거리를 표시하는 단계를 포함하고, 상기 노드간의 거리는 상기 복수의 노드 상호간에 공유하는 상위 노드의 개수에 비례하여 결정되는 노드 유사도에 기초하여 결정되는 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
9 |
9
제1항에 있어서, 사용자 단어를 수신하는 단계; 및상기 복수의 의료 단어간의 연관 규칙에 기초하여, 상기 사용자 단어에 해당하는 현재 노드로부터 소정 거리 이내에 위치하는 적어도 하나의 이웃 노드에 대응되는 적어도 하나의 의료 단어를 출력하는 단계를 더 포함하는 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
10 |
10
제1항에 있어서, 상기 중요도 지표는 상기 복수의 의료 단어 각각에 대한 TF-IDF(Term Frequency-Inverse Document Frequency) 값인 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
11 |
11
제10항에 있어서, 상기 중요도 지표는 수학식 1에 의하여 산출되는 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
12 |
12
제1항에 있어서, 상기 특정한 의료 기록 문서에서의 상기 의료 단어 각각의 빈도수는상기 특정한 의료 기록 문서에서의 상기 의료 단어 각각의 빈도수를 상기 복수의 의료 기록 문서에 포함된 모든 의료 단어의 개수를 이용하여 나눗셈함으로써 생성된 정규화된 빈도수인 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
13 |
13
제1항에 있어서, 상기 빈발 패턴 트리를 생성하는 단계는상기 복수의 의료 단어 중에서 상기 중요도 지표 및 지지도 중 적어도 하나가 소정 임계치 이상인 의료 단어만을 이용하여 수행되는 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
14 |
14
제1항에 있어서, 상기 연관 규칙에 포함되는 복수의 의료 단어가 모두 질병의 증상에 대한 의료 단어인 증상 연관 규칙을 검출하는 단계; 및상기 증상 연관 규칙을 삭제하는 단계를 더 포함하는 것을 특징으로 하는 의료 단어 연관 규칙 생성 방법
|
15 |
15
복수의 의료 기록 문서에서 추출된 복수의 의료 단어를 이용하여 복수의 트랜잭션을 생성하는 트랜잭션 생성부;상기 의료 기록 문서의 전체 개수, 특정한 의료 기록 문서에서의 상기 의료 단어 각각의 빈도수 및 상기 의료 단어 각각이 포함된 의료 기록 문서의 개수에 기초하여, 상기 복수의 의료 단어 각각에 대한 중요도 지표를 산출하는 지표 산출부;상기 중요도 지표에 기초하여, 상기 복수의 트랜잭션을 재구성하여 빈발 패턴 트리를 생성하는 트리 생성부; 및상기 빈발 패턴 트리에 기초하여, 상기 복수의 의료 단어간의 연관 규칙을 생성하는 규칙 관리부를 포함하되, 상기 중요도 지표는, 특정한 의료 기록 문서에서의 상기 의료 단어 각각의 빈도수를 상기 복수의 의료 기록 문서에 포함된 모든 의료 단어의 개수로 나눗셈하여 산출된 정규화된 빈도수와 IDF(Inverse Document Frequency)를 이용하여 산출된 값이고, 상기 규칙 관리부는, 상기 빈발 패턴 트리에 기초하여, 상기 복수의 의료 단어에 해당하는 복수의 노드간의 노드 유사도를 산출하고, 상기 빈발 패턴 트리 및 상기 노드 유사도에 기초하여, 복수의 대응 표준 질병명간의 연관 규칙을 생성하는 것을 특징으로 하는 의료 단어 연관 규칙 생성 장치
|