1 |
1
선별된 오탈자와 전-훈련 임배딩 매트릭스 및 특화 임배딩 매트릭스에서 생성된 교정 후보군의 유사도를 분석하는 유사도 분석부; 및상기 유사도 분석 결과에 따라 오탈자로 판단된 데이터를 수정하는 데이터 수정부; 를 포함하는 것을 특징으로 하는,의학용어 오탈자 수정 장치
|
2 |
2
제 1 항에 있어서, 분석할 데이터를 메모리에 저장하는 데이터 도입부; 상기 저장된 데이터를 분석 단위로 분할하고, 전처리하여 필터링하는 전처리 필터부; 및상기 필터링된 데이터가 오탈자인지 선별하는 오탈자 선별부; 를 더 포함하고, 상기 전-훈련 임배딩 매트릭스는 상기 선별된 데이터 중에서 교정 단어 1차 후보군을 생성하고, 상기 특화 임배딩 매트릭스는 의료 기관에서 보관하고 있는 문서를 이용하여 임배딩 매트릭스를 구성하고, 교정 단어 2차 후보군 생성하며, 상기 유사도 분석부는 선별된 오탈자와 상기 생성된 교정 단어 1차 및 2차 후보군의 유사도를 분석하여 순위를 정하고 최종 후보군을 제시하는 것을 특징으로 하는,의학용어 오탈자 수정 장치
|
3 |
3
제 2 항에 있어서, 상기 제시된 최종 후보군 데이터의 오탈자를 재검사하는 오탈자 재검부; 및상기 오탈자 선별부 및 상기 오탈자 재검부에서 오탈자로 선별되지 않은 데이터를 그대로 출력하거나, 상기 수정된 데이터를 출력하는 상기 데이터 출력부; 를 더 포함하고, 상기 데이터 수정부는 상기 재검사 결과 오탈자로 판단된 데이터를 수정하는 것을 특징으로 하는,의학용어 오탈자 수정 장치
|
4 |
4
제 2 항에 있어서, 상기 저장된 데이터는 단말기 또는 데이터베이스에 입력되어 있는 데이터인 것을 특징으로 하는,의학용어 오탈자 수정 장치
|
5 |
5
제 1 항에 있어서, 상기 전-훈련 임배딩 매트릭스는사전에 훈련된 단어 라이브러리인 것을 특징으로 하는,의학용어 오탈자 수정 장치
|
6 |
6
제 1 항에 있어서, 상기 전-훈련 임배딩 매트릭스는BioWordVec, Sub-word pre-trained model을 포함하는 것을 특징으로 하는,의학용어 오탈자 수정 장치
|
7 |
7
제 1 항에 있어서, 상기 특화 임배딩 매트릭스는 fastText 기법을 이용하여 임배딩 매트릭스를 구성하는 것을 특징으로 하는,의학용어 오탈자 수정 장치
|
8 |
8
유사도 분석부가 선별된 오탈자와 전-훈련 임배딩 매트릭스 및 특화 임배딩 매트릭스에서 생성된 교정 후보군의 유사도를 분석하는 단계; 및데이터 수정부가 상기 유사도 분석 결과에 따라 오탈자로 판단된 데이터를 수정하는 단계; 를 포함하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
|
9 |
9
제 8 항에 있어서, (a) 데이터 도입부가 분석할 데이터를 메모리에 저장하는 단계; (b) 전처리 필터부가 상기 저장된 데이터를 분석 단위로 분할하고, 전처리하여 필터링하는 단계; (c) 오탈자 선별부가 상기 필터링된 데이터가 오탈자인지 선별하는 단계; (d) 상기 전-훈련 임배딩 매트릭스가 상기 선별된 데이터 중에서 교정 단어 1차 후보군을 생성하는 단계; (e) 상기 특화 임배딩 매트릭스가 의료 기관에서 보관하고 있는 문서를 이용하여 임배딩 매트릭스를 구성하고, 교정 단어 2차 후보군을 생성하는 단계;(f) 상기 유사도 분석부가 선별된 오탈자와 상기 생성된 교정 단어 1차 및 2차 후보군의 유사도를 분석하여 순위를 정하고 최종 후보군을 제시하는 단계; (g) 오탈자 재검부가 상기 제시된 최종 후보군 데이터의 오탈자를 재검사하는 단계; 및(h) 상기 데이터 수정부가 상기 재검사 결과 오탈자로 판단된 데이터를 수정하는 단계; 를 포함하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
|
10 |
10
제 9 항에 있어서, 상기 (h) 단계 이후에, 데이터 출력부가 상기 오탈자 선별부 및 상기 오탈자 재검부에서 오탈자로 선별되지 않은 데이터를 그대로 출력하거나, 상기 수정된 데이터를 출력하는 단계; 를 더 포함하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
|
11 |
11
제 9 항에 있어서, 상기 전처리는형식 정리 및 불용어 전처리를 포함하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
|
12 |
12
제 10 항에 있어서, 상기 (c) 단계에서,상기 오탈자인지 선별은입력된 데이터의 단어가 표준 용어 라이브러리에 존재하는지 여부를 소정의 규칙 기반으로 판단하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
|
13 |
13
제 12 항에 있어서, 상기 표준 용어 라이브러리는 SNOMED Clinical Terms 임상의학 문서 및 보고서에 사용되는 의학 용어 집합을 사용하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
|
14 |
14
제 12 항에 있어서, 상기 소정의 규칙은 오탈자로 분류되는 경우 후속의 알고리즘을 따르고, 오탈자로 분류되지 않는 경우 상기 저장된 데이터를 상기 데이터 출력부를 통해 그대로 출력하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
|
15 |
15
제 8 항에 있어서, 상기 유사도는 편집 거리, 빈도 및 Character level N-gram을 적용하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
|