1 |
1
장치에 의해 수행되는 방법에 있어서,(a) 원격 진료 대화에 상응하는 음성 데이터를 텍스트 데이터로 변환하여 의료 텍스트를 생성하는 단계;(b) 상기 의료 텍스트를 하나의 문장마다 단어별로 임베딩하는 단계;(c) 상기 임베딩된 단어들을 군집화하여 노이즈 단어 데이터를 식별하고, 상기 식별된 노이즈 단어 데이터를 노이즈 사전에 저장하는 단계;(d) 상기 노이즈 사전에 저장된 노이즈 단어 데이터를 기반으로 노이즈 필터를 생성하는 단계;(e) 상기 원격 진료 대화에 상응하는 새로운 의료 텍스트가 생성되는지를 확인하는 단계; 및(f) 상기 새로운 의료 텍스트가 생성되면 상기 노이즈 필터를 통해 상기 새로운 의료 텍스트를 필터링하여 노이즈 단어 데이터가 제거된 의료 텍스트로 재구성하는 단계를 포함하고,상기 (c) 단계는,상기 임베딩된 단어들의 위치 정보를 기반으로 k-평균 클러스터링(k-means clustering) 알고리즘을 통해 단어들을 군집화하여 다수의 클러스터들을 생성하고, 상기 생성된 클러스터들에 속하지 않는 단어 데이터가 존재하면 해당 단어 데이터를 노이즈 단어 데이터로 간주하고,상기 단어들을 군집화하여 다수의 클러스터들이 생성되면 상기 다수의 클러스터들을 진료 특징을 기반으로 재분류하고, 상기 재분류된 클러스터들로부터 노이즈 단어 데이터를 재식별하며, 상기 재식별된 노이즈 단어 데이터를 상기 노이즈 사전에 저장하는 것을 특징으로 하는 의료 텍스트의 노이즈 데이터 필터링 방법
|
2 |
2
삭제
|
3 |
3
제1 항에 있어서,상기 (c) 단계는,상기 생성된 클러스터들 중 최소의 단어 수인 k개 미만의 단어로 구성된 클러스터가 존재하면 해당 클러스터에 포함되는 단어들을 노이즈 단어 데이터로 간주하는 것을 특징으로 하는 의료 텍스트의 노이즈 데이터 필터링 방법
|
4 |
4
삭제
|
5 |
5
제1 항에 있어서,상기 (d) 단계는,상기 노이즈 사전에 저장된 일반 정보 기반 노이즈 단어 데이터로부터 일반 노이즈 필터를 생성하고, 상기 노이즈 사전에 저장된 상기 재식별된 노이즈 단어 데이터로부터 진료 특징 기반 노이즈 필터를 생성하는 것을 특징으로 하는 의료 텍스트의 노이즈 데이터 필터링 방법
|
6 |
6
제5 항에 있어서,상기 (d) 단계는,상기 진료 특징 기반 노이즈 필터를 생성할 때, 처방 정보 기반 노이즈 필터와 환자 정보 기반 노이즈 필터를 포함하는 상기 진료 특징 기반 노이즈 필터를 생성하는 것을 특징으로 하는 의료 텍스트의 노이즈 데이터 필터링 방법
|
7 |
7
제1 항에 있어서,상기 (f) 단계는,상기 새로운 의료 텍스트가 생성되면 상기 새로운 의료 텍스트의 각 문장에 상응하는 노이즈 필터를 기반으로 상기 새로운 의료 텍스트의 각 문장에 포함되는 노이즈 단어 데이터를 제거함으로써, 상기 새로운 의료 텍스트를 상기 노이즈 단어 데이터가 제거된 의료 텍스트로 재구성하는 것을 특징으로 하는 의료 텍스트의 노이즈 데이터 필터링 방법
|
8 |
8
제7 항에 있어서,상기 (f) 단계는,상기 새로운 의료 텍스트의 문장이 일반 정보 관련 문장이면 일반 노이즈 필터를 기반으로 상기 새로운 의료 텍스트의 일반 정보 관련 문장에 포함되는 노이즈 단어 데이터를 제거하고, 상기 새로운 의료 텍스트의 문장이 진료 특징 관련 문장이면 진료 특징 기반 노이즈 필터를 기반으로 상기 새로운 의료 텍스트의 진료 특징 문장에 포함되는 노이즈 단어 데이터를 제거하는 것을 특징으로 하는 의료 텍스트의 노이즈 데이터 필터링 방법
|
9 |
9
하드웨어인 컴퓨터와 결합되어, 제1 항, 제3 항, 제5 항 내지 제8 항 중 어느 한 항의 의료 텍스트의 노이즈 데이터 필터링 방법을 수행시키기 위해 매체에 저장된, 의료 텍스트의 노이즈 데이터 필터링 장치의 의료 텍스트의 노이즈 데이터 필터링 방법을 제공하는 컴퓨터 프로그램
|
10 |
10
의료 텍스트의 노이즈 데이터 필터링 방법을 제공하기 위한 컴퓨팅 장치로서,하나 이상의 코어를 포함하는 프로세서; 및메모리;를 포함하고,상기 프로세서는,원격 진료 대화에 상응하는 음성 데이터를 텍스트 데이터로 변환하여 의료 텍스트를 생성하고,상기 의료 텍스트를 하나의 문장마다 단어별로 임베딩하며,상기 임베딩된 단어들을 군집화하여 노이즈 단어 데이터를 식별하여 상기 식별된 노이즈 단어 데이터를 노이즈 사전에 저장하고,상기 노이즈 사전에 저장된 노이즈 단어 데이터를 기반으로 노이즈 필터를 생성하며,상기 원격 진료 대화에 상응하는 새로운 의료 텍스트가 생성되는지를 확인하고, 및상기 새로운 의료 텍스트가 생성되면 상기 노이즈 필터를 통해 상기 새로운 의료 텍스트를 필터링하여 노이즈 단어 데이터가 제거된 의료 텍스트로 재구성하고,상기 프로세서는 상기 식별된 노이즈 단어 데이터를 노이즈 사전에 저장 시,상기 임베딩된 단어들의 위치 정보를 기반으로 k-평균 클러스터링(k-means clustering) 알고리즘을 통해 단어들을 군집화하여 다수의 클러스터들을 생성하고, 상기 생성된 클러스터들에 속하지 않는 단어 데이터가 존재하면 해당 단어 데이터를 노이즈 단어 데이터로 간주하고,상기 단어들을 군집화하여 다수의 클러스터들이 생성되면 상기 다수의 클러스터들을 진료 특징을 기반으로 재분류하고, 상기 재분류된 클러스터들로부터 노이즈 단어 데이터를 재식별하며, 상기 재식별된 노이즈 단어 데이터를 상기 노이즈 사전에 저장하는 것을 특징으로 하는 컴퓨팅 장치
|