맞춤기술찾기

이전대상기술

의학용어 오탈자 수정 장치 및 방법

  • 기술번호 : KST2022009563
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 의학용어 오탈자 수정 장치 및 방법을 공개한다. 이 장치는 선별된 오탈자와 전-훈련 임배딩 매트릭스 및 특화 임배딩 매트릭스에서 생성된 교정 후보군의 유사도를 분석하는 유사도 분석부; 및 상기 유사도 분석 결과에 따라 오탈자로 판단된 데이터를 수정하는 데이터 수정부;를 포함하는 것을 특징으로 한다. 본 발명에 의할 경우, 의학 분야 및 의료업계에서 작성되는 법적 효력이 있는 문서에 있는 비정형 텍스트 데이터를 두 가지 이상의 단어 임베딩 매트릭스를 적용하여 정제함으로써, 의료기관별로 사용되는 단어가 상이한 한계를 극복할 수 있게 된다. 또한, 현재 생성되는 오탈자뿐 아니라 앞으로 발생할 수 있는 오탈자에 대하여도 일관성 있게 수정할 수 있게 된다.
Int. CL G06F 40/232 (2020.01.01) G06F 16/215 (2019.01.01) G06F 16/2458 (2019.01.01) G16H 15/00 (2018.01.01) G06N 20/00 (2019.01.01)
CPC
출원번호/일자 1020220000911 (2022.01.04)
출원인 고려대학교 산학협력단
등록번호/일자
공개번호/일자 10-2022-0098696 (2022.07.12) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020210000424   |   2021.01.04
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.01.04)
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 대한민국 서울특별시 성북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 주형준 서울특별시 강남구
2 한성원 서울특별시 강남구
3 손장욱 서울특별시 강남구
4 김태형 경기도 성남시 분당구
5 김종호 서울특별시 성북구
6 박수완 경기도 안산시 단원구
7 장준호 서울특별시 관악구
8 이정문 경기도 군포시 송부로**번길 **, *
9 강민지 서울특별시 중랑구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인태백 대한민국 서울 금천구 가산디지털*로 *** 이노플렉스 *차 ***호

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.01.04 수리 (Accepted) 1-1-2022-0008286-79
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
선별된 오탈자와 전-훈련 임배딩 매트릭스 및 특화 임배딩 매트릭스에서 생성된 교정 후보군의 유사도를 분석하는 유사도 분석부; 및상기 유사도 분석 결과에 따라 오탈자로 판단된 데이터를 수정하는 데이터 수정부; 를 포함하는 것을 특징으로 하는,의학용어 오탈자 수정 장치
2 2
제 1 항에 있어서, 분석할 데이터를 메모리에 저장하는 데이터 도입부; 상기 저장된 데이터를 분석 단위로 분할하고, 전처리하여 필터링하는 전처리 필터부; 및상기 필터링된 데이터가 오탈자인지 선별하는 오탈자 선별부; 를 더 포함하고, 상기 전-훈련 임배딩 매트릭스는 상기 선별된 데이터 중에서 교정 단어 1차 후보군을 생성하고, 상기 특화 임배딩 매트릭스는 의료 기관에서 보관하고 있는 문서를 이용하여 임배딩 매트릭스를 구성하고, 교정 단어 2차 후보군 생성하며, 상기 유사도 분석부는 선별된 오탈자와 상기 생성된 교정 단어 1차 및 2차 후보군의 유사도를 분석하여 순위를 정하고 최종 후보군을 제시하는 것을 특징으로 하는,의학용어 오탈자 수정 장치
3 3
제 2 항에 있어서, 상기 제시된 최종 후보군 데이터의 오탈자를 재검사하는 오탈자 재검부; 및상기 오탈자 선별부 및 상기 오탈자 재검부에서 오탈자로 선별되지 않은 데이터를 그대로 출력하거나, 상기 수정된 데이터를 출력하는 상기 데이터 출력부; 를 더 포함하고, 상기 데이터 수정부는 상기 재검사 결과 오탈자로 판단된 데이터를 수정하는 것을 특징으로 하는,의학용어 오탈자 수정 장치
4 4
제 2 항에 있어서, 상기 저장된 데이터는 단말기 또는 데이터베이스에 입력되어 있는 데이터인 것을 특징으로 하는,의학용어 오탈자 수정 장치
5 5
제 1 항에 있어서, 상기 전-훈련 임배딩 매트릭스는사전에 훈련된 단어 라이브러리인 것을 특징으로 하는,의학용어 오탈자 수정 장치
6 6
제 1 항에 있어서, 상기 전-훈련 임배딩 매트릭스는BioWordVec, Sub-word pre-trained model을 포함하는 것을 특징으로 하는,의학용어 오탈자 수정 장치
7 7
제 1 항에 있어서, 상기 특화 임배딩 매트릭스는 fastText 기법을 이용하여 임배딩 매트릭스를 구성하는 것을 특징으로 하는,의학용어 오탈자 수정 장치
8 8
유사도 분석부가 선별된 오탈자와 전-훈련 임배딩 매트릭스 및 특화 임배딩 매트릭스에서 생성된 교정 후보군의 유사도를 분석하는 단계; 및데이터 수정부가 상기 유사도 분석 결과에 따라 오탈자로 판단된 데이터를 수정하는 단계; 를 포함하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
9 9
제 8 항에 있어서, (a) 데이터 도입부가 분석할 데이터를 메모리에 저장하는 단계; (b) 전처리 필터부가 상기 저장된 데이터를 분석 단위로 분할하고, 전처리하여 필터링하는 단계; (c) 오탈자 선별부가 상기 필터링된 데이터가 오탈자인지 선별하는 단계; (d) 상기 전-훈련 임배딩 매트릭스가 상기 선별된 데이터 중에서 교정 단어 1차 후보군을 생성하는 단계; (e) 상기 특화 임배딩 매트릭스가 의료 기관에서 보관하고 있는 문서를 이용하여 임배딩 매트릭스를 구성하고, 교정 단어 2차 후보군을 생성하는 단계;(f) 상기 유사도 분석부가 선별된 오탈자와 상기 생성된 교정 단어 1차 및 2차 후보군의 유사도를 분석하여 순위를 정하고 최종 후보군을 제시하는 단계; (g) 오탈자 재검부가 상기 제시된 최종 후보군 데이터의 오탈자를 재검사하는 단계; 및(h) 상기 데이터 수정부가 상기 재검사 결과 오탈자로 판단된 데이터를 수정하는 단계; 를 포함하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
10 10
제 9 항에 있어서, 상기 (h) 단계 이후에, 데이터 출력부가 상기 오탈자 선별부 및 상기 오탈자 재검부에서 오탈자로 선별되지 않은 데이터를 그대로 출력하거나, 상기 수정된 데이터를 출력하는 단계; 를 더 포함하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
11 11
제 9 항에 있어서, 상기 전처리는형식 정리 및 불용어 전처리를 포함하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
12 12
제 10 항에 있어서, 상기 (c) 단계에서,상기 오탈자인지 선별은입력된 데이터의 단어가 표준 용어 라이브러리에 존재하는지 여부를 소정의 규칙 기반으로 판단하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
13 13
제 12 항에 있어서, 상기 표준 용어 라이브러리는 SNOMED Clinical Terms 임상의학 문서 및 보고서에 사용되는 의학 용어 집합을 사용하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
14 14
제 12 항에 있어서, 상기 소정의 규칙은 오탈자로 분류되는 경우 후속의 알고리즘을 따르고, 오탈자로 분류되지 않는 경우 상기 저장된 데이터를 상기 데이터 출력부를 통해 그대로 출력하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
15 15
제 8 항에 있어서, 상기 유사도는 편집 거리, 빈도 및 Character level N-gram을 적용하는 것을 특징으로 하는,의학용어 오탈자 수정 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 보건복지부 고려대학교 안암병원 CDM기반정밀의료데이터통합플랫폼기술개발(R&D) 감염성질환 데이터의 CDM 확장모델 개발 및 적용
2 산업통상자원부 고려대학교의료원 CDM기반정밀의료데이터통합플랫폼기술개발(R&D) CDM 기반 알고리즘 진료 프로토콜 서비스 시스템 개발과 확산