맞춤기술찾기

이전대상기술

앙상블 분류모델을 이용한 검진데이터 분류장치 및 분류방법

  • 기술번호 : KST2022013374
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 복수의 소견 기반의 검진데이터 분류 방법을 제공하고, 상기 방법은, 검진데이터를 수신하는 단계; 상기 검진데이터를 전처리하는 단계; 전처리된 검진데이터에 기초하여 앙상블 분류모델을 생성하는 단계; 및 학습된 상기 앙상블 분류모델을 이용하여 상기 검진데이터의 분류결과를 획득하는 단계를 포함한다. 또한, 상기 생성하는 단계는, 상기 전처리된 검진데이터에 대한 고정 임베딩(Static Embedding) 및 문맥화 임베딩(Contextualized Embedding)을 수행하고, 상기 고정 임베딩 및 문맥화 임베딩이 수행된 결과 데이터를 기반으로 상기 앙상블 분류모델을 생성한다.
Int. CL G06N 20/20 (2019.01.01) G06F 16/332 (2019.01.01) G06F 16/338 (2019.01.01) G16H 10/60 (2018.01.01) G16H 50/70 (2018.01.01)
CPC G06N 20/20(2013.01) G06F 16/332(2013.01) G06F 16/338(2013.01) G16H 10/60(2013.01) G16H 50/70(2013.01)
출원번호/일자 1020210003764 (2021.01.12)
출원인 주식회사 에임메드, 연세대학교 산학협력단
등록번호/일자
공개번호/일자 10-2022-0101822 (2022.07.19) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.01.12)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 주식회사 에임메드 대한민국 서울특별시 강남구
2 연세대학교 산학협력단 대한민국 서울특별시 서대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 임진환 서울시 강남구
2 김하영 서울시 서대문구
3 신동엽 서울시 서대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인비엘티 대한민국 서울특별시 강남구 테헤란로*길**, *층(역삼동, 청원빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.01.12 수리 (Accepted) 1-1-2021-0037287-59
2 선행기술조사의뢰서
Request for Prior Art Search
2022.04.15 수리 (Accepted) 9-1-9999-9999999-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
장치에 의해 수행되는, 복수의 소견 기반의 검진데이터 분류 방법에 있어서, 검진데이터를 수신하는 단계;상기 검진데이터를 전처리하는 단계; 전처리된 검진데이터에 기초하여 앙상블 분류모델을 생성하는 단계; 및 학습된 상기 앙상블 분류모델을 이용하여 상기 검진데이터의 분류결과를 획득하는 단계를 포함하고, 상기 생성하는 단계는, 상기 전처리된 검진데이터에 대한 고정 임베딩(Static Embedding) 및 문맥화 임베딩(Contextualized Embedding)을 수행하고, 상기 고정 임베딩 및 문맥화 임베딩이 수행된 결과 데이터를 기반으로 상기 앙상블 분류모델을 생성하는 것인, 방법
2 2
제1항에 있어서,상기 생성하는 단계는,고정 임베딩된 데이터에 기초한 학습을 통해 적어도 하나의 제1 분류모델을 생성하는 단계; 문맥화 임베딩된 데이터에 기초한 학습을 통해 적어도 하나의 제2 분류모델을 생성하는 단계; 및 상기 적어도 하나의 제1 분류모델 및 상기 적어도 하나의 제2 분류모델에 기초하여 상기 앙상블 분류모델을 생성하는 단계를 포함하는, 방법
3 3
제2항에 있어서,상기 적어도 하나의 제2 분류모델을 생성하는 단계는, 기 획득된 코퍼스셋을 이용한 학습을 통해 초기 가중치를 획득하는 단계; 및 문맥화 임베딩된 데이터에 기초한 학습을 통해 상기 초기 가중치를 미세조정(fine-tuning)하여 상기 적어도 하나의 제2 분류모델을 생성하는 단계를 포함하는,방법
4 4
제3항에 있어서, 상기 수신된 검진데이터는, 토크나이징(tokenizing)을 통해 산출되는 토큰(token)의 최대 및 평균 중 적어도 하나의 개수가 기 설정된 기준 개수보다 큰 텍스트데이터를 포함하고,상기 기준 개수는 상기 기 획득된 코퍼스셋에 포함된 코퍼스의 토큰의 최대 개수에 대응되는,방법
5 5
제4항에 있어서,상기 검진데이터는, 복수의 진단명 각각에 대해 산출되며, 상기 전처리하는 단계는,상기 텍스트데이터에서 상기 복수의 진단명 각각에 대응되는 키워드를 검색하는 단계; 상기 검색된 키워드를 포함하고, 토큰의 개수가 상기 기준 개수 이하인 문장을 추출하는 단계; 및상기 추출된 문장에 기초하여 전처리를 수행하는 단계를 포함하는, 방법
6 6
제3항에 있어서, 상기 검진데이터는 개별소견 텍스트, 수치 검사 결과 및 종합소견 텍스트를 포함하고, 상기 검진데이터는, 복수의 진단명 각각에 대해 산출되고, 상기 수치 검사 결과는 상기 복수의 진단명 각각과 대응되어 기 설정된 정형화된 데이터이고,상기 종합소견 텍스트는, 토크나이징(tokenizing)을 통해 산출되는 토큰(token)의 최대 및 평균 중 적어도 하나의 개수가 기준 개수보다 크며,상기 기준 개수는, 상기 기 획득된 코퍼스셋에 포함된 코퍼스의 토큰의 최대 개수에 대응되는, 방법
7 7
제1항에 있어서,상기 전처리하는 단계는, 상기 검진데이터에서 기 설정된 기준 특수문자를 제외한 나머지 특수문자를 삭제하는 단계; 기 설정된 기준 문법에 기초하여 상기 특수문자가 삭제된 검진데이터의 띄어 쓰기 규칙을 균일화하는 단계; 상기 균일화된 검진데이터를 수치화하는 단계; 및상기 수치화된 데이터를 패딩(padding)하는 단계를 포함하고, 상기 수치화하는 단계는, 상기 균일화된 검진데이터를 토크나이징(tokenizing)하는 단계; 토크나이징을 통해 생성된 토큰(token)의 개수를 카운팅하는 단계; 및상기 토큰의 개수에 기초하여 상기 균일화된 검진데이터를 수치화하는 단계를 포함하는,방법
8 8
제7항에 있어서,상기 검진데이터는, 각각이 상기 복수의 소견 각각에 대응되는 복수의 그룹으로 분류되고, 상기 수치화하는 단계는, 상기 복수의 그룹 중 데이터의 양이 가장 작은 최소그룹의 데이터의 양을 증식시키는 단계를 더 포함하며,상기 증식시키는 단계는, 상기 최소그룹에 포함된 데이터를 문장 단위로 분할하여 복수의 문장을 생성하는 단계; 및상기 복수의 문장끼리 서로 연결하여 상기 최소그룹의 데이터의 양을 증식시키는 단계를 포함하는, 방법
9 9
통신부;데이터베이스부; 및 상기 데이터베이스부에 저장된 검진데이터 또는 상기 통신부를 통해 외부서버에서 수신된 검진데이터를 기 설정된 복수의 소견으로 분류하는 제어부를 포함하고, 상기 제어부는, 상기 검진데이터를 전처리하고, 상기 전처리된 검진데이터에 대한 고정 임베딩(Static Embedding) 및 문맥화 임베딩(Contextualized Embedding)을 수행하고, 상기 고정 임베딩 및 문맥화 임베딩이 수행된 결과 데이터를 기반으로 앙상블 분류모델을 생성하며,학습된 상기 앙상블 분류모델을 이용하여 상기 검진데이터의 분류결과를 획득하는,검진데이터 분류장치
10 10
하드웨어인 컴퓨터와 결합되어, 제1항 내지 제8항의 중 어느 한 항의 방법을 실행시키기 위하여 매체에 저장된, 프로그램
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.