1 |
1
컴퓨팅 장치에 의해 수행되는 생의학적 연관성(biomedical association) 예측 방법에 있어서,리얼 월드 데이터베이스로부터 환자 정보와 연결된 진단 코드 및 처방 코드를 포함하는 리얼 월드 데이터를 추출하는 단계;생의학 데이터베이스로부터 유전자 정보, 질병 식별자, 화학물질 식별자, 및 모구조 식별자를 포함하는 생의학 데이터를 추출하는 단계;상기 리얼 월드 데이터 및 상기 생의학 데이터를 결합함으로써 새로운 생물학적 네트워크를 구축하는 단계;상기 구축된 새로운 생물학적 네트워크로부터 기계 학습 모델을 트레이닝시키는 단계; 및상기 트레이닝된 기계 학습 모델에 기초하여 상기 새로운 생물학적 네트워크의 개체 노드의 임베딩 벡터에 기초하여 개체 노드들 간의 링크(link)를 예측하는 단계를 포함하는 생의학적 연관성 예측 방법
|
2 |
2
제1항에 있어서,상기 리얼 월드 데이터를 추출하는 단계는,환자 정보를 지시하는 환자 노드를 상기 환자 정보에 대응하여 추출된 처방 코드를 지시하는 처방 노드와 진단 코드를 지시하는 진단 노드에 엣지를 통해 연결함으로써, 그래프 구조의 상기 리얼 월드 데이터를 생성하는 단계를 포함하는 생의학적 연관성 예측 방법
|
3 |
3
제1항에 있어서,상기 생의학 데이터를 추출하는 단계는,유전자 정보를 지시하는 유전자 노드를 상기 유전자 정보에 대응하는 질병 식별자는 지시하는 질병 노드에 엣지를 통해 연결하는 단계;상기 질병 노드를 상기 질병 식별자에 대응하는 화학물질 식별자를 지시하는 화학물질 노드에 엣지를 통해 연결하는 단계;상기 화학물질 노드를 상기 화학물질 식별자에 대응하는 모구조 식별자를 지시하는 모구조 노드에 엣지를 통해 연결하는 단계; 및엣지를 통해 연결된 상기 유전자 노드, 상기 질병 노드, 상기 화학물질 노드, 및 상기 모구조 노드를 포함하는 그래프 구조의 생의학 데이터를 생성하는 단계를 포함하는 생의학적 연관성 예측 방법
|
4 |
4
제3항에 있어서,상기 생의학 데이터에서 상기 질병 노드는 엣지를 통해 상기 화학물질 노드를 경유하여 상기 모구조 노드와 연결되고, 상기 화학물질 노드는 엣지를 통해 상기 질병 노드를 경유하여 상기 유전자 노드와 연결되는,생의학적 연관성 예측 방법
|
5 |
5
제1항에 있어서,상기 새로운 생물학적 네트워크를 구축하는 단계는,상기 리얼 월드 데이터의 진단 노드 및 상기 생의학 데이터의 질병 노드를 연결하고 상기 리얼 월드 데이터의 처방 노드 및 상기 생의학 데이터의 화학물질 노드를 연결함으로써 상기 새로운 생물학적 네트워크를 구축하는 단계를 포함하는 생의학적 연관성 예측 방법
|
6 |
6
제5항에 있어서,상기 새로운 생물학적 네트워크를 구축하는 단계는,생의학 용어(biomedical terminology)에 관한 공통 데이터 모델에 기초하여 동일한 고유 개념 식별자에 대응하는 상기 진단 노드 및 상기 질병 노드끼리 매핑하는 단계; 및상기 공통 데이터 모델에 기초하여 동일한 고유 개념 식별자에 대응하는 상기 처방 노드 및 상기 화학물질 노드끼리 연결하는 단계를 포함하는 생의학적 연관성 예측 방법
|
7 |
7
제5항에 있어서,상기 새로운 생물학적 네트워크를 구축하는 단계는,상기 진단 노드에 의해 지시되는 진단 코드에 대응하는 제1 문자열을 추출하는 단계;공통 데이터 모델로부터 상기 추출된 제1 문자열을 가지는 제1 개념 고유 식별자를 검색하는 단계;상기 검색된 제1 개념 고유 식별자에 대응하는 질병 식별자를 지시하는 상기 질병 노드에 상기 진단 노드를 매핑하는 단계;를 포함하는 생의학적 연관성 예측 방법
|
8 |
8
제5항에 있어서,상기 새로운 생물학적 네트워크를 구축하는 단계는,상기 처방 노드에 의해 지시되는 처방 코드에 대응하는 제2 문자열을 추출하는 단계;공통 데이터 모델로부터 상기 추출된 제2 문자열에 대응하는 제2 개념 고유 식별자를 검색하는 단계; 및상기 검색된 제2 개념 고유 식별자에 대응하는 화학물질 식별자를 지시하는 상기 화학물질 노드에 상기 처방 노드를 매핑하는 단계를 포함하는 생의학적 연관성 예측 방법
|
9 |
9
제1항에 있어서,상기 기계 학습 모델을 트레이닝시키는 단계는,상기 구축된 새로운 생물학적 네트워크에서 초기 개체 노드를 선정하는 단계;상기 선정된 초기 개체 노드로부터 미리 결정된 랜덤워크 길이만큼 순차적으로 랜덤워크를 수행함으로써, 개별 랜덤워크에 따른 개체 노드를 선택하는 단계; 및상기 초기 개체 노드 및 상기 랜덤워크에 기초하여 선택된 개체 노드를 포함하는 랜덤워크 셋트를 지시하는 랜덤워크 데이터를 생성하는 단계를 포함하는 생의학적 연관성 예측 방법
|
10 |
10
제9항에 있어서,상기 기계 학습 모델을 트레이닝시키는 단계는,상기 랜덤워크 데이터에 기초한 입력 데이터에 상기 기계 학습 모델을 적용함으로써 임시 임베딩 데이터를 산출하는 단계; 및상기 산출된 임시 임베딩 데이터에 기초하여 상기 랜덤워크 셋트 내 개체 노드들 간의 연결 확률이 최대화되도록 기계 학습 모델의 파라미터를 업데이트하는 단계를 더 포함하는 생의학적 연관성 예측 방법
|
11 |
11
제1항에 있어서,상기 개체 노드들 간의 링크(link)를 예측하는 단계는,상기 새로운 생물학적 네트워크의 개체 노드들 중 제1 노드에 대응하는 제1 임베딩 벡터를 상기 기계 학습 모델로부터 추출하는 단계;상기 새로운 생물학적 네트워크의 개체 노드들 중 제2 노드에 대응하는 제2 임베딩 벡터를 상기 기계 학습 모델로부터 추출하는 단계; 및상기 추출된 제1 임베딩 벡터 및 상기 제2 임베딩 벡터에 기초하여, 상기 제1 노드 및 상기 제2 노드 간의 엣지 존재 여부를 결정하는 단계를 포함하는 생의학적 연관성 예측 방법
|
12 |
12
제11항에 있어서,상기 엣지 존재 여부를 결정하는 단계는,상기 추출된 제1 임베딩 벡터 및 상기 제2 임베딩 벡터 간의 벡터 거리 차이가 임계 거리 값 미만인 경우에 응답하여, 상기 제1 노드 및 상기 제2 노드 간에 엣지가 존재한다고 결정하는 단계를 포함하는 생의학적 연관성 예측 방법
|
13 |
13
하드웨어와 결합되어 제1항 내지 제12항 중 어느 하나의 항의 방법을 실행시키기 위하여 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램
|
14 |
14
컴퓨팅 장치에 있어서,생의학적 연관성 예측을 위한 기계 학습 모델을 저장한 메모리;리얼 월드 데이터베이스로부터 환자 정보와 연결된 진단 코드 및 처방 코드를 포함하는 리얼 월드 데이터를 추출하고, 생의학 데이터베이스로부터 유전자 정보, 질병 식별자, 화학물질 식별자, 및 모구조 식별자를 포함하는 생의학 데이터를 추출하며, 상기 리얼 월드 데이터 및 상기 생의학 데이터를 결합함으로써 새로운 생물학적 네트워크를 구축하고, 상기 구축된 새로운 생물학적 네트워크로부터 기계 학습 모델을 트레이닝시키며, 상기 트레이닝된 기계 학습 모델에 기초하여 상기 새로운 생물학적 네트워크의 개체 노드의 임베딩 벡터에 기초하여 개체 노드들 간의 링크(link)를 예측하는 프로세서를 포함하는 컴퓨팅 장치
|