1 |
1
화합물 생체활성 예측을 위한 준지도 학습 방법으로서,생체활성 화합물 데이터베이스로부터 추출한 레이블 데이터셋을 서로 유사도가 낮은 훈련용 레이블 데이터셋과 검증용 레이블 데이터셋으로 분리하는 단계; 비-레이블 데이터셋으로부터 샘플 가중치에 기초하여 비-레이블 부표본을 추출하는 단계; 상기 훈련용 레이블 데이터셋과 상기 비-레이블 부표본에 기초한 손실함수를 이용하여 심층 신경망의 가중치를 업데이트하는 단계; 및상기 검증용 레이블 데이터셋에 기초한 손실함수를 이용하여 상기 샘플 가중치를 업데이트하는 단계를 포함하는,화합물 생체활성 예측을 위한 준지도 학습 방법
|
2 |
2
제1항에 있어서,상기 심층 신경망은 그래프 합성곱 신경망 및 완전 연결 계층을 포함하는,화합물 생체활성 예측을 위한 준지도 학습 방법
|
3 |
3
제1항에 있어서,상기 레이블 데이터셋을 서로 유사도가 낮은 상기 훈련용 레이블 데이터셋과 상기 검증용 레이블 데이터셋으로 분리하는 단계는상기 레이블 데이터셋에 포함된 화합물(분자)들의 구조적 특성을 기준으로 서로 유사도가 낮도록 상기 훈련용 레이블 데이터셋과 상기 검증용 레이블 데이터셋으로 분리하는,화합물 생체활성 예측을 위한 준지도 학습 방법
|
4 |
4
제1항에 있어서,상기 레이블 데이터셋을 서로 유사도가 낮은 상기 훈련용 레이블 데이터셋과 상기 검증용 레이블 데이터셋으로 분리하는 단계 이전에,생체활성 화합물 데이터베이스로부터 생체 표적에 대한 생체활성 정보가 알려진 화합물들을 선택하여 상기 레이블 데이터셋을 추출하는 단계를 더 포함하는,화합물 생체활성 예측을 위한 준지도 학습 방법
|
5 |
5
제1항에 있어서,상기 비-레이블 데이터셋으로부터 상기 샘플 가중치에 기초하여 상기 비-레이블 부표본을 추출하는 단계 이전에,분자 데이터베이스로부터 미리 입력된 분자 특성에 기초하여 상기 비-레이블 데이터셋을 추출하는 단계를 더 포함하는,화합물 생체활성 예측을 위한 준지도 학습 방법
|
6 |
6
제1항에 있어서,상기 훈련용 레이블 데이터셋과 상기 비-레이블 부표본에 기초한 손실함수를 이용하여 상기 심층 신경망의 가중치를 업데이트하는 단계는 상기 훈련용 레이블 데이터셋에 해당하는 화합물 데이터를 입력 받은 상기 심층 신경망이 출력한 생체활성 정보와 실제 생체활성 정보(레이블)의 차이에 기초한 손실함수; 상기 비-레이블 부표본을 입력 받은 상기 심층 신경망이 출력한 생체활성 정보에 기초한 손실함수; 및 상기 비-레이블 부표본을 입력 받은 그래프 합성곱 신경망으로부터 얻어진 특성 벡터와 그래프 임베딩 방식으로 도출된 특성 벡터의 차이에 기초한 손실함수 중에서 적어도 둘 이상의 손실함수들을 조합한 다수준 손실함수를 이용하여 상기 심층 신경망의 가중치를 업데이트하는,화합물 생체활성 예측을 위한 준지도 학습 방법
|
7 |
7
화합물 생체활성 예측을 위한 준지도 학습 시스템으로서, 생체활성 화합물 데이터베이스로부터 레이블 데이터셋을 추출하여 상기 레이블 데이터셋을 훈련용 레이블 데이터셋 및 검증용 레이블 데이터셋을 분리하고, 분자 데이터베이스로부터 비-레이블 부표본을 추출하는 데이터 추출부; 심층 신경망; 및 상기 훈련용 레이블 데이터셋과 상기 비-레이블 부표본에 기초한 손실함수를 이용하여 상기 심층 신경망의 가중치를 계산하고, 상기 검증용 레이블 데이터셋에 기초한 손실함수를 이용하여 샘플 가중치를 계산하는 손실함수 계산부;를 포함하고,상기 데이터 추출부는 상기 생체활성 화합물 데이터베이스로부터 도출된 상기 레이블 데이터셋을 서로 유사도가 낮은 상기 훈련용 레이블 데이터셋과 상기 검증용 레이블 데이터셋으로 분리하는 분리부; 및 상기 분자 데이터베이스로부터 도출된 비-레이블 데이터셋으로부터 상기 샘플 가중치에 기초하여 상기 비-레이블 부표본을 추출하는 샘플부;를 포함하는,화합물 생체활성 예측을 위한 준지도 학습 시스템
|
8 |
8
제7항에 있어서,상기 심층 신경망은 그래프 합성곱 신경망 및 완전 연결 계층을 포함하는,화합물 생체활성 예측을 위한 준지도 학습 시스템
|
9 |
9
제7항에 있어서,상기 분리부는 상기 레이블 데이터셋에 포함된 화합물(분자)들의 구조적 특성을 기준으로 서로 유사도가 낮도록 상기 훈련용 레이블 데이터셋과 상기 검증용 레이블 데이터셋으로 분리하는,화합물 생체활성 예측을 위한 준지도 학습 시스템
|
10 |
10
제7항에 있어서,상기 데이터 추출부는 상기 생체활성 화합물 데이터베이스로부터 생체 표적에 대한 생체활성 정보가 알려진 화합물들을 선택하여 상기 레이블 데이터셋을 추출하는 생체활성도 필터부를 더 포함하는,화합물 생체활성 예측을 위한 준지도 학습 시스템
|
11 |
11
제7항에 있어서,상기 데이터 추출부는 상기 분자 데이터베이스로부터 미리 입력된 분자 특성에 기초하여 상기 비-레이블 데이터셋을 추출하는 분자 필터부를 더 포함하는,화합물 생체활성 예측을 위한 준지도 학습 시스템
|
12 |
12
제7항에 있어서,상기 데이터 추출부는 상기 레이블 데이터셋 및 상기 비-레이블 데이터셋에 포함되는 화합물(분자)의 구조적 특성을 도출하는 특성화부를 더 포함하는,화합물 생체활성 예측을 위한 준지도 학습 시스템
|
13 |
13
제7항에 있어서,상기 심층 신경망은 상기 비-레이블 데이터셋에 속하는 화합물의 분자 구조를 표현한 그래프를 특성 벡터로 변환하는 임베딩부를 포함하는, 화합물 생체활성 예측을 위한 준지도 학습 시스템
|
14 |
14
제7항에 있어서,상기 손실함수 계산부는 상기 비-레이블 부표본에 속하는 화합물의 분자 구조를 표현한 그래프를 특성 벡터로 변환하는 임베딩부를 포함하는, 화합물 생체활성 예측을 위한 준지도 학습 시스템
|
15 |
15
제13항 또는 제14항에 있어서,상기 손실함수 계산부는 상기 훈련용 레이블 데이터셋에 해당하는 화합물 데이터를 입력 받은 상기 심층 신경망이 출력한 생체활성 정보와 실제 생체활성 정보(레이블)의 차이에 기초한 손실함수; 상기 비-레이블 부표본을 입력 받은 상기 심층 신경망이 출력한 생체활성 정보에 기초한 손실함수; 및 상기 비-레이블 부표본에 대한 그래프 합성곱 신경망으로부터 얻어진 특성 벡터와 상기 임베딩부로부터 도출된 특성 벡터의 차이에 기초한 손실함수 중에서 적어도 둘 이상의 손실함수들을 조합한 다수준 손실함수를 이용하여 상기 심층 신경망의 가중치를 업데이트하는,화합물 생체활성 예측을 위한 준지도 학습 시스템
|