1 |
1
비공유결합 기반 단백질-리간드 결합친화도 예측 장치에 있어서,입력된 단백질을 기반으로 m 개의 아미노산 잔기 단위의 표현형 벡터를 생성하는 단백질 인코딩 모듈;입력된 리간드를 기반으로 n 개의 부분구조 단위의 표현형 벡터를 생성하는 리간드 인코딩 모듈;상기 m 개의 아미노산 잔기 단위의 표현형 벡터 및 상기 n 개의 부분구조 단위의 표현형 벡터를 기반으로 단백질-리간드 결합체에 대한 단일 표현형 벡터를 생성하는 단백질-리간드 결합 모듈; 및상기 단백질-리간드 결합체에 대한 단일 표현형 벡터를 기반으로 상기 단백질과 상기 리간드의 결합친화도를 예측하는 결합친화도 예측 모듈;을 포함하는 장치에 있어서, 상기 단백질-리간드 결합 모듈은, 상기 m 개의 아미노산 잔기 단위의 표현형 벡터, 상기 n 개의 부분구조 단위의 표현형 벡터 및 학습 가능한 하나의 가상 부분구조 표현형 벡터를 기반으로 m 개의 정제된 아미노산 잔기 단위의 표현형 벡터를 생성하는 ARK-MAB(Attention Regularization based on non-covalent interactions in multihead attention block) 모듈; 및상기 m 개의 정제된 아미노산 잔기 단위의 표현형 벡터 및 시드 벡터를 기반으로 단백질-리간드 결합체에 대한 단일 표현형 벡터를 생성하는 PMA(Pooling by multihead attention layer) 모듈을 포함하며, 상기 ARK-MAB 모듈은, 상기 m 개의 아미노산 잔기 단위의 표현형 벡터를 기반으로 쿼리 프로젝션(query projection)을 생성하고, 상기 n 개의 부분구조 단위의 표현형 벡터 및 상기 하나의 가상 부분구조 표현형 벡터를 기반으로 키 프로젝션(key projection) 및 밸류 프로젝션(value projection)을 생성하는 것을 특징으로 하는 장치
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
제1항에 있어서,상기 AKR-MAB 모듈은,상기 쿼리 프로젝션 및 상기 키 프로젝션을 기반으로 어텐션 가중치(attention weight) 행렬을 생성하고,상기 어텐션 가중치 행렬의 각 행의 합이 1이 되도록 소프트맥스 정규화를 적용하고,상기 소프트맥스 정규화가 적용된 어텐션 가중치 행렬 및 밸류 프로젝션을 기반으로 m 개의 정제된 아미노산 잔기 단위의 표현형 벡터를 생성하는 것을 특징으로 하는 장치
|
5 |
5
제1항에 있어서,상기 ARK-MAB 모듈은 각 아미노산 잔기와 리간드 사이에 화학적 비공유결합이 존재하는지 여부를 나타내도록 미리 정의된 비공유결합(non-covalent interaction, NCI) 레이블을 기반으로 학습되는 것을 특징으로 하는 장치
|
6 |
6
제5항에 있어서,상기 NCI 레이블은, 특정 아미노산 잔기와 상기 리간드 사이에 화학적 비공유결합이 존재할 경우 1의 값을 가지고,상기 특정 아미노산 잔기와 상기 리간드 사이에 화학적 비공유결합이 존재하지 않을 경우 0의 값을 가지는 것을 특징으로 하는 장치
|
7 |
7
제6항에 있어서,제1 아미노산 잔기에 대응되는 NCI 레이블의 값이 1일 경우, 상기 ARK-MAB 모듈은 상기 제1 아미노산 잔기에 대해 상기 n 개의 부분구조 단위의 표현형 벡터에 대응되는 어텐션 가중치의 합이 높아지고 상기 하나의 가상 부분구조 표현형 벡터에 대응되는 어텐션 가중치가 낮아지도록 학습되는 것을 특징으로 하는 장치
|
8 |
8
제6항에 있어서,제2 아미노산 잔기에 대응되는 NCI 레이블의 값이 0일 경우, 상기 ARK-MAB 모듈은 상기 제2 아미노산 잔기에 대해 상기 하나의 가상 부분구조 표현형 벡터에 대응되는 어텐션 가중치가 높아지고 상기 n 개의 부분구조 단위의 표현형 벡터에 대응되는 어텐션 가중치의 합이 낮아지도록 학습되는 것을 특징으로 하는 장치
|
9 |
9
비공유결합 기반 단백질-리간드 결합친화도 예측 방법에 있어서,(a) 단백질 인코딩 모듈이 입력된 단백질을 기반으로 m 개의 아미노산 잔기 단위의 표현형 벡터를 생성하는 단계;(b) 리간드 인코딩 모듈이 입력된 리간드를 기반으로 n 개의 부분구조 단위의 표현형 벡터를 생성하는 단계;(c) 단백질-리간드 결합 모듈이 상기 m 개의 아미노산 잔기 단위의 표현형 벡터 및 상기 n 개의 부분구조 단위의 표현형 벡터를 기반으로 단백질-리간드 결합체에 대한 단일 표현형 벡터를 생성하는 단계; 및(d) 결합친화도 예측 모듈이 상기 단백질-리간드 결합체에 대한 단일 표현형 벡터를 기반으로 상기 단백질과 상기 리간드의 결합친화도를 예측하는 단계;를 포함하는 방법에 있어서, 상기 (c) 단계는, (c-1) 상기 m 개의 아미노산 잔기 단위의 표현형 벡터, 상기 n 개의 부분구조 단위의 표현형 벡터 및 학습 가능한 하나의 가상 부분구조 표현형 벡터를 기반으로 m 개의 정제된 아미노산 잔기 단위의 표현형 벡터를 생성하는 단계; 및(c-2) 상기 m 개의 정제된 아미노산 잔기 단위의 표현형 벡터 및 시드 벡터를 기반으로 단백질-리간드 결합체에 대한 단일 표현형 벡터를 생성하는 단계;를 포함하며, (c-3) 상기 m 개의 아미노산 잔기 단위의 표현형 벡터를 기반으로 쿼리 프로젝션(query projection)을 생성하는 단계; 및, (c-4) 상기 n 개의 부분구조 단위의 표현형 벡터 및 상기 하나의 가상 부분구조 표현형 벡터를 기반으로 키 프로젝션(key projection) 및 밸류 프로젝션(value projection)을 생성하는 단계;를 더 포함하는 것을 특징으로 하는 방법
|
10 |
10
컴퓨팅 장치와 결합하여,(A) 입력된 단백질을 기반으로 m 개의 아미노산 잔기 단위의 표현형 벡터를 생성하는 단계;(B) 입력된 리간드를 기반으로 n 개의 부분구조 단위의 표현형 벡터를 생성하는 단계;(C) 상기 m 개의 아미노산 잔기 단위의 표현형 벡터 및 상기 n 개의 부분구조 단위의 표현형 벡터를 기반으로 단백질-리간드 결합체에 대한 단일 표현형 벡터를 생성하는 단계; 및(D) 상기 단백질-리간드 결합체에 대한 단일 표현형 벡터를 기반으로 상기 단백질과 상기 리간드의 결합친화도를 예측하는 단계;를 실행시키기 위하여 컴퓨터로 판독 가능한 매체에 저장된 컴퓨터 프로그램에 있어서, 상기 (C) 단계는, (C-1) 상기 m 개의 아미노산 잔기 단위의 표현형 벡터, 상기 n 개의 부분구조 단위의 표현형 벡터 및 학습 가능한 하나의 가상 부분구조 표현형 벡터를 기반으로 m 개의 정제된 아미노산 잔기 단위의 표현형 벡터를 생성하는 단계; 및(C-2) 상기 m 개의 정제된 아미노산 잔기 단위의 표현형 벡터 및 시드 벡터를 기반으로 단백질-리간드 결합체에 대한 단일 표현형 벡터를 생성하는 단계;를 포함하며, (C-3) 상기 m 개의 아미노산 잔기 단위의 표현형 벡터를 기반으로 쿼리 프로젝션(query projection)을 생성하는 단계; 및, (C-4) 상기 n 개의 부분구조 단위의 표현형 벡터 및 상기 하나의 가상 부분구조 표현형 벡터를 기반으로 키 프로젝션(key projection) 및 밸류 프로젝션(value projection)을 생성하는 단계;를 더 포함하는 것을 특징으로 하는 컴퓨터로 판독 가능한 매체에 저장된 컴퓨터 프로그램
|