1 |
1
하나의 화합물에 대한 분자지문(Molecular fingerprints) 표현식을 도출하는 단계;상기 분자지문 표현식에 포함된 지문들 각각에 대응하는 인덱스들을 추출하는 단계;상기 인덱스들 각각을 임베딩하여 2차원의 지문 임베딩 매트릭스 벡터를 획득하는 단계; 상기 지문 임베딩 벡터를 뉴럴 네트워크를 포함하는 모델에 인가하여 입력된 화합물로부터 대응되는 활성 결과를 예측하는 단계;를 포함하는,화합물이 가지는 활성을 정량적으로 예측하는 방법
|
2 |
2
제1항에 있어서,상기 분자지문 표현식은 ECFP(extended connectivity fingerprints), RDKit, Avalon, Atom Pairs, Topological Torsions, MACCS keys, Morgan, 2D Pharmacophore, Pattern 및 Extended Reduced Graphs로 이루어지는 분자지문 표현식인, 방법
|
3 |
3
제1항에 있어서,상기 도출하는 단계는 상기 하나의 화합물의 SMILES(simplified molecular-input line-entry system), InChI(International Chemical Identifier), WLN(Wiswesser line notation), ROSDAL(Representation of Organic Structure Descriptions Arranged Linearly), 및 SLN(SYBYL Line Notation)으로부터 선택되는 분자 구조의 선형 문자 표현으로부터 분자지문 표현식으로 변환하는 단계를 포함하는, 방법
|
4 |
4
제1항에 있어서,상기 도출하는 단계는 상기 하나의 화합물의 기 설정된 n 비트 크기의 2진수로 표시되며 각각의 비트마다 인덱스가 부여된 분자지문 표현식으로 변환하는 단계를 포함하는, 방법
|
5 |
5
제1항에 있어서,상기 지문 임베딩 벡터는 저장된 룩업 테이블을 참조함으로써 획득하는, 방법
|
6 |
6
제5항에 있어서, 상기 룩업 테이블은 주어진 화합물과 활성에 관한 데이터셋을 이용하여 미리 학습을 통하여 저장된, 방법
|
7 |
7
제5항에 있어서, 상기 룩업테이블은 (n, k) 2차원 행렬이며, 상기 n은 분자지문 표현식의 비트 크기를 나타내는 정수, k는 기 설정된 임베딩 크기를 나타내는 정수인, 방법
|
8 |
8
제6항에 있어서, 상기룩업 테이블은,상기 데이터셋에 포함된 화합물에 대하여 화합물 별로, 상기 도출하는 단계 내지 활성 결과를 획득하는 단계까지를 수행한 후 데이터셋 내의 활성과 비교하여 조정되어 저장된, 방법
|
9 |
9
제1항에 있어서, 상기 뉴럴 네트워크는 CNN(Convolutional Neural Network), RNN(Recurrent Neural Network), 양방향 RNN을 포함하는, 방법
|
10 |
10
제9항에 있어서,상기 CNN 모델은 2차원 컨볼루셔널 레이어 (Conv2d), 맥스 풀링 및 드롭아웃 레이어 및 풀리 커넥티드 레이어로 구성되는, 방법
|
11 |
11
준비된 화합물들의 활성에 관한 데이터셋 내에서 선택되는 하나의 화합물에 대한 분자지문(molecular fingerprints) 표현식을 도출하는 단계;상기 분자지문 표현식에 포함된 지문들에 대응하는 인덱스들을 추출하는 단계;상기 인덱스들 각각을 기 저장된 룩업테이블에 따라 임베딩하여 2차원의 지문 임베딩 벡터를 획득하는 단계; 상기 지문 임베딩 벡터를 뉴럴 네트워크를 포함하는 모델에 인가하여 입력된 화합물로부터 대응되는 활성 결과를 예측하는 단계;상기 예측된 활성 결과를 상기 데이터셋 내의 활성결과와 비교하여 상기 임베딩에 사용는 단계;상기 활성 결과를 상기 데이터셋 내의 활성결과와 비교하여 룩업테이블을 조정하는 단계; 이전 단계들을 반복하여 학습시키는 단계; 및활성을 예측하고자 하는 화합물에 대하여 상기 지문 표현식을 도출하고, 상기 인덱스들을 추출하고, 상기 지문 임베딩 벡터를 획득하는 단계;를 포함하는, 정량적 구조-활성 분석 모델에 입력데이터로서 사용될 수 있는 유기 화합물의 지문 임베딩 벡터 획득 방법
|
12 |
12
준비된 화합물들의 활성에 관한 데이터셋 내에서 선택되는 하나의 화합물에 대한 분자지문(Molecular fingerprints) 표현식을 도출하는 단계;상기 분자지문 표현식에 포함된 지문들에 대응하는 인덱스들을 추출하는 단계;상기 인덱스들 각각을 기 저장된 룩업테이블에 따라 임베딩하여 2차원의 지문 임베딩 매트릭스를 획득하는 단계; 상기 지문 임베딩 벡터를 뉴럴 네트워크를 포함하는 모델에 인가하여 입력된 화합물로부터 대응되는 활성 결과를 예측하는 단계;상기 예측된 활성 결과를 상기 데이터셋 내의 활성결과와 비교하여 룩업테이블을 조정하는 단계; 및이전 단계들을 반복하여 학습시키는 단계;를 포함하는, 뉴럴 네트워크를 포함하는 정량적 구조-활성 예측 모델 설계 방법
|