1 |
1
RNA-단백질 복합체 데이터에 기초하여 RNA 서열의 특징 벡터와 단백질을 구성하는 아미노산 서열의 특징 벡터를 구축하고, 구축된 특징 벡터를 토대로 랜덤 포레스트(random forest) 모델을 적용하여 RNA 서열과 단백질 서열을 훈련시키는 서열 학습 수단; 및무작위 RNA 서열을 필터링(filtering)하고, 상기 서열 학습 수단을 통해 학습된 랜덤 포레스트 모델을 적용하여, 필터링 된 RNA 서열 중에서 표적 단백질 분자와 결합하는 후보 RNA 압타머를 구축하는 서열 발굴 수단을 포함하고, 상기 서열 학습 수단에서 RNA 특징 벡터는 단백질을 구성하는 아미노산과의 상호작용 경향(interaction propensity), RNA 서열의 모노-뉴클레오타이드(mono-nucleotide; 단일-염기) 조성, 디-뉴클레오타이드(di-nucleotide; 2-염기) 조성 및 유사 트리-뉴클레오타이드(pseudo tri-nucleotide; 유사 3-염기) 조성을 토대로 작성되고, 상기 서열 학습 수단에서 단백질 특징 벡터는 단백질을 구성하는 아미노산의 조성, 전이 및 분포 및 유사 아미노산 조성을 토대로 작성되는 표적 단백질 분자와 결합하는 후보 RNA 압타머를 생성하는 프로그램을 기록한 컴퓨터로 판독할 수 있는 기록 매체
|
2 |
2
제 1항에 있어서, 상기 프로그램은, 상기 서열 발굴 수단에 의해 구축된 후보 RNA 압타머를 생성하는 모델을 평가 척도를 사용하여 평가하는 서열 평가 수단을 더욱 포함하는 표적 단백질 분자와 결합하는 후보 RNA 압타머를 생성하는 프로그램을 기록한 컴퓨터로 판독할 수 있는 기록 매체
|
3 |
3
제 2항에 있어서, 상기 평가 척도는 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy), 양성예측도(Positive predictive value), 음성예측도(Negative predictive value) 및 매튜 상관계수(Matthews correlation coefficient) 중에서 선택되는 적어도 하나인 것을 특징으로 하는 표적 단백질 분자와 결합하는 후보 RNA 압타머를 생성하는 프로그램을 기록한 컴퓨터로 판독할 수 있는 기록 매체
|
4 |
4
제 1항 내지 제 3항 중 어느 하나의 항에 있어서, 상기 서열 발굴 수단은, 상기 무작위 RNA 서열의 2차 구조, 자유 에너지, 쌍을 이루지 않는 뉴클레오타이드의 개수 및 풀(pool) 내에서 동일한 2차 구조의 개수를 한정하여 상기 무작위 RNA 서열을 필터링 하는 것을 특징으로 하는 표적 단백질 분자와 결합하는 후보 RNA 압타머를 생성하는 프로그램을 기록한 컴퓨터로 판독할 수 있는 기록 매체
|
5 |
5
제 1항 내지 제 3항 중 어느 하나의 항에 있어서, 상기 RNA 특징 벡터를 구성하는 상기 유사 트리-뉴클레오타이드 조성은, 트리-뉴클레오타이드의 소수성(hydrophobicity), 친수성(hydrophilicity) 및 측쇄-중량(side-chain mass)을 포함하고, 상기 단백질 특징 벡터를 구성하는 상기 유사 아미노산 조성은, 아미노산의 소수성, 친수성, 측쇄-중량, 이온화 지수 및 등전점을 포함하는 표적 단백질 분자와 결합하는 후보 RNA 압타머를 생성하는 프로그램을 기록한 컴퓨터로 판독할 수 있는 기록 매체
|
6 |
6
컴퓨터에 의해 실현되는 프로그램을 이용하여 표적 단백질 분자와 결합하는 후보 RNA 압타머를 생성하는 방법으로서, 서열 학습 수단에 의하여, RNA-단백질 복합체 데이터에 기초하여 RNA 서열의 특징 벡터와 단백질을 구성하는 아미노산 서열의 특징 벡터를 구축하고, 구축된 특징 벡터를 토대로 랜덤 포레스트(random forest) 모델을 적용하여 RNA 서열과 단백질 서열을 훈련시키는 단계; 및 서열 발굴 수단에 의하여, 무작위 RNA 서열을 필터링(filtering)하고, 상기 서열 학습 수단을 통해 학습된 랜덤 포레스트 모델을 적용하여, 필터링 된 RNA 서열 중에서 표적 단백질 분자와 결합하는 후보 RNA 압타머를 구축하는 단계를 포함하고, 상기 서열 학습 수단에서 RNA 특징 벡터는 단백질을 구성하는 아미노산과의 상호작용 경향(interaction propensity), RNA 서열의 모노-뉴클레오타이드(mono-nucleotide; 단일-염기) 조성, 디-뉴클레오타이드(di-nucleotide; 2-염기) 조성 및 유사 트리-뉴클레오타이드(pseudo tri-nucleotide; 유사 3-염기) 조성을 토대로 작성되고, 상기 서열 학습 수단에서 단백질 특징 벡터는 단백질을 구성하는 아미노산의 조성, 전이 및 분포 및 유사 아미노산 조성을 토대로 작성되는 표적 단백질 분자와 결합하는 후보 RNA 압타머를 생성하는 방법
|
7 |
7
제 6항에 있어서, 서열 평가 수단에 의하여, 상기 서열 발굴 수단에 의해 구축된 후보 RNA 압타머를 생성하는 모델을 평가 척도를 사용하여 평가하는 단계를 더욱 포함하는 표적 단백질 분자와 결합하는 후보 RNA 압타머를 생성하는 방법
|
8 |
8
제 7항에 있어서, 상기 평가 척도는 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy), 양성예측도(Positive predictive value), 음성예측도(Negative predictive value) 및 매튜 상관계수(Matthews correlation coefficient) 중에서 선택되는 적어도 하나인 것을 특징으로 하는 표적 단백질 분자와 결합하는 후보 RNA 압타머를 생성하는 방법
|
9 |
9
제 6항 내지 제 8항 중 어느 하나의 항에 있어서, 상기 서열 발굴 수단은, 상기 무작위 RNA 서열의 2차 구조, 자유 에너지, 쌍을 이루지 않는 뉴클레오타이드의 개수 및 풀(pool) 내에서 동일한 2차 구조의 개수를 한정하여 상기 무작위 RNA 서열을 필터링 하는 것을 특징으로 하는 표적 단백질 분자와 결합하는 후보 RNA 압타머를 생성하는 방법
|
10 |
10
제 6항 내지 제 8항 중 어느 하나의 항에 있어서, 상기 RNA 특징 벡터를 구성하는 상기 유사 트리-뉴클레오타이드 조성은, 트리-뉴클레오타이드의 소수성(hydrophobicity), 친수성(hydrophilicity) 및 측쇄-중량(side-chain mass)을 포함하고, 상기 단백질 특징 벡터를 구성하는 상기 유사 아미노산 조성은, 아미노산의 소수성, 친수성, 측쇄-중량, 이온화 지수 및 등전점을 포함하는 표적 단백질 분자와 결합하는 후보 RNA 압타머를 생성하는 방법
|