1 |
1
(a) 유전자 데이터 및 비-유전자 데이터를 포함하는 환자군 A(q명) 데이터를 수신하는 단계;(b) 상기 비-유전자 데이터와의 연관성이 공지된 유전자를 선별하는 단계;(c) 상기 선별된 유전자 및 이와 유전자 네트워크를 형성하는 유전자군(p개)으로 상기 환자군 A(q명)의 유전자 데이터를 필터링하는 단계;(d) 상기 필터링된 유전자 데이터(p개)와 상기 환자군 A(q명)의 행렬 Z(q x p)를 생성하는 단계;(e) 상기 행렬의 상관계수(r) 행렬 및 결정계수(R2) 행렬을 생성하는 단계;(f) 하기 식 1에 따라 전사 점수(Transcriptional Score, TS)를 산출하는 단계;[식 1](상기 식에서, p는 유전자 개수를 의미하며, j와 k는 각각 j 번째와 k 번째의 유전자들을 의미함 (j,k=1,…p), 는 2개의 변수 (j, k)를 사용하여 계산한 결정계수를 의미함) (g) 하기 식 2에 따라 상기 각 환자(q명)의 전사 편차 점수(Transcriptional deviance score, TDS)를 산출하는 단계;[식 2]TDS(i)=TSfull-TS(-i)(상기 식에서, i는 상기 q명 환자 샘플의 번호를 의미하며, 상기 TSfull은 상기 q명의 환자 전체의 TS값을 의미하며, 상기 TS(-i)은 i번 환자 1명을 제외한 나머지 환자 전체(q-1명)의 TS값을 의미함)(h) 상기 각 환자의 TDS와 상기 각 환자의 비-유전자 데이터 사이의 관계를 나타내는 예측모델을 구축하는 단계; 및(i) 상기 예측모델의 예측력을 평가하는 단계를 포함하는, 환자의 비-유전자 데이터 예측용 유전자군 선별 방법
|
2 |
2
제1항에 있어서, 상기 유전자 데이터는 환자로부터 제공된 생물학적 시료에서 측정된 유전자 발현량 데이터인 것을 특징으로 하는, 환자의 비-유전자 데이터 예측용 유전자군 선별 방법
|
3 |
3
제1항에 있어서, 상기 비-유전자 데이터는, 환자의 질병 진단 데이터, 질병 예후 데이터 및 약물 반응 데이터로 이루어진 군에서 선택되는 것을 특징으로 하는, 환자의 비-유전자 데이터 예측용 유전자군 선별 방법
|
4 |
4
제1항에 있어서, 상기 (b) 단계에서 유전자는 유전자의 발현량과 상기 비-유전자 데이터 사이에 양의 상관관계 또는 음의 상관관계가 존재하는 것으로 공지된 유전자인 것을 특징으로 하는, 환자의 비-유전자 데이터 예측용 유전자군 선별 방법
|
5 |
5
제1항에 있어서, 상기 (c) 단계에서 유전자 네트워크를 형성하는 유전자군은 유전자의 기능적 링크(functional link)를 포함하는 네트워크 내에서 상기 (b) 단계에서 선별된 유전자의 생물학적 경로(biological pathway)와 관련된 유전자 집단인 것을 특징으로 하는, 환자의 비-유전자 데이터 예측용 유전자군 선별 방법
|
6 |
6
제1항에 있어서, 상기 (c) 단계의 유전자 네트워크를 형성하는 유전자군은 하기 단계를 포함하는 방법에 의해 선별되는 것을 특징으로 하는, 환자의 비-유전자 데이터 예측용 유전자군 선별 방법:(c1) 상기 (b) 단계에서 선별된 유전자와 동일한 생물학적 기능을 나타내는 유전자군; 상기 (b) 단계에서 선별된 유전자와 상호작용을 하는 것으로 공지된 유전자군; 및 상기 (b) 단계에서 선별된 유전자와 연관성이 공지된 비-유전자 데이터에 연관성을 나타내는 유전자군으로 이루어진 군에서 선택된 1종 이상의 유전자군을 선별하는 단계; 및(c2) 상기 (c1) 단계에서 선별된 유전자군과 유전자 네트워크를 형성하는 유전자군을 선별하는 단계
|
7 |
7
제1항에 있어서, 상기 (h) 단계에서 예측모델은 일반화 선형 모델(generalized linear model), 최소 제곱 모델 (least squares model), 로지스틱 회귀분석 모델(logistic regression model), 선형 회귀분석 모델 (linear regression model), LASSO 회귀분석 모델(least absolute shrinkage and selection operator regression model), 선형 판별분석 모델 (linear discriminant analysis model), 능형 회귀분석 모델 (ridge regression model), 서포트 벡터 머신 모델(support vector machine model) 및 트리-기반 반복 분할 모델(tree-based recursive partitioning model)로 이루어진 군에서 선택된 것을 특징으로 하는, 환자의 비-유전자 데이터 예측용 유전자군 선별 방법
|
8 |
8
제1항에 있어서, 상기 (f) 단계에서 예측모델의 예측력 평가는 교차 검증(cross-validation) 방법에 의해 수행되는 것을 특징으로 하는, 환자의 비-유전자 데이터 예측용 유전자군 선별 방법
|
9 |
9
제1항 내지 제8항 중 어느 한 항에 따른 방법을 수행하기 위한 프로그램이 기록되는, 컴퓨터 판독 가능한 기록 매체
|
10 |
10
(a) 유전자 데이터 및 비-유전자 데이터를 포함하는 환자군 A(q명) 데이터를 수신하는 단계;(b) 상기 비-유전자 데이터와의 연관성이 공지된 유전자를 선별하는 단계;(c) 상기 선별된 유전자 및 이와 유전자 네트워크를 형성하는 유전자군(p개)으로 상기 환자군 A(q명)의 유전자 데이터를 필터링하는 단계;(d) 상기 필터링된 유전자 데이터(p개)와 상기 환자군 A(q명)의 행렬 Z(q x p)를 생성하는 단계;(e) 상기 행렬의 상관계수(r) 행렬 및 결정계수(R2) 행렬을 생성하는 단계;(f) 하기 식 1에 따라 전사 점수(Transcriptional Score, TS)를 산출하는 단계;[식 1](상기 식에서, p는 유전자 개수를 의미하며, j와 k는 각각 j 번째와 k 번째의 유전자들을 의미함 (j,k=1,…p), 는 2개의 변수 (j, k)를 사용하여 계산한 결정계수를 의미함) (g) 하기 식 2에 따라 상기 각 환자(q명)의 전사 편차 점수(Transcriptional deviance score, TDS)를 산출하는 단계;[식 2]TDS(i)=TSfull-TS(-i)(상기 식에서, i는 상기 q명 환자 샘플의 번호를 의미하며, 상기 TSfull은 상기 q명의 환자 전체의 TS값을 의미하며, 상기 TS(-i)은 i번 환자 1명을 제외한 나머지 환자 전체(q-1명)의 TS값을 의미함)(h) 상기 각 환자의 TDS와 상기 각 환자의 비-유전자 데이터 사이의 관계를 나타내는 예측모델을 구축하는 단계;(i) 비-유전자 데이터 정보가 없는 환자군 B(t명)의 유전자 데이터를 수신하는 단계;(j) 상기 환자군 A(q명) 및 환자군 B(t명)의 유전자 데이터로 상기 (b) 내지 (g) 단계를 수행하여 상기 환자군 B(t명)의 TDS를 산출하는 단계; 및(k) 상기 (h) 단계의 예측모델에 상기 환자군 B(t명)의 TDS를 입력으로 하여 상기 환자군 B(t명)의 비-유전자 데이터를 예측하는 단계를 포함하는, 환자의 비-유전자 데이터 예측 방법
|
11 |
11
제10항에 있어서, 상기 (h) 단계 이후 상기 예측모델의 예측력을 평가하는 단계를 추가로 포함하는 것을 특징으로 하는, 환자의 비-유전자 데이터 예측 방법
|
12 |
12
제10항에 있어서, 상기 (h) 단계 이후 상기 TDS에 기초하여, 분류 기준점(cut-off/threshold value)을 설정하고, 상기 TDS의 민감도(sensitivity) 및 특이도(specificity)를 산출하여 상기 예측모델의 예측력을 평가하는 분류 기준점을 설정하는 단계; 및 상기 설정된 분류 기준점을 토대로 상기 환자군 A의 비-유전자 데이터의 성질을 구분하는 것을 특징으로 하는, 환자의 비-유전자 데이터 예측 방법
|
13 |
13
제12항에 있어서, 상기 분류 기준점(cut-off/threshold value)는 유덴 인덱스(Youden index or Youden's J statistic), 균형 정확도 인덱스(index of balanced accuracy) 또는 이의 조합을 이용하여 설정하는 것을 특징으로 하는, 환자의 비-유전자 데이터 예측 방법
|
14 |
14
제12항에 있어서, 상기 비-유전자 데이터의 성질의 구분은 (i) 질병 발생 고위험군, 중위험군 및 저위험군의 구분; (ii) 질병 예후 불량군, 중간군 및 양호군의 구분; 또는 (iii) 약물 비반응군, 중간군 및 반응군의 구분인 것을 특징으로 하는, 환자의 비-유전자 데이터 예측 방법
|
15 |
15
(a) 유전자 데이터 및 비-유전자 데이터를 포함하는 환자군 A(q명) 데이터를 수신하는 데이터 수신부 A;(b) 상기 비-유전자 데이터와의 연관성이 공지된 유전자가 선별되어 입력되는 입력부;(c) 상기 선별된 유전자 및 이와 유전자 네트워크를 형성하는 유전자군(p개)으로 상기 환자군 A(q명)의 유전자 데이터를 필터링하는 필터링부;(d) 상기 필터링된 유전자 데이터(p개)와 상기 환자군 A(q명)의 행렬 Z(q x p)를 생성하는 행렬 생성부;(e) 상기 행렬의 상관계수(r) 행렬 및 결정계수(R2) 행렬을 생성하는 연산부;(f) 하기 식 1에 따라 전사 점수(Transcriptional Score, TS)를 산출하는 전사 점수 산출부;[식 1](상기 식에서, p는 유전자 개수를 의미하며, j와 k는 각각 j 번째와 k 번째의 유전자들을 의미함 (j,k=1,…p), 는 2개의 변수 (j, k)를 사용하여 계산한 결정계수를 의미함) (g) 하기 식 2에 따라 상기 각 환자(q명)의 전사 편차 점수(Transcriptional deviance score, TDS)를 산출하는 전사 편차 점수 산출부 A;[식 2]TDS(i)=TSfull-TS(-i)(상기 식에서, i는 상기 q명 환자 샘플의 번호를 의미하며, 상기 TSfull은 상기 q명의 환자 전체의 TS값을 의미하며, 상기 TS(-i)은 i번 환자 1명을 제외한 나머지 환자 전체(q-1명)의 TS값을 의미함)(h) 상기 각 환자의 TDS와 상기 각 환자의 비-유전자 데이터 사이의 관계를 나타내는 예측모델을 구축하는 예측모델 구축부;(i) 비-유전자 데이터 정보가 없는 환자군 B(t명)의 유전자 데이터를 수신하는 데이터 수신부 B;(j) 상기 환자군 A(q명) 및 환자군 B(t명)의 유전자 데이터로 상기 (b) 내지 (g) 단계를 수행하여 상기 환자군 B(t명)의 TDS를 산출하는 전사 편차 점수 산출부 B; 및(k) 상기 (h) 단계의 예측모델에 상기 환자군 B(t명)의 TDS를 입력으로 하여 상기 환자군 B(t명)의 비-유전자 데이터를 예측하는 예측부를 포함하는, 환자의 비-유전자 데이터 예측 장치
|