1 |
1
다음 단계를 포함하는 유기체의 지놈 변이(genomic variation) 또는 후생학적 변이(epigenomic variation)를 분석하기 위한 컴퓨터 실행(computer implemented) 방법:(a) 상기 변이에 대한 최소 두 종류의 묘사자(descriptor)를 구축하는 단계;(b) 최소 두 종류의 클래스 예측 알고리즘(class prediction algorithm)을 상기 최소 두 종류의 묘사자 각각에 적용시켜 상기 유기체의 지놈 변이 또는 후생학적 변이를 분석하여 최소 4 종류의 예측 결과를 얻는 단계; 및 (c) 상기 단계 (b)에서 얻은 최소 4 종류의 예측 결과를 추론 알고리즘(inference algorithm)에 적용하여 상기 유기체의 형질(trait)을 최종적으로 예측하는 단계
|
2 |
2
제 1 항에 있어서, 상기 지놈 변이는 뉴클레오타이드 서열에서의 SNP(single nucleotide polymorphism), 결손, 삽입 또는 반복 변이인 것을 특징으로 하는 방법
|
3 |
3
제 2 항에 있어서, 상기 변이는 SNP인 것을 특징으로 하는 방법
|
4 |
4
제 1 항에 있어서, 상기 변이에 대한 최소 두 종류의 묘사자는 (i) 각각의 변이가 이웃의 변이에 대하여 독립적이라는 것이 가정된 변이들의 프로파일 및 (ii) 특정 길이의 연계된 변이인 변이 신택스(VAR-S)의 프로파일을 포함하는 것을 특징으로 하는 방법
|
5 |
5
제 1 항에 있어서, 상기 변이들은 SNPs이고, 상기 SNPs는 (i) 5% 이하의 대립유전자 빈도를 나타내는 SNPs의 제거, (ii) 하디 와인버그 평형 시험(Hardy Weinberg Equilibrium test) 및 (iii) 플레이트-효과 시험으로 구성된 군으로부터 선택되는 최소 1개의 방법에 의해 QC(Quality control)된 SNPs인 것을 특징으로 하는 방법
|
6 |
6
제 1 항에 있어서, 상기 최소 두 종류의 클래스 예측 알고리즘은 k-최인접 이웃(k-nearest neighbor: kNN) 알고리즘 및 서포트 벡터 머쉰(support vector machine: SVM) 알고리즘을 포함하는 것을 특징으로 하는 방법
|
7 |
7
제 1 항에 있어서, 상기 변이에 대한 묘사자 중 적어도 하나는 VAR-S의 프로파일이고, 상기 클래스 예측 알고리즘 중 적어도 하나는 k-최인접 이웃 알고리즘이며, 상기 단계 (b)는 (b-1) 파퓰레이션에서 20% 이하의 낮은 빈도로 발견되는 희귀 VAR-S를 선별하는 소단계; (b-2) 희귀 VAR-S의 총수로 정규화(normalization) 하는 소단계; (b-3) 희귀 VAR-S의 프로파일을 이용하여 JS(Jensen-Shannon) 발산 매트릭스를 구축하는 소단계; 및 (b-4) 상기 JS 발산 매트릭스를 이용하여 상기 유기체에 대한 k-최인접 이웃(kNN)을 선별하는 소단계를 포함하는 것을 특징으로 하는 방법
|
8 |
8
제 1 항에 있어서, 상기 변이에 대한 묘사자 중 적어도 하나는 VAR-S의 프로파일이고, 상기 클래스 예측 알고리즘 중 적어도 하나는 서포트 벡터 머쉰(SVM) 알고리즘이며, 상기 단계 (b)는 (b-1) 10-2 내지 10-6의 낮은 p-값을 갖는 VAR-S를 선별하는 소단계; (b-2) 모든 이원적 형질(binary traits) 각각에 대하여 SVM을 실시하는 소단계; 및 (iii) 최대-윈 선출(max-win voting) 방식에 따라 분류하는 소단계를 포함하는 것을 특징으로 하는 방법
|
9 |
9
제 1 항에 있어서, 상기 변이에 대한 묘사자 중 적어도 하나는 변이의 프로파일이고, 상기 클래스 예측 알고리즘 중 적어도 하나는 k-최인접 이웃 알고리즘이며, 상기 단계 (b)는 (b-1) 파퓰레이션에서 20% 이하의 낮은 빈도로 발견되는 희귀 변이를 선별하는 소단계; (b-2) 희귀 변이의 총수로 정규화(normalization) 하는 소단계; (b-3) 상기 희귀 변이의 프로파일을 이용하여 JS 발산 매트릭스를 구축하는 소단계; 및 (b-4) 상기 JS 발산 매트릭스를 이용하여 상기 유기체에 대한 k-최인접 이웃(kNN)을 선별하는 소단계를 포함하는 것을 특징으로 하는 방법
|
10 |
10
제 1 항에 있어서, 상기 변이에 대한 묘사자 중 적어도 하나는 변이의 프로파일이고, 상기 클래스 예측 알고리즘 중 적어도 하나는 서포트 벡터 머쉰(SVM) 알고리즘이며, 상기 단계 (b)는 (b-1) 10-2 내지 10-6의 낮은 p-값을 갖는 변이를 선별하는 소단계; (b-2) 모든 이원적 형질(binary traits) 각각에 대하여 SVM을 실시하는 소단계; 및 (iii) 최대-윈 선출(max-win voting) 방식에 따라 분류하는 소단계를 포함하는 것을 특징으로 하는 방법
|
11 |
11
제 1 항에 있어서, 상기 추론 알고리즘은 베이지언 추론(Bayesian inference) 알고리즘인 것을 특징으로 하는 방법
|
12 |
12
제 1 항에 있어서, 상기 유기체의 형질은 질환(diseases), 질병(disorders), 상태(conditions), 증상(symptoms) 또는 치료(therapy) 반응성(responsiveness)인 것을 특징으로 하는 방법
|
13 |
13
제 12 항에 있어서, 상기 형질은 암 질환인 것을 특징으로 하는 방법
|
14 |
14
제 1 항에 있어서, 상기 형질은 성장속도, 수율 또는 질(quality)인 것을 특징으로 하는 방법
|
15 |
15
하기의 단계를 실시하도록 컴퓨터 프로세서를 지시하는 지시사항(instructions)이 포함된(embodied) 컴퓨터-독해가능한(computer-readable) 저장 매체: (a) 유기체의 지놈 변이 또는 후생학적 변이에 대한 최소 두 종류의 묘사자(descriptor)를 구축하는 단계; (b) 최소 두 종류의 클래스 예측 알고리즘(class prediction algorithm)을 상기 최소 두 종류의 묘사자 각각에 적용시켜 상기 유기체의 지놈 변이 또는 후생학적 변이를 분석하여 최소 4 종류의 예측 결과를 얻는 단계; 및 (c) 상기 단계 (b)에서 얻은 최소 4 종류의 예측 결과를 추론 알고리즘(inference algorithm)에 적용하여 상기 유기체의 형질(trait)을 최종적으로 예측하는 단계
|
16 |
16
다음을 포함하는 유기체의 지놈 변이(genomic variation) 또는 후생학적 변이(epigenomic variation)를 분석하기 위한 시스템:(a) 컴퓨터 프로세서; 및 (b) 상기 프로세서와 커플링된 상기 제 15 항의 컴퓨터-독해가능한(computer-readable) 저장 매체
|