1 |
1
분석 대상 NGS(next generation sequencing) 데이터를 획득하는 단계;분석 대상 유전자에 관한 유전형이 서로 다른 염기 서열들 각각에 상기 분석 대상 NGS 데이터를 매핑(mapping)하는 단계;상기 매핑 결과에 기초하여, 상기 분석 대상 NGS 데이터가 상기 분석 대상 유전자에 관한 유전형들 각각에 대응할 제1 확률들을 획득하는 단계;상기 NGS 데이터에서 분석 대상 SNP 데이터를 추출하는 단계;상기 분석 대상 유전자에 관한 유전형이 서로 다른 복수의 SNP 데이터들을 포함하는 참조 데이터를 획득하는 단계;상기 분석 대상 SNP 데이터 및 상기 참조 데이터에 기초하여, 상기 분석 대상 SNP 데이터가 상기 복수의 유전형들 각각에 대응할 제2 확률들을 획득하는 단계; 및상기 제1 확률들 및 상기 제2 확률들에 기초하여, 상기 분석 대상 NGS 데이터의 유전형을 예측하는 단계를 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 방법
|
2 |
2
제1항에 있어서,상기 제1 확률들을 획득하는 단계는상기 분석 대상 유전자에 관한 유전형이 서로 다른 염기 서열들 각각에 대하여, 상기 NGS 데이터 내 매핑된 염기 서열의 길이를 획득하는 단계; 및상기 매핑된 염기 서열의 길이에 기초하여, 상기 분석 대상 유전자에 관한 유전형들 각각에 대응할 제1 확률들을 획득하는 단계를 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 방법
|
3 |
3
제1항에 있어서,상기 분석 대상 NGS 데이터의 유전형을 예측하는 단계는유전형 별로 제1 확률 및 제2 확률을 연산하여, 상기 분석 대상 SNP 데이터가 상기 복수의 유전형들 각각에 대응할 최종 확률들을 획득하는 단계; 및상기 최종 확률들 중 가장 높은 최종 확률에 대응되는 유전형을 상기 분석 대상 NGS 데이터의 유전형으로 예측하는 단계를 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 방법
|
4 |
4
제1항에 있어서,상기 분석 대상 SNP 데이터를 추출하는 단계는상기 NGS 데이터 내 유전자 사이 지역(intergenic region)에서 SNP를 검출하는 단계를 더 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 방법
|
5 |
5
제1항에 있어서,상기 참조 데이터를 획득하는 단계는상기 분석 대상 유전자에 관한 유전형이 결정된 복수의 SNP 데이터들 각각에 대하여, SNP 데이터에 포함된 미리 정해진 복수의 영역들 각각에 상기 SNP 데이터의 유전형에 대응하는 마커를 삽입하는 단계를 더 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 방법
|
6 |
6
제1항에 있어서,상기 참조 데이터를 획득하는 단계는상기 분석 대상 유전자에 관한 유전형이 결정된 복수의 SNP 데이터들 각각에 대하여, SNP 데이터에 포함된 복수의 엑손(exon)들 각각에 상기 SNP 데이터의 유전형에 대응하는 이진 마커를 삽입하는 단계를 더 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 방법
|
7 |
7
제1항에 있어서,상기 제2 확률들을 획득하는 단계는상기 분석 대상 SNP 데이터와 상기 참조 데이터를 추정 모델에 입력함으로써, 상기 분석 대상 SNP 데이터가 상기 복수의 SNP 데이터들의 유전형들에 대응할 확률들을 영역 별로 계산하는 단계; 및상기 영역 별 확률들에 기초하여, 상기 분석 대상 SNP 데이터가 상기 복수의 유전형들 각각에 대응할 제2 확률들을 획득하는 단계를 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 방법
|
8 |
8
제1항에 있어서,상기 제2 확률들을 획득하는 단계는상기 복수의 유전형들에 대응하는 복수의 마커들 사이의 유전적 거리를 계산하는 단계; 및상기 분석 대상 SNP 데이터, 상기 참조 데이터 및 상기 유전적 거리에 기초하여, 상기 분석 대상 SNP 데이터가 상기 복수의 유전형들 각각에 대응할 제2 확률들을 획득하는 단계를 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 방법
|
9 |
9
제1항에 있어서,상기 제2 확률들을 획득하는 단계는상기 분석 대상 SNP 데이터 및 상기 복수의 SNP 데이터들을 샘플링하는 단계;상기 샘플링된 데이터에 기초하여, 히든 마르코프 모델에서 상기 복수의 유전형들에 대응되는 상태들 간 전이 확률을 계산하는 단계;상기 상태들 간 전이 확률을 변환하여, 상태들 간 유전적 거리를 획득하는 단계; 및상기 유전적 거리, 상기 참조 데이터 및 상기 분석 대상 SNP 데이터에 기초하여, 상기 분석 대상 SNP 데이터가 상기 복수의 유전형들 각각에 대응할 제2 확률들을 획득하는 단계를 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 방법
|
10 |
10
제1항에 있어서,상기 분석 대상 SNP 데이터는분석 대상 사용자의 DNA 염기 서열 중 적어도 일부; 및상기 적어도 일부의 DNA 염기 서열에 포함된 적어도 일부의 SNP의 정보를 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 방법
|
11 |
11
제1항에 있어서,상기 참조 데이터에 포함된 SNP 데이터들 각각은해당하는 유전형의 DNA 염기 서열;상기 DNA 염기 서열에 포함된 SNP의 정보; 및상기 DNA 염기 서열 내 미리 정해진 복수의 영역들에 삽입된 마커들을 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 방법
|
12 |
12
제1항에 있어서,상기 분석 대상 유전자는 HLA 유전자이고,상기 복수의 유전형들은 상기 HLA 유전자에 정의된 복수의 유전형들을 포함하며,상기 분석 대상 NGS 데이터는 상기 HLA 유전자의 염기 서열을 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 방법
|
13 |
13
하드웨어와 결합되어 제1항 내지 제12항 중 어느 하나의 항의 방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램
|
14 |
14
분석 대상 유전자에 관한 유전형이 결정된 복수의 SNP 데이터들을 포함하는 참조 데이터를 저장하는 메모리; 및분석 대상 NGS(next generation sequencing) 데이터를 획득하고,상기 분석 대상 유전자에 관한 유전형이 서로 다른 염기 서열들 각각에 상기 분석 대상 NGS 데이터를 매핑(mapping)하고,상기 매핑 결과에 기초하여, 상기 분석 대상 NGS 데이터가 상기 분석 대상 유전자에 관한 유전형들 각각에 대응할 제1 확률들을 획득하고,상기 NGS 데이터에서 분석 대상 SNP 데이터를 추출하고,상기 분석 대상 유전자에 관한 유전형에 대응하는 마커가 삽입된 복수의 SNP 데이터들을 포함하는 참조 데이터를 획득하고,상기 분석 대상 SNP 데이터 및 상기 참조 데이터에 기초하여, 상기 분석 대상 SNP 데이터가 상기 복수의 유전형들 각각에 대응할 제2 확률들을 획득하며,상기 제1 확률들 및 상기 제2 확률들에 기초하여, 상기 분석 대상 NGS 데이터의 유전형을 예측하는 적어도 하나의 프로세서를 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 장치
|
15 |
15
제14항에 있어서,상기 프로세서는상기 제1 확률들을 획득함에 있어서,상기 분석 대상 유전자에 관한 유전형이 서로 다른 염기 서열들 각각에 대하여, 상기 NGS 데이터 내 매핑된 염기 서열의 길이를 획득하고,상기 매핑된 염기 서열의 길이에 기초하여, 상기 분석 대상 유전자에 관한 유전형들 각각에 대응할 제1 확률들을 획득하는,NGS 데이터를 이용하여 유전형을 예측하는 장치
|
16 |
16
제14항에 있어서,상기 프로세서는상기 분석 대상 NGS 데이터의 유전형을 예측함에 있어서,유전형 별로 제1 확률 및 제2 확률을 연산하여, 상기 분석 대상 SNP 데이터가 상기 복수의 유전형들 각각에 대응할 최종 확률들을 획득하고,상기 최종 확률들 중 가장 높은 최종 확률에 대응되는 유전형을 상기 분석 대상 NGS 데이터의 유전형으로 예측하는,NGS 데이터를 이용하여 유전형을 예측하는 장치
|
17 |
17
제14항에 있어서,상기 프로세서는상기 분석 대상 SNP 데이터를 추출함에 있어서,상기 NGS 데이터 내 유전자 사이 지역(intergenic region)에서 SNP를 검출하는,NGS 데이터를 이용하여 유전형을 예측하는 장치
|
18 |
18
제14항에 있어서,상기 프로세서는상기 참조 데이터를 획득함에 있어서,상기 분석 대상 유전자에 관한 유전형이 결정된 복수의 SNP 데이터들 각각에 대하여, SNP 데이터에 포함된 미리 정해진 복수의 영역들 각각에 상기 SNP 데이터의 유전형에 대응하는 마커를 삽입하는,NGS 데이터를 이용하여 유전형을 예측하는 장치
|
19 |
19
제14항에 있어서,상기 프로세서는상기 제2 확률들을 획득함에 있어서,상기 분석 대상 SNP 데이터와 상기 참조 데이터를 추정 모델에 입력함으로써, 상기 분석 대상 SNP 데이터가 상기 복수의 SNP 데이터들의 유전형들에 대응할 확률들을 영역 별로 계산하고,상기 영역 별 확률들에 기초하여, 상기 분석 대상 SNP 데이터가 상기 복수의 유전형들 각각에 대응할 제2 확률들을 획득하는,NGS 데이터를 이용하여 유전형을 예측하는 장치
|
20 |
20
제14항에 있어서,상기 프로세서는상기 제2 확률들을 획득함에 있어서,상기 복수의 유전형들에 대응하는 복수의 마커들 사이의 유전적 거리를 계산하고,상기 분석 대상 SNP 데이터, 상기 참조 데이터 및 상기 유전적 거리에 기초하여, 상기 분석 대상 SNP 데이터가 상기 복수의 유전형들 각각에 대응할 제2 확률들을 획득하는,NGS 데이터를 이용하여 유전형을 예측하는 장치
|
21 |
21
제14항에 있어서,상기 분석 대상 유전자는 HLA 유전자이고,상기 복수의 유전형들은 상기 HLA 유전자에 정의된 복수의 유전형들을 포함하며,상기 분석 대상 NGS 데이터는 상기 HLA 유전자의 염기 서열을 포함하는,NGS 데이터를 이용하여 유전형을 예측하는 장치
|