1 |
1
염기서열 분석 장치의 SNP(single nucleotide polymorphism) 판별 방법에 있어서:레퍼런스 유전체 서열의 소정의 위치에 대한 전체 리드들 중 복수를 입력 서열로 샘플링하는 단계;상기 샘플링된 입력 서열들과 상기 레퍼런스 유전체 서열을 이용하여 우도 매트릭스를 계산하는 단계;상기 계산된 우도 매트릭스와 상기 레퍼런스 유전체 서열을 근거로 하여 사후확률을 계산하는 단계; 및상기 계산된 사후확률을 근거로 하여 유전형을 평가한 뒤, 상기 소정의 위치를 SNP로 판별하는 단계를 포함하는 SNP 판별 방법
|
2 |
2
제 1 항에 있어서,상기 샘플링하는 단계는,상기 전체 리드들을 고정 간격으로 샘플링하는 단계를 포함하는 SNP 판별 방법
|
3 |
3
제 1 항에 있어서,상기 샘플링하는 단계는,상기 전체 리드들을 임의로 샘플링하는 단계를 포함하는 SNP 판별 방법
|
4 |
4
제 3 항에 있어서,상기 임의로 샘플링하는 단계는,상기 전체 리드들을 임의 접근을 하기 위한 색인을 근거로 샘플링하는 단계를 포함하는 SNP 판별 방법
|
5 |
5
제 1 항에 있어서,상기 샘플링하는 단계는,샘플링 크기 및 빈도를 설정하는 단계를 더 포함하는 SNP 판별 방법
|
6 |
6
제 5 항에 있어서,상기 샘플링 크기는 전체 매핑 리드 크기의 사전에 결정된 비율을 초과하지 않는 SNP 판별 방법
|
7 |
7
제 5 항에 있어서,상기 샘플링하는 단계는,상기 설정된 샘플링 빈도를 근거로 하여 매핑 데이터에서 리드 매핑 정보를 읽는 단계; 및상기 읽혀진 리드 매핑 정보로부터 품질, 좌표, 목적베이스, 관찰베이스로 구성된 빈도 매트릭스에 횟수를 누적하는 단계를 더 포함하는 SNP 판별 방법
|
8 |
8
제 7 항에 있어서,상기 샘플링하는 단계는,샘플링 완료 조건을 만족하는 지를 판별하는 단계를 더 포함하는 SNP 판별 방법
|
9 |
9
제 8 항에 있어서,상기 샘플링 완료 조건을 만족하지 않을 때, 상기 샘플링하는 단계가 반복되는 SNP 판별 방법
|
10 |
10
제 7 항에 있어서,상기 샘플링 완료 조건은 상기 빈도 매트릭스의 완성도에 관련된 지수, 샘플링 비율, 상기 빈도 매트릭스의 셀들의 표준 편차 중 적어도 하나를 이용하는 SNP 판별 방법
|
11 |
11
제 10 항에 있어서,상기 빈도 매트릭스의 완성도는 리드 베이스의 품질 값에 따른 가중치를 적용하는 SNP 판별 방법
|
12 |
12
제 8 항에 있어서,상기 샘플링 하는 단계는,상기 샘플링 완료 조건을 만족하지 않을 때, 샘플링하는 시작 위치를 다르게 하여 샘플링을 반복하는 단계를 더 포함하는 SNP 판별 방법
|
13 |
13
제 8 항에 있어서,상기 샘플링 하는 단계는,상기 샘플링 완료 조건을 만족하지 않을 때, 상기 빈도 매트릭스에서 산출된 표준편차와 비교하여 누적량이 차이가 사전에 결정된 값보다 큰 셀들에 대한 품질 값을 선택하고, 선택된 품질 값에 대응하는 리드들에 대해서 샘플링을 수행하는 단계를 더 포함하는 SNP 판별 방법
|
14 |
14
복수의 품질 값들로 구성된 전체 리드들 중 n개를 입력 서열로 샘플링하는 입력서열 샘플링 유닛;상기 샘플링 리드들과 레퍼런스 유전체 서열을 근거로 하여 우도 매트릭스를 계산하는 우도 계산 유닛;상기 우도 매트릭스, 상기 레퍼런스 유전체 서열, 및 상기 전체 리드들로부터 사후확률을 계산하는 사후확률 계산 유닛; 및상기 계산된 사후확률을 근거로 하여 유전형을 결정하고, 대응하는 레퍼런스 유전체 서열의 위치의 유전형과 상기 결정된 유전형을 근거로 하여 SNP(single nucleotide polymorphism)를 판별하는 유전형 평가 및 SNP 판별 유닛을 포함하고,상기 샘플링 유닛은 샘플링 조건을 만족하지 않을 때 품질 값에 따른 선택적 샘플링을 반복하는 염기 서열 분석 장치
|
15 |
15
제 14 항에 있어서, 장치는 베이지언 확률 기반으로 SNP가 판별되는 염기 서열 분석 장치
|