1 |
1
1) 전장 유전체(Whole genome sequence) 게놈 세그먼트의 초기 구조 변이(Initial structural variation)를 검출하는 단계;2) 상기 게놈 세그먼트 및 구조 변이로부터 중단점(Breakpoint) 그래프를 구성하는 단계;3) 대립 유전자 특이적(Allele-specific) 중단점 그래프를 구성하는 단계;4) 일배체형(Haplotype) 중단점 그래프를 구성하는 단계;5) 상기 중단점 그래프 에지를 페어링(edge pairing)하여 오일러 경로를 열거하는 단계를 포함하는 전장 유전체 데이터를 이용한 유전체 복원 방법
|
2 |
2
제1항에 있어서,상기 단계 1)에서 상기 구조 변이는 중단점 인접성(breakpoint adjacencies)의 방향에 따라 헤드-투-헤드(HH), 헤드-투-테일(HT), 테일-투-헤드(TH) 또는 테일-투-테일(TT)로 표기되는 유전체 복원 방법
|
3 |
3
제1항에 있어서,상기 단계 2)에서, 그래프 노드는 헤드 노드(Sh) 및 테일 노드(St)를 포함하고, 그래프 에지는 세그먼트 에지(Es), 참조 에지(Er) 및 SV 에지(Ev)를 포함하는 유전체 복원 방법
|
4 |
4
제2항에 있어서,상기 세그먼트 에지(segment edge)는 n번 게놈 세그먼트의 헤드 노드 및 테일 노드를 연결하고, 상기 세그먼트 에지의 다중도는 게놈 세그먼트의 카피수(CN)을 나타내는 유전체 복원 방법
|
5 |
5
제2항에 있어서,상기 참조 에지(reference edge)는 n번 및 n+1번 게놈 세그먼트 사이에서 n번 테일 노드와 n+1번 헤드 노드를 연결하고, 상기 참조 게놈(reference genome)에 존재하는 인접한 게놈 세그먼트 사이의 인접성(adjacency)을 나타내는 유전체 복원 방법
|
6 |
6
제2항에 있어서,상기 SV 에지는 참조 게놈에 존재하지 않는 게놈 세그먼트 사이의 인접성을 나타내는 유전체 복원 방법
|
7 |
7
제1항에 있어서,상기 단계 2)는 하기의 반복적인 단계에 의하여 수행되는 유전체 복원 방법:a) 로컬 카피수 분할을 수행하는 단계;b) 정수 프로그래밍에 의하여 정수 카피수(integer CN)를 예측하는 단계;및c) 정수 프로그래밍에 의하여 에지 다중도를 결정하는 단계
|
8 |
8
제7항에 있어서,상기 a) 로컬 카피수 분할을 수행하는 단계는 다음의 두 항(term)으로 구성된 중단점을 결정하는 단계를 포함하는 유전체 복원 방법:- 중단점이 있는 모델이 리드-깊이 데이터에 얼마나 잘 맞는지 설명하는 우도 항(likelihood term);및 - 중단점 수를 조절하고 과도한 세분화를 방지하는 매개변수 혹은 페널티 항(penalty term)
|
9 |
9
제7항에 있어서,상기 b) 정수 카피수를 예측하는 단계는 게놈 세그먼트의 리드-깊이로부터의 정수 측정 모델에서 높은 확률에 따라 순차적으로 정수 카피수를 대입하는 단계를 포함하는 유전체 복원 방법
|
10 |
10
제7항에 있어서,상기 에지 다중도는 세그먼트 에지, 구조 변이 에지 및 참조 에지의 다중도로 표시되는 유전체 복원 방법
|
11 |
11
제7항에 있어서,d) 에지 다중도가 0인 구조 변이를 제거하는 단계를 더 포함하는 유전체 복원 방법
|
12 |
12
제11항에 있어서,에지 다중도가 0인 구조 변이가 검출되지 않을 때까지 a) ~ d) 단계를 반복적으로 수행하는 단계를 더 포함하는 유전체 복원 방법
|
13 |
13
제1항에 있어서,상기 단계 3)는 정수 프로그래밍에 의하여 정수 카피수(integer CN)를 대립 유전자-특이적 카피수(ASCN)로 나누는 단계를 더 포함하는 유전체 복원 방법
|
14 |
14
제13항에 있어서,상기 정수 프로그래밍에 의하여 정수 카피수(integer CN)를 대립 유전자-특이적 카피수(ASCN)로 나누는 단계는 SNP의 다른 깊이(depth)에 대한 음의 이항 모델을 사용하여 수행되는 유전체 복원 방법
|
15 |
15
제1항에 있어서,상기 대립 유전자 특이적(Allele-specific) 중단점 그래프는 대립 유전자-특이적 카피수(ASCN)를 기반으로 구성되는 유전체 복원 방법
|
16 |
16
제1항에 있어서,상기 대립 유전자 특이적(Allele-specific) 중단점 그래프는 균형 노드 및 불균형 노드로 구성되는 유전체 복원 방법
|
17 |
17
제1항에 있어서,상기 4) 일배체형(Haplotype) 중단점 그래프를 구성하는 단계는상기 단계 3)의 대립 유전자 특이적(Allele-specific) 중단점 그래프로부터 일배체형 세그먼트를 정의하는 단계;균형 이형접합 SNP 및 불균형 이형접합 SNP를 위상화(phasing)하는 단계;정수 프로그래밍에 의하여 일배체형(Haplotype) 중단점 그래프를 구성하는 단계를 포함하는 유전체 복원 방법
|
18 |
18
제1항에 있어서,상기 오일러 경로를 열거하는 단계는 다중경로 트리 구조(multiway tree structure)를 사용하여 중단점 그래프 에지를 페어링하는 유전체 복원 방법
|
19 |
19
제18항에 있어서,상기 오일러 경로의 열거는 최소 엔트로피를 가진 오일러 경로를 우선시하는 유전체 복원 방법
|
20 |
20
제1항의 전장 유전체 데이터를 이용한 유전체 복원 방법을 수행하기 위해 컴퓨터로 실행시킬 수 있는 프로그램을 기록한 기록매체
|
21 |
21
제20항에 있어서, 상기 기록매체는 CD-ROM, DVD-ROM, 이동식 저장장치, ROM, 또는 RAM인 것을 특징으로 하는 기록매체
|
22 |
22
제20항에 있어서, 상기 기록매체에 기록된 정보는 컴파일된 바이너리 파일(binary file), 텍스트 파일, 또는 쉘 스크립트의 형태로 나타내는 것을 특징으로 하는, 기록매체
|