1 |
1
염기서열 분석 시 벡터 오염(vector contamination)을 동정하기 위하여, 하기의 단계를 실시하도록 컴퓨터 프로세서를 지시하는 지시사항(instructions)이 포함된(embodied) 컴퓨터-독해가능한(computer-readable) 저장 매체: (a) 대상샘플의 염기서열을 분석한 후 참조 지놈(reference genome) 서열과 매칭(matching)하여 매핑(mapping)하는 단계;(b) 상기 매핑 결과를 토대로 확인된 절단리드(clipped read) 중에서 벡터 백본 서열(vector backbone sequence)이 포함된 리드를 검출하는 단계; (c) 상기 단계 (b)에서 검출된 리드 중, 엑손 연결부(exon junction)를 포함하는 절단리드를 수집한 후 전사체 서열(transcript sequence)에 얼라인(alignment)하여, 샘플-유래(sample-originated) 리드 및 벡터-유래(vector-originated) 리드를 판단하는 단계; (d) 상기 단계 (c)의 벡터-유래 리드에서 변이된 대립유전자(mutated allele)를 계수하는 단계; 및 (e) 상기 변이된 대립유전자가 벡터-유래 리드 영역 내에서 우세하게 나타나는 경우 해당 변이를 벡터-유도성(vector-induced) 위양 변이(false positive variant)로 판단하는 단계
|
2 |
2
제 1 항에 있어서, 상기 단계 (a)에서 염기서열 분석방법은 차세대 염기서열 분석방법인 것을 특징으로 하는 저장매체
|
3 |
3
제 1 항에 있어서, 상기 단계 (a) 이후 단계 (b)를 실시하기 전에, 상기 단계 (a)의 염기서열 분석에서 비매핑된 리드(unmapped read)로 처리된 절단리드(clipped read)를 회복시켜 재매핑(remapping)하는 단계를 추가적으로 실시하는 것을 특징으로 하는 저장매체
|
4 |
4
제 3 항에 있어서, 상기 재매핑은 서열 매칭 알고리즘으로서 Burrows-Wheeler Aligner (BWA)을 사용하는 것을 특징으로 하는 저장매체
|
5 |
5
제 1 항에 있어서, 상기 단계 (b)는 절단리드 서열과 벡터 백본 서열을 포함하는 참조지놈 데이터베이스 서열을 얼라인(alignment)함으로써 실시하는 것을 특징으로 하는 저장매체
|
6 |
6
제 1 항에 있어서, 상기 단계 (b)의 벡터 백본 서열이 포함된 리드는 벡터 제한부위(vector restriction site)로부터 생성된 리드(vr-reads)인 것을 특징으로 하는 저장매체
|
7 |
7
제 1 항에 있어서, 상기 단계 (c)는 다음의 방법으로 실시되는 것을 특징으로 하는 저장매체: (ⅰ) 상기 얼라인 결과, 절단리드가 클리핑(clipping)없이 완전히 복원되어 매핑되는 경우 해당 절단리드를 벡터-유래 리드로 판단하고; 및 (ⅱ) 얼라인 결과, 절단리드가 엑손과 인트론 서열을 동시에 포함하거나 인트론 서열만을 포함하는 경우 해당 절단리드를 샘플-유래 리드로 판단한다
|
8 |
8
제 1 항에 있어서, 상기 단계 (c)는 엑손 서열만을 포함하고 엑손 연결부(exon junction)의 서열을 포함하지 않는 절단리드에 대하여 판단을 보류하는 단계를 추가적으로 실시하는 것을 특징으로 하는 저장매체
|
9 |
9
제 1 항에 있어서, 상기 단계 (c)의 벡터-유래 리드는 벡터 제한부위(vector restriction site)로부터 생성된 리드(vr-reads) 및 벡터 엑손 경계(vector exonic border)로부터 생성된 리드(ve-reads)인 것을 특징으로 하는 저장매체
|
10 |
10
제 1 항에 있어서, 상기 단계 (b) 이후 단계 (c)를 실시하기 전에, 상기 단계 (b)에서 검출된 리드의 매핑위치에 근거하여, 벡터 내 삽입체(insert)의 지놈 위치(genome position)를 예측하는 단계를 추가적으로 실시하는 것을 특징으로 하는 저장매체
|
11 |
11
제 10 항에 있어서, 상기 단계 (b)에서 검출된 리드는 벡터 제한부위(vector restriction site)로부터 생성된 리드(vr-reads)이고, 상기 vr-reads 를 하기 기준에 따라 분류하여, 3 이상의 조건에 해당되는 vr-reads 를 포함하는 지놈 위치의 경우 벡터 내 삽입체의 후보 지놈 위치로 판단하는 것을 특징으로 하는 저장매체: (ⅰ) 절단길이(clipped length) ≥ 20 , (ⅱ) 벡터-매칭된 서브서열(vector-matched subsequence)의 길이 ≥ 20, (ⅲ) 매핑 퀄리티(mapping quality) ≥ 30, (ⅳ) 리드 클리핑이 (중간부분이 아닌) 양 말단에서 나타남, (ⅴ) 절단된 서브서열(clipped subsequence)이 벡터 서열과 매칭됨, 및 (ⅵ) 메이트 리드(mate read)가 절단된 서브서열의 바깥쪽에서 매핑되지 않음
|
12 |
12
제 10 항에 있어서, 상기 단계 (c)는 상기 예측된 지놈 위치에 포함되는 리드 중에서 엑손 연결부(exon junction)를 포함하는 절단리드를 수집한 후 전사체 서열(transcript sequence)에 얼라인(alignment)함으로써 샘플-유래(sample-originated) 리드 및 벡터-유래(vector-originated) 리드를 판단하는 것을 특징으로 하는 저장매체
|
13 |
13
제 10 항에 있어서, 상기 단계 (d)는 엑손 서열 내에서 비-참조(non-reference) 뉴클레오타이드(B alleles)와 미스매치(mismatch)를 나타내는 리드 수를 카운팅함으로써 참(true) 돌연변이 및 벡터-유도성 위양 변이(vector-induced false variants)의 위치를 스크리닝하는 것을 특징으로 하는 저장매체
|
14 |
14
삭제
|
15 |
15
다음을 포함하는 염기서열 분석 시 벡터 오염(vector contamination)을 동정하기 위한 시스템:(a) 컴퓨터 프로세서; 및 (b) 제 1 항 내지 제 13 항 중 어느 한 항의 컴퓨터-독해가능한(computer-readable) 저장 매체
|