1 |
1
프로세서를 포함하는 NGS (Next Generation Sequencing) 디바이스에 구현되는, NGS 샘플 검증 방법으로서,미리 결정된 표적 SNP (single-nucleotide polymorphism) 사이트에 대한 서열 정보를 포함하는, 대상 샘플에 대한 복수의 NGS 데이터를 수신하는 단계;상기 표적 SNP 사이트에 대한 서열 정보를 기초로, 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 결정하는 단계, 및상기 동일 개체 유래 샘플 여부를 제공하는 단계를 포함하는, NGS 샘플 검증 방법
|
2 |
2
제1항에 있어서,상기 복수의 NGS 데이터는, WGS (whole genome sequencing), WES (whole exome sequencing) 파일, RNA 시퀀싱 (RNA sequencing) 파일, 및 표적 시퀀싱 (targeted sequencing) 파일 중 적어도 하나의 NGS 분석 방법에 따른 파일을 포함하고, 상기 복수의 NGS 데이터를 수신하는 단계 이후에,GMAF (global minor allele frequency) 의 수준, 개별 인구 내의 MAF, 및 SNP 사이트의 맵핑 능력 (mappability) 중 적어도 하나, 및 상기 NGS 분석 데이터의 종류를 기초로, 표적 SNP 사이트를 결정하는 단계를 더 포함하는, NGS 샘플 검증 방법
|
3 |
3
제2항에 있어서,상기 복수의 NGS 데이터가, 상기 WGS 분석 파일, 또는 상기 WES 분석 파일, 또는 상기 RNA 시퀀싱 분석 파일일 경우,상기 표적 SNP 사이트를 결정하는 단계는,상기 맵핑 능력이 미리 결정된 수준 이상인 SNP 사이트 중, 상기 GMAF가 0
|
4 |
4
제2항에 있어서,상기 복수의 NGS 데이터가 상기 표적 시퀀싱 분석 파일일 경우,상기 표적 SNP 사이트를 결정하는 단계는,상기 맵핑 능력이 미리 결정된 수준 이상인 SNP 사이트 중, 상기 개별 인구 내의 GMAF가 0
|
5 |
5
제1항에 있어서,상기 동일 개체 유래 샘플 여부를 결정하는 단계는,상기 복수의 NGS 데이터 각각의 상기 표적 SNP 사이트에 대한 서열 정보를 기초로, 유전자형 일치 점수 (genotype concordance score) 를 산출하는 단계, 및상기 유전자형 일치 점수를 기초로 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 결정하는 단계 포함하고,상기 제공하는 단계는,상기 복수의 NGS 데이터 중 동일 개체 유래 샘플로 결정된 NGS 데이터를 제공하는 단계를 포함하는, NGS 샘플 검증 방법
|
6 |
6
제5항에 있어서,상기 유전자형 일치 점수를 기초로 상기 동일 개체 유래 샘플 여부를 결정하는 단계는,상기 복수의 NGS 데이터 중 상기 유전자형 일치 점수가 0
|
7 |
7
제5항에 있어서,상기 복수의 NGS 데이터 중 상기 유전자형 일치 점수가 0
|
8 |
8
제7항에 있어서,상기 제공하는 단계는,상기 샘플과 매칭되지 않는 NGS 데이터를 더 제공하는 단계를 포함하는, NGS 샘플 검증 방법
|
9 |
9
제1항에 있어서,상기 복수의 NGS 데이터는 미리 결정된 파일명을 포함하고,상기 파일명을 기초로, 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 결정하는 단계를 더 포함하는, NGS 샘플 검증 방법
|
10 |
10
제9항에 있어서,상기 파일명을 기초로, 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 결정하는 단계는,상기 파일명을 기초로, 상기 복수의 NGS 데이터에 대한 유사도 점수를 산출하는 단계, 및상기 유사도 점수를 기초로 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 결정하는 단계를 포함하는, NGS 샘플 검증 방법
|
11 |
11
프로세서를 포함하는 NGS 디바이스에 구현되는 NGS 샘플 검증 방법으로서,미리 결정된 파일명을 포함하는, 대상 샘플에 대한 복수의 NGS 데이터를 수신하는 단계;상기 파일명을 기초로 상기 복수의 NGS 데이터에 대한 유사도 점수를 산출하는 단계, 및상기 유사도 점수를 기초로 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 결정하는 단계, 및상기 동일 개체 유래 샘플 여부를 제공하는 단계를 포함하는, NGS 샘플 검증 방법
|
12 |
12
제11항에 있어서,상기 파일명은 서로 상이한 구분 문자를 포함하고, 상기 유사도 점수를 산출하는 단계는,상기 구분 문자를 기초로, 상기 복수의 NGS 데이터 각각의 상기 파일명을 복수의 부분으로 분할하는 단계; 상기 복수의 부분에 대한 값의 출연 빈도를 산출하는 단계, 및상기 출연 빈도를 기초로 상기 복수의 NGS 데이터 중 선택된 두 개의 NGS 데이터의 유사도 점수를 산출하는 단계를 포함하는, NGS 샘플 검증 방법
|
13 |
13
제11항에 있어서,상기 파일명은 서로 상이한 구분 문자를 포함하고, 상기 유사도 점수를 산출하는 단계는,상기 구분 문자를 기초로, 상기 복수의 NGS 데이터 각각의 상기 파일명을 복수의 부분으로 분할하는 단계; 상기 복수의 부분에 대한 값의 분산 정도를 산출하는 단계, 및상기 분산 정도를 기초로 상기 복수의 NGS 데이터 중 선택된 두 개의 NGS 데이터의 유사도 점수를 산출하는 단계를 포함하는, NGS 샘플 검증 방법
|
14 |
14
제13항에 있어서,상기 분산 정도를 산출하는 단계는,상기 복수의 부분에 대한 값의 출연 빈도를 산출하는 단계,상기 출연 빈도를 기초로 분산 정도를 산출하는 단계를 포함하는, NGS 샘플 검증 방법
|
15 |
15
제13항에 있어서,상기 유사도 점수를 산출하는 단계는,상기 복수의 NGS 데이터 중 선택된 두 개의 NGS 데이터에 대하여, 상기 복수의 부분 중 선택된 하나의 부분에 대한 상기 값의 동일 여부 및 상기 분산 정도를 기초로, 상기 유사도 점수를 산출하는 단계를 포함하는, NGS 샘플 검증 방법
|
16 |
16
제11항에 있어서,상기 동일 개체 유래 샘플 여부를 결정하는 단계는,상기 복수의 NGS 데이터 중 선택된 두 개의 NGS에 대하여 산출된 상기 유사도 점수가 가장 높을 경우,상기 두 개의 NGS 데이터를 동일 개체 유래 샘플로 결정하는 단계를 더 포함하는, NGS 샘플 검증 방법
|
17 |
17
제11항에 있어서,상기 복수의 NGS 데이터는, 미리 결정된 표적 SNP 사이트에 대한 서열 정보를 포함하고, 상기 SNP 사이트에 대한 서열 정보를 기초로 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 결정하는 단계를 더 포함하는, NGS 샘플 검증 방법
|
18 |
18
제17항에 있어서,상기 SNP 사이트에 대한 서열 정보를 기초로, 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 결정하는 단계는,상기 복수의 NGS 데이터 각각의 상기 표적 SNP 사이트에 대한 서열 정보를 기초로, 유전자형 일치 점수를 산출하는 단계, 및상기 유전자형 일치 점수를 기초로 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 결정하는 단계를 포함하는, NGS 샘플 검증 방법
|
19 |
19
프로세서를 포함하는 NGS 디바이스에 구현되는 NGS 샘플 검증 방법으로서,미리 결정된 표적 SNP 사이트에 대한 서열 정보 및 미리 결정된 파일명을 포함하는, 대상 샘플에 대한 복수의 NGS 데이터를 수신하는 단계;상기 표적 SNP 사이트에 대한 서열 정보를 기초로, 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 제1 결정하는 단계; 상기 파일명을 기초로, 상기 복수의 NGS 데이터에 대한 유사도 점수를 산출하는 단계, 및상기 유사도 점수를 기초로 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 제2 결정하는 단계를 포함하는, NGS 샘플 검증 방법
|
20 |
20
NGS 샘플 검증용 디바이스로서, 미리 결정된 표적 SNP 사이트에 대한 서열 정보를 포함하는, 대상 샘플에 대한 복수의 NGS 데이터를 수신하도록 구성된 수신부, 및상기 수신부와 통신하도록 구성된 프로세서를 포함하고,상기 프로세서는, 상기 표적 SNP 사이트에 대한 서열 정보를 기초로, 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 결정하고, 상기 동일 개체 유래 샘플 여부를 제공하도록 구성된, NGS 샘플 검증용 디바이스
|
21 |
21
제20항에 있어서,상기 복수의 NGS 데이터는 WGS 파일, WES 파일, RNA 시퀀싱 파일, 및 표적 시퀀싱 파일 중 적어도 하나의 NGS 분석 방법에 따른 파일을 포함하고, 상기 프로세서는, GMAF의 수준, 개별 인구 내의 MAF, 및 SNP 사이트의 맵핑 능력 중 적어도 하나, 및 상기 NGS 분석 데이터의 종류 기초로, 표적 SNP 사이트를 결정하도록 더 구성된, NGS 샘플 검증용 디바이스
|
22 |
22
NGS 샘플 검증용 디바이스로서, 미리 결정된 파일명을 포함하는, 대상 샘플에 대한 복수의 NGS 데이터를 수신하도록 구성된 수신부, 및상기 수신부와 통신하도록 구성된 프로세서를 포함하고,상기 프로세서는,상기 파일명을 기초로 상기 복수의 NGS 데이터에 대한 유사도 점수를 산출하고, 상기 유사도 점수를 기초로 상기 복수의 NGS 데이터의 동일 개체 유래 샘플 여부를 결정하고, 상기 동일 개체 유래 샘플 여부를 제공하도록 구성된, NGS 샘플 검증용 디바이스
|
23 |
23
제22항에 있어서,상기 파일명은 서로 상이한 구분 문자를 포함하고, 상기 프로세서는,상기 구분 문자를 기초로, 상기 복수의 NGS 데이터 각각의 상기 파일명을 복수의 부분으로 분할하고, 상기 복수의 부분에 대한 값의 출연 빈도를 산출하고, 상기 출연 빈도를 기초로 상기 복수의 NGS 데이터 중 선택된 두 개의 NGS 데이터에 대한 유사도 점수를 산출하도록 더 구성된, NGS 샘플 검증용 디바이스
|
24 |
24
제22항에 있어서,상기 파일명은 서로 상이한 구분 문자를 포함하고, 상기 프로세서는,상기 구분 문자를 기초로, 상기 복수의 NGS 데이터 각각의 상기 파일명을 복수의 부분으로 분할하고, 상기 복수의 부분에 대한 값의 분산 정도를 산출하고, 상기 분산 정도를 기초로 상기 복수의 NGS 데이터 중 선택된 두 개의 NGS 데이터에 대한 유사도 점수를 산출하도록 더 구성된, NGS 샘플 검증용 디바이스
|