1 |
1
돌연변이를 검출하는 장치에 있어서,뉴럴 네트워크를 구현하기 위한 소프트웨어를 저장하는 메모리; 및상기 소프트웨어를 실행함으로써 돌연변이를 검출하는 프로세서를 포함하고,상기 프로세서는,검출 대상 조직으로부터 추출되는 제1 유전체 데이터 및 정상 조직으로부터 추출되는 제2 유전체 데이터를 생성하고,상기 제1 유전체 데이터 및 상기 제2 유전체 데이터에 대한 전처리를 수행하여 이미지 데이터를 추출하고,시퀀싱 플랫폼(sequencing platform)에 특이적으로 발생하는 긍정 오류(false positive)를 정정하도록 학습되는 상기 뉴럴 네트워크를 통해 상기 이미지 데이터에 기초하여 상기 검출 대상 조직의 돌연변이를 검출하는, 장치
|
2 |
2
제 1항에 있어서,상기 뉴럴 네트워크는,정상적으로 검출되는 정상 돌연변이에 관한 학습 데이터를 나타내는 제1 학습 이미지 데이터 및 상기 긍정 오류로 인한 오검출 돌연변이에 관한 학습 데이터를 나타내는 제2 학습 이미지 데이터에 기초하여 상기 정상 돌연변이 및 상기 오검출 돌연변이를 구별하도록 학습되는, 장치
|
3 |
3
제 2항에 있어서,상기 제1 학습 이미지 데이터 및 상기 제2 학습 이미지 데이터는,동일한 학습용 조직에 대한 롱 리드 시퀀싱(long read sequencing) 및 숏 리드 시퀀싱(short read sequencing)의 결과에 기초하여 생성되는, 장치
|
4 |
4
제 2항에 있어서,상기 제1 학습 이미지 데이터 및 상기 제2 학습 이미지 데이터는,유전자 서열(gene sequence), 삽입/결실(indel, insertion/deletion) 및 매핑 퀄리티(mapping quality) 중 적어도 하나를 포함하는, 장치
|
5 |
5
제 1항에 있어서,상기 뉴럴 네트워크는,상기 이미지 데이터로부터 피쳐(feature)를 추출하고, 상기 피쳐에 기초하여 상기 검출 대상 조직의 유전자들이 돌연변이에 해당할 확률을 계산하는 컨볼루셔널 뉴럴 네트워크(CNN, convolutional neural network)인, 장치
|
6 |
6
제 1항에 있어서,상기 프로세서는,매핑 퀄리티 및 심도(depth)에 기초하여 상기 제1 유전체 데이터 및 상기 제2 유전체 데이터를 보정함으로써, 상기 전처리를 수행하는, 장치
|
7 |
7
제 1항에 있어서,상기 검출 대상 조직으로부터 검출되는 돌연변이는 체성 단일 염기 돌연변이(sSNV, somatic single nucleotide variant)인, 장치
|
8 |
8
뉴럴 네트워크를 구현하기 위한 소프트웨어를 실행함으로써 돌연변이를 검출하는 방법에 있어서,검출 대상 조직으로부터 추출되는 제1 유전체 데이터 및 정상 조직으로부터 추출되는 제2 유전체 데이터를 생성하는 단계;상기 제1 유전체 데이터 및 상기 제2 유전체 데이터에 대한 전처리를 수행하여 이미지 데이터를 추출하는 단계; 및시퀀싱(sequencing platform)에 특이적으로 발생하는 긍정 오류(false positive)를 정정하도록 학습되는 상기 뉴럴 네트워크를 통해 상기 이미지 데이터에 기초하여 상기 검출 대상 조직의 돌연변이를 검출하는 단계를 포함하는, 방법
|
9 |
9
제 8항에 있어서,상기 뉴럴 네트워크는,정상적으로 검출되는 정상 돌연변이에 관한 학습 데이터를 나타내는 제1 학습 이미지 데이터 및 상기 긍정 오류로 인한 오검출 돌연변이에 관한 학습 데이터를 나타내는 제2 학습 이미지 데이터에 기초하여 상기 정상 돌연변이 및 상기 오검출 돌연변이를 구별하도록 학습되는, 방법
|
10 |
10
제 9항에 있어서,상기 제1 학습 이미지 데이터 및 상기 제2 학습 이미지 데이터는,동일한 학습용 조직에 대한 롱 리드 시퀀싱(long read sequencing) 및 숏 리드 시퀀싱(short read sequencing)의 결과에 기초하여 생성되는, 방법
|
11 |
11
제 9항에 있어서,상기 제1 학습 이미지 데이터 및 상기 제2 학습 이미지 데이터는,유전자 서열(gene sequence), 삽입/결실(indel, insertion/deletion) 및 매핑 퀄리티(mapping quality) 중 적어도 하나를 포함하는, 방법
|
12 |
12
제 8항에 있어서,상기 뉴럴 네트워크는,상기 이미지 데이터로부터 피쳐(feature)를 추출하고, 상기 피쳐에 기초하여 상기 검출 대상 조직의 유전자들이 돌연변이에 해당할 확률을 계산하는 컨볼루셔널 뉴럴 네트워크(CNN, convolutional neural network)인, 방법
|
13 |
13
제 8항에 있어서,상기 이미지 데이터를 추출하는 단계는,매핑 퀄리티 및 심도(depth)에 기초하여 상기 제1 유전체 데이터 및 상기 제2 유전체 데이터를 보정함으로써, 상기 전처리를 수행하는 단계를 포함하는, 방법
|
14 |
14
제 8항에 있어서,상기 검출 대상 조직으로부터 검출되는 돌연변이는 체성 단일 염기 돌연변이(sSNV, somatic single nucleotide variant)인, 방법
|