1 |
1
체성 돌연변이 검출 장치에 있어서,체성 돌연변이 검출 프로그램이 저장된 메모리; 및상기 체성 돌연변이 검출 프로그램을 실행하는 프로세서를 포함하되,상기 체성 돌연변이 검출 프로그램은 암조직 유전체 데이터와 정상 조직 유전체 데이터가 각각 상이한 비율로 혼합된 가상 암조직 유전체 데이터를 학습 데이터로 사용하여 체성 돌연 변이를 검출하는 기계 학습 모델을 이용하여 체성 돌연변이를 검출하는 것인, 체성 돌연변이 검출 장치
|
2 |
2
제 1 항에 있어서,상기 기계 학습 모델은상기 암조직 유전체 데이터에 대한 상기 정상 조직 유전체 데이터의 혼합 비율을 나타내는 정상세포 오염도가 0% 부터 100% 이내이고, 정상세포 오염도가 n%(n은 양수) 씩 균일하게 증가하도록 설정된 복수의 가상 암조직 유전체 데이터를 기초로 학습된 것인, 체성 돌연 변이 검출 장치
|
3 |
3
제 2 항에 있어서,상기 학습 데이터는 상기 각각의 정상세포 오염도를 갖는 각 가상 암조직 유전체 데이터를 서로 균등한 비율로 포함하는 것인, 체성 돌연 변이 검출 장치
|
4 |
4
제 2 항에 있어서,상기 기계 학습 모델은정상세포 오염도가 0%인 암조직 유전체 데이터에서 (100-m*n)%의 리드들을 비복원 임의추출하고, 정상세포 오염도가 100%인 정상조직 유전체 데이터에서 m*n%의 리드들을 비복원 임의 추출하여, 정상세포 오염도가 m*n%(m은 자연수)인 가상 암조직 유전체 데이터를 기초로 학습된 것인, 체성 돌연 변이 검출 장치
|
5 |
5
체성 돌연변이 검출 장치가 체성 돌연변이 검출을 위한 기계 학습 모델을 구축하는 방법에 있어서,정상세포 오염도가 0%인 암조직 유전체 데이터와 정상 세포 오염도가 100%인 정상 조직 유전체 데이터가 각각 상이한 비율로 혼합된 가상 유전체 데이터를 기초로 학습 데이터를 생성하는 단계; 및상기 학습 데이터를 이용하여 체성 돌연 변이를 검출하는 기계 학습 모델을 구축하는 단계를 포함하는, 기계 학습 모델 구축 방법
|
6 |
6
제 5 항에 있어서,상기 학습 데이터를 생성하는 단계는 상기 암조직 유전체 데이터에 대한 상기 정상 조직 유전체 데이터의 혼합 비율을 나타내는 정상세포 오염도가 0%부터 100% 이내이고, 정상세포 오염도가 n%(n은 양수) 씩 균일하게 증가하도록 설정된 복수의 가상 암조직 유전체 데이터를 생성하는 것인, 기계 학습 모델 구축 방법
|
7 |
7
제 6 항에 있어서,상기 학습 데이터는 상기 각각의 정상세포 오염도를 갖는 각 가상 암조직 유전체 데이터를 서로 균등한 비율로 포함하는 것인, 기계 학습 모델 구축 방법
|
8 |
8
제 6 항에 있어서,상기 학습 데이터를 생성하는 단계는, 정상세포 오염도가 0%인 암조직 유전체 데이터에서 (100-m*n)%의 리드들을 비복원 임의추출하고, 정상세포 오염도가 100%인 정상조직 유전체 데이터에서 m*n%의 리드들을 비복원 임의 추출하여, 정상세포 오염도가 m*n%(m은 자연수)인 가상 암조직 유전체 데이터를 생성하는 것인, 기계 학습 모델 구축 방법
|
9 |
9
체성 돌연변이 검출 장치를 이용한 체성 돌연 변이 검출 방법에 있어서,분석 대상 유전체 데이터를 수신하는 단계; 및상기 분석 대상 유전체 데이터를 체성 돌연변이 검출 프로그램의 기계 학습 모델에 입력하여 체성 돌연 변이를 추론하는 단계를 포함하되,상기 기계 학습 모델은 암조직 유전체 데이터와 정상 조직 유전체 데이터가 각각 상이한 비율로 혼합된 가상 암조직 유전체 데이터를 기초로 구축된 것인, 체성 돌연변이 검출 방법
|
10 |
10
제 9 항에 있어서,상기 기계 학습 모델은상기 암조직 유전체 데이터에 대한 상기 정상 조직 유전체 데이터의 혼합 비율을 나타내는 정상세포 오염도가 0% 부터 100% 이내이고, 정상세포 오염도가 n%(n은 양수) 씩 균일하게 증가하도록 설정된 복수의 가상 암조직 유전체 데이터를 기초로 학습된 것인, 체성 돌연 변이 검출 방법
|
11 |
11
제 10 항에 있어서,상기 기계 학습 모델은정상세포 오염도가 0%인 암조직 유전체 데이터에서 (100-m*n)%의 리드들을 비복원 임의추출하고, 정상세포 오염도가 100%인 정상조직 유전체 데이터에서 m*n%의 리드들을 비복원 임의 추출하여, 정상세포 오염도가 m*n%(m은 자연수)인 가상 암조직 유전체 데이터를 기초로 학습된 것인, 체성 돌연 변이 검출 방법
|