1 |
1
RNA-가이드 뉴클레아제의 활성 데이터를 입력받는 정보 입력부;상기 정보 입력부에서 입력 받은 데이터를 이용하여 활성 예측 모델을 생성하는 활성 예측 모델 생성부; RNA-가이드 뉴클레아제의 후보 표적 서열을 입력받는 후보 서열 입력부; 상기 후보 서열 입력부에 입력된 후보 표적 서열을 상기 활성 예측 모델 생성부에서 생성된 활성 예측 모델에 적용하여 RNA-가이드 뉴클레아제의 활성을 예측하는 활성 예측부;상기 후보 표적 서열의 염색질 접근성 정보 입력부; 및상기 입력된 염색질 접근성 정보를 이용하여 상기 활성 예측부에서 예측된 RNA-가이드 뉴클레아제의 활성을 최적화(fine-tuning)하는 미세 조정부를 포함하는 RNA-가이드 뉴클레아제의 활성 예측 시스템으로서, 상기 활성 예측 모델 생성부는 컨볼루션 신경망(convolutional neural network, CNN)을 기반으로 하여 표적 서열과 인델 빈도 간의 관계를 학습하는 딥-러닝을 수행하는 것인,RNA-가이드 뉴클레아제의 활성 예측 시스템
|
2 |
2
제1항에 있어서,상기 RNA-가이드 뉴클레아제의 활성 데이터는 RNA-가이드 뉴클레아제에 의한 표적 서열에서의 인델 빈도로 나타내지는 것인,RNA-가이드 뉴클레아제의 활성 예측 시스템
|
3 |
3
제2항에 있어서, 상기 RNA-가이드 뉴클레아제의 활성 데이터는 (a) 가이드 RNA를 코딩하는 염기서열 및 상기 가이드 RNA가 목적하는 표적 염기서열을 포함하는 올리고뉴클레오티드를 포함하는 세포 라이브러리에 RNA-가이드 뉴클레아제를 도입하는 단계;(b) 상기 RNA-가이드 뉴클레아제가 도입된 세포 라이브러리로부터 수득한 DNA를 이용하여 딥 시퀀싱을 수행하는 단계; 및(c) 상기 딥 시퀀싱으로 수득한 데이터로부터 각 표적 서열의 인델 빈도를 검출하는 단계를 통해 수득된 것인, RNA-가이드 뉴클레아제의 활성 예측 시스템
|
4 |
4
삭제
|
5 |
5
제1항에 있어서,상기 활성 예측 모델 생성부는 (a) 표적 서열과 인델 빈도 간의 관계를 추출하는 특징 추출 모듈; 및 (b) 상기 특징 추출 모듈에서 추출된 특징을 조합하는 조합 모듈을 포함하는 것인, RNA-가이드 뉴클레아제의 활성 예측 시스템
|
6 |
6
제1항에 있어서,상기 활성 예측부는 RNA-가이드 뉴클레아제에 의한 후보 표적 서열의 인델 빈도를 예측하는 것인,RNA-가이드 뉴클레아제의 활성 예측 시스템
|
7 |
7
삭제
|
8 |
8
제1항에 있어서, 상기 RNA-가이드 뉴클레아제의 활성 예측 시스템은 활성 예측부에서 예측된 RNA-가이드 뉴클레아제의 활성을 출력하는 출력부를 추가로 포함하는 것인,RNA-가이드 뉴클레아제의 활성 예측 시스템
|
9 |
9
제1항에 있어서, 상기 RNA-가이드 뉴클레아제는 Cpf1 단백질인 것인,RNA-가이드 뉴클레아제의 활성 예측 시스템
|
10 |
10
제9항에 있어서, 상기 Cpf1 단백질은 캔디다투스 파세이박터 (Candidatus Paceibacter), 라치노스피라 (Lachnospira) 속, 뷰티리비브리오 (Butyrivibrio) 속, 페레그리니박테리아 (Peregrinibacteria), 액시다미노코쿠스 (Acidaminococcus) 속, 포르파이로모나스 (Porphyromonas) 속, 프레보텔라 (Prevotella) 속, 프란시셀라 (Francisella) 속, 캔디다투스 메타노플라스마 (Candidatus Methanoplasma), 및 유박테리움 (Eubacterium) 속으로 이루어진 군에서 선택되는 하나 이상의 유래인 것인, RNA-가이드 뉴클레아제의 활성 예측 시스템
|
11 |
11
제1항에 있어서,상기 후보 표적 서열은 34개 내지 50개의 뉴클레오티드로 구성된 것인, RNA-가이드 뉴클레아제의 활성 예측 시스템
|
12 |
12
제11항에 있어서,상기 후보 표적 서열은 PAM, 및 프로토스페이서 서열을 포함하는 것인, RNA-가이드 뉴클레아제의 활성 예측 시스템
|
13 |
13
제1항에 있어서, 상기 RNA-가이드 뉴클레아제의 활성 예측 시스템은 RNA-가이드 뉴클레아제의 활성 데이터가 저장된 데이터베이스를 추가로 포함하는 것으로서,상기 정보 입력부는 상기 데이터베이스로부터 RNA-가이드 뉴클레아제의 활성 데이터를 입력받는 것인,RNA-가이드 뉴클레아제의 활성 예측 시스템
|
14 |
14
(a) 표적 서열에서의 RNA-가이드 뉴클레아제의 활성 데이터를 수득하여 활성 데이터 세트를 수득하는 단계; (b) 상기 활성 데이터 세트를 이용하여 컨볼루션 신경망 (convolutional neural network, CNN) 기반 딥 러닝을 수행하여 RNA-가이드 뉴클레아제의 활성 예측 시스템을 구축하는 단계; 및(c) 표적 서열의 염색질 접근성을 이용하여 상기 구축된 예측 시스템을 조정하는 단계를 포함하는 RNA-가이드 뉴클레아제의 활성 예측 시스템을 구축하는 방법
|
15 |
15
제14항에 있어서,상기 활성 데이터를 수득하는 단계는(1) 가이드 RNA를 코딩하는 염기서열 및 상기 가이드 RNA가 목적하는 표적 염기서열을 포함하는 올리고뉴클레오티드를 포함하는 세포 라이브러리에 RNA-가이드 뉴클레아제를 도입하는 단계;(2) 상기 RNA-가이드 뉴클레아제가 도입된 세포 라이브러리로부터 수득한 DNA를 이용하여 딥 시퀀싱을 수행하는 단계; 및(3) 상기 딥 시퀀싱으로 수득한 데이터로부터 각 표적 서열의 인델 빈도를 검출하는 단계를 포함하는 것인,RNA-가이드 뉴클레아제의 활성 예측 시스템을 구축하는 방법
|
16 |
16
제15항에 있어서,상기 올리고뉴클레오티드는 가이드 RNA 암호화 서열, 바코드 서열, 및 표적 염기서열을 포함하는 것인, RNA-가이드 뉴클레아제의 활성 예측 시스템을 구축하는 방법
|
17 |
17
제15항에 있어서, 상기 가이드 RNA는 crRNA (CRISPR RNA)를 포함하는 것인, RNA-가이드 뉴클레아제의 활성 예측 시스템을 구축하는 방법
|
18 |
18
제14항에 있어서,상기 (b) 단계 이후, (c) 중첩 교차 유효성 검사 (nested cross-validation, CV)를 통해 구축된 예측 시스템을 검증하는 단계를 추가로 포함하는,RNA-가이드 뉴클레아제의 활성 예측 시스템을 구축하는 방법
|
19 |
19
삭제
|
20 |
20
제14항에 있어서, 상기 염색질 접근성은 표적 서열의 DNase I에 대한 민감성으로부터 계산되는 것인, RNA-가이드 뉴클레아제의 활성 예측 시스템을 구축하는 방법
|
21 |
21
RNA-가이드 뉴클레아제의 후보 표적 서열을 설계하는 단계; 및상기 설계된 RNA-가이드 뉴클레아제의 후보 표적 서열을 제1항 내지 제3항, 제5항 내지 제6항, 및 제8항 내지 제13항 중 어느 한 항의 활성 예측 시스템에 적용하여 RNA-가이드 뉴클레아제의 활성을 예측하는 단계를 포함하는,RNA-가이드 뉴클레아제의 활성 예측 방법
|
22 |
22
삭제
|
23 |
23
삭제
|
24 |
24
삭제
|
25 |
25
삭제
|
26 |
26
제21항에 따른 방법을 컴퓨터로 실행하기 위한 프로그램이 기록된 컴퓨터 판독가능 기록매체
|