1 |
1
유전자 스크리닝 시퀀싱 데이터 내 다수의 염기서열정보(read)로부터, 특정 서열 조각의 확장된 서열 범위를 기반으로 비 라이브러리 및 라이브러리 영역으로 구분되는 데이터 포맷을 예측하는 포맷예측부; 상기 예측한 데이터 포맷을 근거로, 상기 유전자 스크리닝 시퀀싱 데이터로부터 라이브러리 별로 영역의 주변 서열을 추출하는 주변서열추출부; 입력 시퀀싱 데이터에 대하여, 상기 추출한 라이브러리별 주변 서열 간의 위치 및 간격과 상기 예측한 데이터 포맷에 따른 라이브러리 간 위치 중 적어도 하나를 근거로 시퀀싱 데이터 분석에 사용할 라이브러리 서열 영역을 확인하는 라이브러리서열추출부;추출된 라이브러리 서열의 타겟 유전자를 예측하는 타겟예측부; 및shRNA 데이터에 대해서는, 맵핑된 라이브러리 영역 중에서 sense와 anti-sense 간 hairpin 구조 형성 가능성을 예측하여 타겟 유전자 기능 발현 억제 가능성을 판단하는 기능억제예측부를 포함하는 것을 특징으로 하는 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치
|
2 |
2
제 1 항에 있어서,상기 포맷예측부는,유전자 스크리닝 시퀀싱 데이터 내 다수의 read 별로, 일정 길이의 서열 조각을 생성하고,상기 다수의 read에서 가장 높은 포함 빈도를 갖는 상기 특정 서열 조각을 선택하여, 선택한 특정 서열 조각을 중심으로 read 간 클러스터링하고,상기 클러스터링한 read에 대해, 상기 특정 서열 조각을 기준으로 정렬한 후 상기 특정 서열 조각의 서열 범위를 양방향으로 확장하며, 상기 일정 길이의 서열 조각 생성부터 선택한 특정 서열 조각의 서열 범위 확장까지의 과정을 반복하여 상기 특정 서열 조각의 서열 범위를 양방향으로 확장하는 과정을 반복하고, 상기 특정 서열 조각의 확장된 서열 범위를 기반으로 비 라이브러리 및 라이브러리 영역으로 구분하는 것을 특징으로 하는 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치
|
3 |
3
제 2 항에 있어서,상기 포맷예측부는,상기 클러스터링한 read에 대해, 상기 특정 서열 조각의 서열 범위를 서열 범위 내 서열 유사도가 기 설정된 일정 기준치가 될때까지 단계적으로 확장하는 것을 특징으로 하는 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치
|
4 |
4
제 3 항에 있어서,상기 기 설정된 일정 기준치는,상기 비 라이브러리 및 라이브러리 영역 구분과 상기 라이브러리 서열 영역 확인의 정확도와 관련하여 기 설정되는 값인 것을 특징으로 하는 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치
|
5 |
5
제 2 항에 있어서,상기 주변서열추출부는,상기 클러스터링한 read로부터, 상기 예측한 데이터 포맷에 따라 구분된 라이브러리 별로 영역의 좌/우측 주변 서열 및 라이브러리 길이를 추출하는 것을 특징으로 하는 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치
|
6 |
6
제 1 항에 있어서,상기 라이브러리서열추출부는,상기 추출한 라이브러리별 좌/우측 주변 서열 간 위치 및 간격을 기준으로, 상기 입력 시퀀싱 데이터에서 특정 라이브러리의 좌/우측 주변 서열 간 위치 및 간격이 매칭되는 좌/우측 주변 서열 내의 서열 영역을, 상기 특정 라이브러리의 라이브러리 서열 영역으로서 확인하는 것을 특징으로 하는 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치
|
7 |
7
제 6 항에 있어서,상기 라이브러리서열추출부는,상기 예측한 데이터 포맷에 따른 라이브러리 간 위치를 기준으로, 상기 좌/우측 주변 서열 기준의 매칭을 통해 확인되는 2 이상의 서열 영역 간 위치가 상기 예측한 데이터 포맷에 따른 라이브러리 간 위치와 매칭되는 경우, 상기 2 이상의 서열 영역을 각기 해당 라이브러리의 서열 영역으로서 확인하는 것을 특징으로 하는 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치
|
8 |
8
제 1 항에 있어서,상기 타겟예측부는,상기 확인한 라이브러리 서열 영역의 라이브러리 서열을 관련 유전체 또는 전사체 레퍼런스(reference)에 맵핑(mapping)하여, 맵핑 결과가 타겟 유전자 분석에 활용될 수 있게 하는 것을 특징으로 하는 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치
|
9 |
9
제 1 항에 있어서,상기 기능억제예측부는,shRNA 관련 제1,제2 라이브러리 서열에 대하여, sense 및 anti-sense 서열을 구분하고 레퍼런스에 맵핑 시에 상기 sense 서열 또는 상기 anti-sense 서열의 라이브러리 서열을 선택적으로 사용하는 것을 특징으로 하는 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치
|
10 |
10
제 9 항에 있어서,상기 기능억제예측부는,상기 shRNA 관련 제1,제2 라이브러리 서열에 대해, 회문(palindrome) 구조의 루프(loop)를 기준으로 라이브러리 간 상보 결합이 가능한 경우 sense 및 anti-sense 서열로 판단하고,TT 또는 AA의 2bp 서열이 더 존재하는 라이브러리 서열을 anti-sense 서열, 나머지 라이브러리 서열을 sense 서열로 구분하는 것을 특징으로 하는 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치
|
11 |
11
제 9 항에 있어서,상기 기능억제예측부는,shRNA 관련 제1,제2 라이브러리 서열에 대하여, sense 및 anti-sense 서열 간 상보 결합이 불가능한 경우 상기 레퍼런스에 맵핑 시 필터링하는 것을 특징으로 하는 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치
|
12 |
12
유전자 스크리닝 시퀀싱 데이터 내 다수의 염기서열정보(read)로부터, 특정 서열 조각의 확장된 서열 범위를 기반으로 비 라이브러리 및 라이브러리 영역으로 구분되는 데이터 포맷을 예측하는 포맷예측단계;상기 예측한 데이터 포맷을 근거로, 상기 유전자 스크리닝 시퀀싱 데이터로부터 라이브러리 별로 영역의 주변 서열을 추출하는 주변서열추출단계; 및입력 시퀀싱 데이터에 대하여, 상기 추출한 라이브러리별 주변 서열 간의 위치 및 간격과 상기 예측한 데이터 포맷에 따른 라이브러리 간 위치 중 적어도 하나를 근거로 시퀀싱 데이터 분석에 사용할 라이브러리 서열 영역을 확인하는 라이브러리서열추출단계; 추출된 라이브러리 서열의 타겟 유전자를 예측하는 타겟예측단계; 및shRNA 데이터에 대해서는, 맵핑된 라이브러리 영역 중에서 sense와 anti-sense 간 hairpin 구조 형성 가능성을 예측하여 타겟 유전자 기능 발현 억제 가능성을 판단하는 기능억제예측단계를 실행시키기 위해 매체에 저장된 컴퓨터 프로그램
|
13 |
13
제 12 항에 있어서,상기 포맷예측단계는,유전자 스크리닝 시퀀싱 데이터 내 다수의 read 별로, 일정 길이의 서열 조각을 생성하고,상기 다수의 read에서 가장 높은 포함 빈도를 갖는 상기 특정 서열 조각을 선택하여, 선택한 특정 서열 조각을 중심으로 read 간 클러스터링하고,상기 클러스터링한 read에 대해, 상기 특정 서열 조각을 기준으로 정렬한 후 상기 특정 서열 조각의 서열 범위를 양방향으로 확장하며, 상기 일정 길이의 서열 조각 생성부터 선택한 특정 서열 조각의 서열 범위 확장까지의 과정을 반복하여 상기 특정 서열 조각의 서열 범위를 양방향으로 확장하는 과정을 반복하고, 상기 특정 서열 조각의 확장된 서열 범위를 기반으로 비 라이브러리 및 라이브러리 영역으로 구분하는 것을 특징으로 하는 컴퓨터 프로그램
|
14 |
14
제 13 항에 있어서,상기 포맷예측단계는,상기 클러스터링한 read에 대해, 상기 특정 서열 조각의 서열 범위를 서열 범위 내 서열 유사도가 기 설정된 일정 기준치가 될때까지 단계적으로 확장하는 것을 특징으로 하는 컴퓨터 프로그램
|
15 |
15
제 13 항에 있어서,상기 주변서열추출단계는,상기 클러스터링한 read로부터, 상기 예측한 데이터 포맷에 따라 구분된 라이브러리 별로 영역의 좌/우측 주변 서열 및 라이브러리 길이를 추출하는 것을 특징으로 하는 컴퓨터 프로그램
|
16 |
16
제 12 항에 있어서,상기 라이브러리서열추출단계는,상기 추출한 라이브러리별 좌/우측 주변 서열 간 위치 및 간격을 기준으로, 상기 입력 시퀀싱 데이터에서 특정 라이브러리의 좌/우측 주변 서열 간 위치 및 간격이 매칭되는 좌/우측 주변 서열 내의 서열 영역을, 상기 특정 라이브러리의 라이브러리 서열 영역으로서 확인하며,상기 예측한 데이터 포맷에 따른 라이브러리 간 위치를 기준으로, 상기 좌/우측 주변 서열 기준의 매칭을 통해 확인되는 2 이상의 서열 영역 간 위치가 상기 예측한 데이터 포맷에 따른 라이브러리 간 위치와 매칭되는 경우, 상기 2 이상의 서열 영역을 각기 해당 라이브러리의 서열 영역으로서 확인하는 것을 특징으로 하는 컴퓨터 프로그램
|
17 |
17
제 12 항에 있어서,상기 타겟예측단계는,상기 확인한 라이브러리 서열 영역의 라이브러리 서열을 관련 레퍼런스(reference)에 맵핑(mapping)하여, 맵핑 결과가 타겟 유전자 분석에 활용될 수 있게 하는 것을 특징으로 하는 컴퓨터 프로그램
|
18 |
18
제 12 항에 있어서,상기 기능억제예측단계는,shRNA 관련 제1,제2 라이브러리 서열에 대하여, sense 및 anti-sense 서열을 구분하고 레퍼런스에 맵핑 시에 상기 sense 서열 또는 상기 anti-sense 서열의 라이브러리 서열을 선택적으로 사용하는 것을 특징으로 하는 컴퓨터 프로그램
|
19 |
19
제 18 항에 있어서,상기 기능억제예측단계는,상기 shRNA 관련 제1,제2 라이브러리 서열에 대해, 회문(palindrome) 구조의 루프(loop)를 기준으로 라이브러리 간 상보 결합이 가능한 경우 sense 및 anti-sense 서열로 판단하고,TT 또는 AA의 2bp 서열이 더 존재하는 라이브러리 서열을 anti-sense 서열, 나머지 라이브러리 서열을 sense 서열로 구분하는 것을 특징으로 하는 컴퓨터 프로그램
|
20 |
20
제 18 항에 있어서,상기 기능억제예측단계는,shRNA 관련 제1,제2 라이브러리 서열에 대하여, sense 및 anti-sense 서열 간 상보 결합이 불가능한 경우 레퍼런스에 맵핑 시 필터링하는 것을 특징으로 하는 컴퓨터 프로그램
|
21 |
21
유전자 스크리닝 시퀀싱 데이터 내 다수의 염기서열정보(read)로부터, 특정 서열 조각의 확장된 서열 범위를 기반으로 비 라이브러리 및 라이브러리 영역으로 구분되는 데이터 포맷을 예측하는 포맷예측단계;상기 예측한 데이터 포맷을 근거로, 상기 유전자 스크리닝 시퀀싱 데이터로부터 라이브러리 별로 영역의 주변 서열을 추출하는 주변서열추출단계; 및입력 시퀀싱 데이터에 대하여, 상기 추출한 라이브러리별 주변 서열 간의 위치 및 간격과 상기 예측한 데이터 포맷에 따른 라이브러리 간 위치 중 적어도 하나를 근거로 시퀀싱 데이터 분석에 사용할 라이브러리 서열 영역을 확인하는 라이브러리서열추출단계; 추출된 라이브러리 서열의 타겟 유전자를 예측하는 타겟예측단계; 및shRNA 데이터에 대해서는, 맵핑된 라이브러리 영역 중에서 sense와 anti-sense 간 hairpin 구조 형성 가능성을 예측하여 타겟 유전자 기능 발현 억제 가능성을 판단하는 기능억제예측단계를 포함하는 것을 특징으로 하는 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치의 동작 방법
|