1 |
1
전사조절 네트워크(transcriptional regulatory networks, TRNs) 데이터베이스를 기반으로 하여, 전사 인자(transcriptional factors, TFs) 및 타겟 유전자 간의 조절 상호작용(regulatory interaction)에 대한 예측을 실시하도록 컴퓨터 프로세서를 지시하는 지시사항(instructions)이 포함된(embodied) 컴퓨터-독해가능한(computer-readable) 저장 매체로서, 상기 저장 매체는 쿼리 전사 인자(query transcriptional factor) 또는 쿼리 타겟 유전자(query target gene)에 대하여 조절 상호작용 예측을 실시하며, 상기 전사조절 네트워크는 문장-기반 텍스트 마이닝(Sentence-based text mining)을 통하여 문헌-큐레이트된(literature-curated) 인간 전사조절 네트워크이고, 상기 전사조절 네트워크는 상기 타겟 유전자 간의 네트워크에 대한 정보를 포함하는 것을 특징으로 하는 저장매체로서,상기 전사조절 네트워크 데이터베이스는 다음의 단계에 의해 구축되는 것을 특징으로 하는 저장매체:(a) Medline (Medical Literature Analysis and Retrieval System Online) 데이터로부터, MeSH (Medical Subject Headings) 기술어 “Humans' 을 포함하는 abstract를 추출하는 단계;(b) 상기 단계 (a)에서 추출된 abstract 중 전자인자(Transcription Factor, TF) 이름이 하나 이상 포함되고 두 개 이상의 유전자 이름을 포함하는 abstract를 추출하는 단계;(c) 상기 단계 (b)에서 추출된 abstract 중 전사 조절 연구와 관련된 단일 또는 조합된 키워드를 포함하는 abstract를 추출하는 단계;(d) 상기 단계 (c)에서 추출된 abstract 중 유전자 이름, 인간 유전자 또는 전사조절과 무관한 abstract를 제외시키는 수동 큐레이션(manual curation)을 실시하는 단계; 및(e) 상기 단계 (d)에서 추출된 abstract 의 문장(sentence)으로부터 전사인자 및 타겟 유전자의 조절 상호작용을 동정하여 전사조절 네트워크 데이터베이스를 구축하는 단계
|
2 |
2
제 1 항에 있어서, 상기 전사조절 네트워크는 상기 타겟 유전자의 전사 활성(activation) 또는 억제(repression)에 대한 정보인 TF-타겟 상호작용의 조절모드(mode-of-regulation) 정보를 포함하는 것을 특징으로 하는 저장매체
|
3 |
3
삭제
|
4 |
4
제 1 항에 있어서, 상기 전사조절 네트워크는 전사 인자 또는 타겟 유전자와 연관된 질병(disease), 신호전달경로(pathway) 또는 생물학적 공정(biological process)에 대한 정보를 포함하는 것을 특징으로 하는 저장매체
|
5 |
5
제 4 항에 있어서, 상기 저장매체는 전사 인자 또는 타겟 유전자와 연관된 상기 질병(disease), 신호전달경로(pathway) 또는 생물학적 공정에 대한 우선순위결정을 수행하는 것을 특징으로 하는 저장매체
|
6 |
6
삭제
|
7 |
7
제 1 항에 있어서, 상기 단계 (d)는 다음 단계를 추가적으로 실시하는 것을 특징으로 하는 저장매체:(ⅰ) 상기 단계 (d)에서 추출된 abstract 의 후보 문장(sentence)들을 Gold Standard Positives와 Gold Standard Negatives로 분류하는 단계;(ⅱ) 상기 단계 (ⅰ)에서 분류된 후보 문장에 포함된 단어(word)들이 Gold Standard Positives와 Gold Standard Negatives에서 나타난 빈도를 통해 나머지 후보 문장들의 우선순위를 정하는 단계;(ⅲ) 상기 단계 (ⅱ)에서 우선순위대로 나열된 문장들을 가장 높은 우선순위의 문장부터 유전자 이름, 인간 유전자 또는 전사조절과 무관한 abstract를 제외시키는 수동 큐레이션(manual curation)을 실시하는 단계; 및(ⅳ) 상기 단계 (ⅲ)에서 추출된 abstract 의 문장(sentence)으로부터 전사인자 및 타겟 유전자의 조절 상호작용을 동정하여 전사조절 네트워크 데이터베이스를 구축하는 단계
|
8 |
8
제 1 항에 있어서, 상기 단계 (c)의 키워드는 ‘regulate’, ‘control’, ‘bind’, ‘activate’, ‘enhance’, ‘induce’, ‘repress’, ‘inhibit’, ‘transcription factor’, ‘expression’, ‘promoter’, ‘mRNA’ 및 ‘target’으로 구성된 군에서 선택된 1 이상의 키워드인 것을 특징으로 하는 저장매체
|
9 |
9
제 7 항에 있어서, 상기 단계 (ⅱ)의 Gold Standard Positives는 전사 인자 및 타겟 유전자의 조절 상호작용이 발견된 문장을 포함하는 문장의 집합인 것을 특징으로 하는 저장매체
|
10 |
10
제 7 항에 있어서, 상기 단계 (ⅱ)에서 Gold Standard Negatives는 전사 인자 및 타겟 유전자의 조절 상호작용이 발견되지 않은 문장을 포함하는 문장의 집합인 것을 특징으로 하는 저장매체
|
11 |
11
제 7 항에 있어서, 상기 단계(ⅱ)에서 우선순위는 다음의 단계에 의해 계산되는 것을 특징으로 하는 저장매체:(ⅱ-1) Gold Standard Positives 및 Gold Standard Negatives의 문장에 포함된 단어들이 Gold Standard Postives와 Gold Standard Negatives에서 나타나는 빈도(frequency)를 계산하는 단계;(ⅱ-2) 상기 단계 (ⅱ-1)에서 계산된 Gold Standard Positives에서의 단어의 빈도와 Gold Standard Negatives에서의 단어의 빈도의 차이값을 계산하는 단계(ⅱ-3) 수동-큐레이션 과정을 거치지 않은 후보 문장들에 포함된 단어들 중 상기 단계 (ⅱ-2)에서 계산된 단어들의 빈도 차이값을 모두 더하는 단계(ⅱ-4) 수동-큐레이션 과정을 거치지 않은 후보 문장들을 상기 단계(ⅱ-3)에서 계산된 단어 빈도 차이값의 총합이 높은 순서로 우선순위를 매기는 단계
|
12 |
12
제 11 항에 있어서, 상기 빈도(frequency)는 다음 수학식 1 에 의해 계산되는 것을 특징으로 하는 저장매체:수학식 1빈도(frequency) = (각 단어의 Gold Standard Positives 또는 Gold Standard Negatives 에서의 출연 횟수) / (Gold Standard Positives 또는 Gold Standard Negatives 에 포함된 문장의 개수)
|
13 |
13
제 11 항에 있어서, 상기 빈도의 차이값은 다음 수학식 2 에 의해 계산되는 것을 특징으로 하는 저장매체:수학식 2빈도의 차이값 = Gold Standard Positives 에서의 빈도 - Gold Standard Negatives 에서의 빈도
|
14 |
14
다음을 포함하는 인간의 전사 인자(transcriptional factors, TFs) 및 타겟 유전자 간의 조절 상호작용(regulatory interaction) 예측(prediction)을 위한 시스템:(a) 컴퓨터 프로세서; 및 (b) 상기 프로세서와 커플링된 제 1 항, 제 2 항, 제 4 항, 제 5 항 및 제 7 항 내지 제 13 항 중 어느 한 항의 컴퓨터-독해가능한(computer-readable) 저장 매체
|