1 |
1
생물정보 데이터로부터 단백질 상호작용 네트워크를 생성하고, 네트워크 분석을 이용하여 특정 질병관련 유전자를 선정하는 방법에 있어서,(a) 질병관련 유전자에 관한 문헌정보 데이터로부터 후보 유전자를 선정하는 단계;(b) 질병관련 유전자 발현 정보의 실험데이터로부터 정규성을 확인하여 유의한 데이터로부터 후보 유전자를 선정하는 단계;(c) 단백질 상호작용 정보 데이터로부터 상기 (a) 및 (b)에서 선정된 후보 유전자와 단백질 간의 단백질 상호작용 네트워크를 생성하는 단계;(d) 상기 단백질 상호작용 네트워크의 노드를 분석하는 단계; 및(e) 상기 분석결과를 점수화하여 질병관련 유전자를 선정하는 단계를 포함하는 것을 특징으로 하는 기존 문헌정보에서 알려지지 않았던 질병관련 유전자 선정 방법
|
2 |
2
청구항 1에 있어서,상기 질병관련 유전자에 관한 문헌정보로는 온라인 멘델리안 인 맨(Online Mendelian In Man, OMIM)에서 제공하는 질병 유전자 데이터베이스 또는 각각의 알려진 유전자마다 OMIM에서 제공하고 있는 유전자의 문헌정보에서 그 유전자와 관련이 있다고 알려진 또 다른 유전자 데이터베이스인 것을 특징으로 하는 질병관련 유전자 선정 방법
|
3 |
3
청구항 1에 있어서,상기 특정 질병관련 유전자 발현 정보는 질병군과 정상군을 비교하여 실험한 마이크로어레이 실험데이터인 것을 특징으로 하는 질병관련 유전자 선정 방법
|
4 |
4
청구항 1 또는 청구항 3에 있어서,상기 질병관련 유전자 발현 정보의 실험데이터가 정규분포를 따르면 T-검정 (Student's t-test)과 오류발견률 (False Discovery Rate) 을 적용하고, 정규분포를 따르지 않으면 윌콕슨 순위 검정 (Wilcoxon rank sum test)을 적용해서 p-value 값이 하나라도 0
|
5 |
5
청구항 1에 있어서,상기 단백질 상호작용 정보는 휴먼 프로테인 레퍼런스 데이터베이스(Human Protein Reference Database, HPRD) 데이터베이스인 것을 특징으로 하는 질병관련 유전자 선정 방법
|
6 |
6
청구항 1 또는 청구항 5에 있어서,상기 단백질 상호작용 정보로부터 단백질 상호작용 네트워크를 생성할 때, 상기 질병 후보 유전자들로만 단백질 노드를 구성한 핵심 단백질 상호작용 네트워크 (core network)뿐만 아니라, 상기 질병 후보 유전자들의 단백질과 그 단백질들과 상호작용하는 단백질 노드들로 이루어진 확장 단백질 상호작용 네트워크 (extended network)를 생성하는 것을 특징으로 하는 질병관련 유전자 선정 방법
|
7 |
7
청구항 1에 있어서,상기 단백질 상호작용 네트워크의 노드를 분석하기 위하여, 상기 단백질 상호작용 네트워크의 노드와의 연결개수 (Degree), 노드의 부하정도 (Node Betweenness Centrality, Node BC), 연결선의 부하정도 (Edge Betweenness Centrality, Edge BC) 및 네트워크에서 노드의 위치 값(Characteristic Path Length, CPL) 중에서 선택되는 어느 하나 이상의 네트워크 성질을 측정하는 것을 특징으로 하는 질병관련 유전자 선정 방법
|
8 |
8
청구항 1 또는 청구항 7에 있어서,상기 네트워크 노드의 연결개수가 큰 것부터 작은 것으로, 네트워크의 노드부하가 큰 것부터 작은 것으로 그리고 네트워크 위치 값이 작은 것부터 큰 것으로 각각 순서를 정해서 나열하고, 확장 단백질 상호작용 네트워크에서 세 가지 값에서 모두 상위 1% 안에 든 것들을 목표 유전자 (target genes)로 선정하거나,또는 상기 확장 단백질 상호작용 네트워크에서 네트워크 노드의 연결개수가 상위 2%에 속하는 것 중에서 핵심 단백질네트워크의 랭킹 값과 확장 단백질 네트워크의 랭킹 값의 차이가 큰 순으로 관심 유전자를 선정하거나,또는 질병관련 약물 대상이 되는 유전자가 알려져 있다면 그 유전자와 단백질이 상호작용을 하면서, 확장 단백질네트워크의 네트워크의 노드 연결개수가 상위 30% 안에 든 유전자들을 약물 대상 유전자와 상호작용하는 유전자 (new gene interacting with drug target gene)로 선정하거나,또는 핵심 단백질 네트워크를 가장 네트워크 부하가 큰 것 순으로 최소비용 신장트리 (minimum spanning tree)로 다시 그려 네트워크의 뼈대를 구성하여, 이 네트워크 뼈대에서 부하 값이 큰 상위 5%의 유전자를 핵심 구조 유전자 (key gene)로 선정하여,상기 목표 유전자, 관심 유전자, 약물 대상 유전자와 상호작용하는 유전자 및 핵심 구조 유전자에 해당될 때마다 점수를 부여하여 질병관련 유전자의 중요도 랭킹을 부여하는 것을 특징으로 하는 질병관련 유전자 선정 방법
|