1 |
1
미지의 단백질 특성 예측 장치에 있어서,외부의 단백질 상호작용 네트워크(이하, "PPI 네트워크"라 함)에 존재하는 유전자 온톨로지(GO : Gene Ontology) 용어들의 유사도를 계산하여 유전자 온톨로지(GO) 용어 레벨을 정규화하기 위한 유전자 온톨로지(GO) 용어 레벨 정규화 수단;상기 PPI 네트워크로부터의 데이터와 상기 유전자 온톨로지(GO) 용어 레벨 정규화 수단으로부터의 데이터를 이용하여 특성관계행렬(Feature Relationship Matrix)을 생성하기 위한 특성관계행렬 생성 수단;상기 PPI 네트워크로부터의 데이터와 상기 유전자 온톨로지(GO) 용어 레벨 정규화 수단으로부터의 데이터를 이용하여 카이 스퀘어 값을 계산하기 위한 카이 스퀘어 값 계산 수단; 및상기 카이 스퀘어 값 계산 수단에서 계산된 카이 스퀘어 값과 상기 특성관계행렬 생성 수단에서 생성된 특성관계행렬을 이용하여 미지의 단백질의 특성을 예측하기 위한 단백질 특성 예측 수단을 포함하는 미지의 단백질 특성 예측 장치
|
2 |
2
제 1 항에 있어서,상기 유전자 온톨로지(GO) 용어 레벨 정규화 수단은,상기 PPI 네트워크에 존재하는 모든 단백질의 각 유전자 온톨로지(GO) 용어에 대하여 외부의 유전자 온톨로지(GO) 데이터베이스를 이용하여 레벨을 변환하고 이전 용어와 변환 용어 간의 유사도를 계산하여 유전자 온톨로지(GO) 용어 레벨을 정규화하는 것을 특징으로 하는 미지의 단백질 특성 예측 장치
|
3 |
3
제 1 항 또는 제 2 항에 있어서,상기 특성관계행렬 생성 수단은,상기 PPI 네트워크로부터 추출한 유전자 온톨로지(GO) 용어 리스트와 상기 유전자 온톨로지(GO) 용어 레벨 정규화 수단으로부터의 유전자 온톨로지(GO) 용어와 유사도를 이용하여 특성관계행렬을 생성하는 것을 특징으로 하는 미지의 단백질 특성 예측 장치
|
4 |
4
제 3 항에 있어서,상기 카이 스퀘어 값 계산 수단은,상기 PPI 네트워크로부터 추출한 모든 단백질 및 미지의 단백질과 상기 유전자 온톨로지(GO) 용어 레벨 정규화 수단으로부터의 유전자 온톨로지(GO) 용어와 유사도를 이용하여 특성 벡터를 생성하고 예상 수를 계산하여 카이 스퀘어 값을 계산하는 것을 특징으로 하는 미지의 단백질 특성 예측 장치
|
5 |
5
제 4 항에 있어서,상기 단백질 특성 예측 수단은,기능(function), 작용(process), 및 위치(localization) 정보를 포함하는 단백질 특성을 예측하는 것을 특징으로 하는 미지의 단백질 특성 예측 장치
|
6 |
6
미지의 단백질 특성 예측 방법에 있어서,PPI 네트워크에 존재하는 유전자 온톨로지(GO) 용어들의 유사도를 계산하여 유전자 온톨로지(GO) 용어 레벨 정규화를 수행하는 유전자 온톨로지(GO) 용어 레벨 정규화 단계;상기 PPI 네트워크로부터 추출한 데이터와 상기 정규화한 데이터를 이용하여 특성관계행렬(Feature Relationship Matrix)을 생성하는 특성관계행렬 생성 단계;상기 PPI 네트워크로부터 추출한 데이터와 상기 정규화한 데이터를 이용하여 카이 스퀘어 값을 계산하는 카이 스퀘어 값 계산 단계; 및상기 계산한 카이 스퀘어 값과 상기 생성한 특성관계행렬을 이용하여 미지의 단백질의 특성을 예측하는 단백질 특성 예측 단계를 포함하는 미지의 단백질 특성 예측 방법
|
7 |
7
제 6 항에 있어서,상기 유전자 온톨로지(GO) 용어 레벨 정규화 단계는,상기 PPI 네트워크에 존재하는 모든 단백질의 각 유전자 온톨로지(GO) 용어에 대하여 유전자 온톨로지(GO) 데이터베이스를 이용하여 레벨을 변환하고 이전 용어와 변환 용어 간의 유사도를 계산하여 유전자 온톨로지(GO) 용어 레벨 정규화를 수행하는 것을 특징으로 하는 미지의 단백질 특성 예측 방법
|
8 |
8
제 7 항에 있어서,상기 유전자 온톨로지(GO) 용어 레벨 정규화 단계는,상기 PPI 네트워크를 선택하는 제 1 선택 단계;상기 제 1 선택 단계에서 선택한 PPI 네트워크로부터 모든 단백질을 추출하는 단계;상기 추출한 각 단백질의 모든 유전자 온톨로지(GO) 용어를 추출하는 단계;상기 추출한 유전자 온톨로지(GO) 용어의 레벨이 기준 레벨과 동일한지를 검사하는 단계;상기 검사 결과, 동일하면 유사도 계산 과정으로 진행하고, 동일하지 않으면 유전자 온톨로지(GO) 데이터베이스에 존재하는 유전자 온톨로지(GO) 용어를 이용하여, 상기 기준 레벨로 상기 추출한 유전자 온톨로지(GO) 용어의 레벨을 변환하는 단계;이전의 유전자 온톨로지(GO) 용어와 상기 레벨을 변환한 유전자 온톨로지(GO) 용어 사이의 유사도를 계산하는 단계; 및정규화 정보를 병합하는 단계를 포함하는 미지의 단백질 특성 예측 방법
|
9 |
9
제 8 항에 있어서,상기 정규화 정보는,상기 계산한 유사도, 상기 이전의 유전자 온톨로지(GO) 용어, 및 상기 레벨을 변환한 유전자 온톨로지(GO) 용어 정보를 포함하는 것을 특징으로 하는 미지의 단백질 특성 예측 방법
|
10 |
10
제 6 항 내지 제 9 항 중 어느 한 항에 있어서,상기 특성관계행렬 생성 단계는,상기 PPI 네트워크로부터 추출한 유전자 온톨로지(GO) 용어 리스트와 상기 정규화한 유전자 온톨로지(GO) 용어와 상기 계산한 유사도를 이용하여 특성관계행렬을 생성하는 것을 특징으로 하는 미지의 단백질 특성 예측 방법
|
11 |
11
제 10 항에 있어서,상기 특성관계행렬 생성 단계는,상기 PPI 네트워크를 선택하는 제 2 선택 단계;상기 제 2 선택 단계에서 선택한 PPI 네트워크에 존재하는 모든 유전자 온톨로지(GO) 용어 리스트를 추출하는 단계; 및상기 추출한 유전자 온톨로지(GO) 용어 리스트와 상기 정규화한 유전자 온톨로지(GO) 용어를 이용하여 행과 열이 동일한 행렬을 만들고 각 필드에 상기 계산한 유사도 값을 입력하여 특성관계행렬(Feature Relationship Matrix)을 생성하는 단계를 포함하는 미지의 단백질 특성 예측 방법
|
12 |
12
제 10 항에 있어서,상기 카이 스퀘어 값 계산 단계는,상기 PPI 네트워크로부터 추출한 모든 단백질 및 미지의 단백질과 상기 정규화한 유전자 온톨로지(GO) 용어와 상기 계산한 유사도를 이용하여 특성 벡터를 생성하고 예상 수를 계산한 후에 카이 스퀘어(Chi-square) 알고리즘을 사용하여 카이 스퀘어 값을 계산하는 것을 특징으로 하는 미지의 단백질 특성 예측 방법
|
13 |
13
제 12 항에 있어서,상기 카이 스퀘어 값 계산 단계는,상기 PPI 네트워크를 선택하는 제 2 선택 단계;상기 제 2 선택 단계에서 선택한 PPI 네트워크에 존재하는 모든 단백질 리스트를 추출하는 단계;상기 추출한 단백질들의 모든 유전자 온톨로지(GO) 용어에 대해서, 상기 정규화한 유전자 온톨로지(GO) 용어와 상기 계산한 유사도 값을 이용하여 전역 특징 벡터(Global Feature Vector)를 생성하는 단계;상기 생성한 전역 특징 벡터(Global Feature Vector)를 이용하여 전역 예상 수(Global Expectation Number)를 계산하는 단계;상기 제 2 선택 단계에서 선택한 PPI 네트워크의 단백질 중에서 특성이 알려지지 않은 미지의 단백질을 추출하는 단계;상기 추출한 단백질들의 모든 유전자 온톨로지(GO) 용어에 대해서, 상기 정규화한 유전자 온톨로지(GO) 용어와 상기 계산한 유사도 값을 이용하여 로컬 특징 벡터(Local Feature Vector)를 생성하는 단계;상기 생성한 로컬 특징 벡터(Local Feature Vector)를 이용하여 로컬 예상 수(Local Expectation Number)를 계산하는 단계; 및상기 계산한 로컬 예상 수(Local Expectation Number)와 상기 계산한 전역 예상 수(Global Expectation Number)에 대해 카이 스퀘어 알고리즘을 사용하여 카이 스퀘어 값을 계산하는 단계를 포함하는 미지의 단백질 특성 예측 방법
|
14 |
14
제 12 항에 있어서,상기 단백질 특성 예측 단계는,기능(function), 작용(process), 및 위치(localization) 정보를 포함하는 단백질 특성을 예측하는 것을 특징으로 하는 미지의 단백질 특성 예측 방법
|