1 |
1
단백질 클러스터 분류 장치에 있어서, a)단백질에 포함된 분자의 이름 및 좌표를 나타내는 3차원 구조 정보로부터 단백질 2차 구조의 이름 및 서열 순서를 나타내는 2차 구조 정보를 추출하는 2차 구조 정보 추출부; b)상기 2차 구조 정보를 이용하여 단백질사이의 거리를 나타내는 단백질 거리를 생성하는 거리 계산부; c)상기 단백질 거리를 행렬화함으로써 거리 행렬을 생성하고 저장하는 거리 행렬 저장부; 및 d)상기 거리 행렬을 이용하여 단백질을 하나이상의 클러스터로 분류하는 클러스터링부를 포함하고, 상기 거리 행렬은 데이터베이스로 누적적으로 저장됨으로써 학습형 클러스터 뷴류가 가능하게 하는 것을 특징으로 하는 것을 특징으로 하는 장치
|
2 |
2
제 1 항에 있어서, 상기 b)거리 계산부는, 단백질의 2차 구조를 구성하는 구성 단위의 삽입, 삭제 및 치환 중 어느하나 또는 이들의 조합에 따라 가중된 거리를 상기 단백질 거리 계산에 반영하는 것을 특징으로 하는 장치
|
3 |
3
제 1 항에 있어서, 상기 b)거리 계산부는, 해밍 거리(hamming distance), 편집 거리(edit distance) 및 가중된 편집 거리(weight distance) 중 어느하나를 계산하는 것을 특징으로 하는 장치
|
4 |
4
제 1 항에 있어서, 상기 d)클러스트링부는, 최대최소거리(Maximin-Distance) 알고리즘, K-수단(K-means) 알고리즘 및 이소데이터(Isodata) 알고리즘 중 어느하나의 알고리즘을 이용하여 클러스터링을 수행하는 것을 특징으로 하는 장치
|
5 |
5
제 1 항에 있어서, 상기 d)클러스트링부는, 임의의 단백질을 클러스터 센터로 선택하고, 상기 선택된 클러스터 센터와 나머지 단백질사이의 단백질 거리를 이용하여 해당 단백질의 클러스터를 결정하고, 상기 결정된 클러스터에 대하여 새로운 클러스터 센터를 결정하고, 상기 클러스터 센터가 반복될 때까지, 새로운 클러스터 센터에 대하여 다시 해당 단백질의 새로운 단백질 거리를 생성하는 과정을 반복하는 것을 특징으로 하는 장치
|
6 |
6
단백질 클러스터 분류 방법에 있어서, a)단백질에 포함된 분자의 이름 및 좌표를 나타내는 3차원 구조 정보로부터 단백질 2차 구조의 이름 및 서열 순서를 나타내는 2차 구조 정보를 추출하는 2차 구조 정보 추출 단계; b)상기 2차 구조 정보를 이용하여 단백질사이의 거리를 나타내는 단백질 거리를 생성하는 거리 계산 단계; c)상기 단백질 거리를 행렬화함으로써 거리 행렬을 생성하고 저장하는 거리 행렬 저장 단계; 및 d)상기 거리 행렬을 이용하여 단백질을 하나이상의 클러스터로 분류하는 클러스터링 단계를 포함하고, 상기 거리 행렬은 데이터베이스로 누적적으로 저장됨으로써 학습형 클러스터 분류가 가능하게 하는 것을 특징으로 하는 것을 특징으로 하는 방법
|
7 |
7
제 6 항에 있어서, 상기 b)단계는, 단백질의 2차 구조를 구성하는 구성 단위의 삽입, 삭제 및 치환 중 어느하나 또는 이들의 조합에 따라 가중된 거리를 상기 단백질 거리 계산에 반영함으로써 수행되는 것을 특징으로 하는 방법
|
8 |
8
제 6 항에 있어서, 상기 b)단계는, 해밍 거리(hamming distance), 편집 거리(edit distance) 및 가중된 편집 거리(weight distance) 중 어느하나를 계산함으로써 수행되는 것을 특징으로 하는 방법
|
9 |
9
제 6 항에 있어서, 상기 d)단계는, 최대최소거리(Maximin-Distance) 알고리즘, K-수단(K-means) 알고리즘 및 이소데이터(Isodata) 알고리즘 중 어느하나의 알고리즘을 이용하여 수행되는 것을 특징으로 하는 방법
|
10 |
10
제 6 항에 있어서, 상기 d)클러스트링 단계는, d1)임의의 단백질을 클러스터 센터로 선택하는 단계; d2)상기 선택된 클러스터 센터와 나머지 단백질사이의 단백질 거리를 이용하여 해당 단백질의 클러스터를 결정하는 단계; d3)상기 결정된 클러스터에 대하여 새로운 클러스터 센터를 결정하는 단계; 및 d4)상기 클러스터 센터가 반복될 때까지, 상기 새로운 클러스터 센터에 대하여 다시 해당 단백질의 새로운 단백질 거리를 생성하는 과정을 반복하는 단계를 포함하는 것을 특징으로 하는 방법
|
11 |
11
제 6 항에 기재된 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|
12 |
11
제 6 항에 기재된 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|