1 |
1
진화적 서열 분석 모듈이 입력된 단백질 서열 데이터로부터 그 서열과 진화적 관련성이 있는 단백질 서열 데이터들을 데이터베이스로부터 추출하는 단계(단계 1);서열 다양성 분석 모듈이 상기 단계 1에서 추출된 진화적 관련성이 있는 단백질 서열 데이터들에 기초하여 아미노산 잔기 중 다양한 아미노산으로 치환될 수 있는 가변성 아미노산 잔기를 선별하는 단계(단계 2);단백질 구조 분석 모듈이 상기 단계 2에서 추출된 가변성 아미노산 잔기에 대해서 표면 잔기를 선별하고, 선별된 표면 잔기에서 외부로부터의 접근 가능 구역을 설정하여 이를 통해 그 잔기들 사이의 공간상 인접도를 연산하는 단계(단계 3); 다양성 표면 분석 모듈이 상기 단계 2 및 상기 단계 3의 결과로부터 다양한 아미노산으로 치환될 수 있는 가변성 및 외부로부터의 접근성이 높은 단백질 표면을 선별하는 단계(단계 4); 및확장 다양성 표면 분석 모듈이 단계 4로부터 선별된 단백질 표면들의 공간상 인접도를 분석하여 가변성이 높은 확장 다양성 표면을 선별하는 단계(단계 5)를 포함하는 결합단백질 라이브러리 제조를 위한 전산학적 방법
|
2 |
2
제 1항에 있어서, 단백질 서열 데이터의 입력은 입력 수단을 통해 직접 입력하거나 별도로 구축된 데이터베이스에 접속하여 임의의 단백질 서열을 다운로드하도록 함으로써 입력되는 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법
|
3 |
3
제 1항에 있어서, 진화적 서열 분석 모듈은 non-redundant protein sequences 데이터베이스로부터 진화적 관련성이 있는 단백질 서열 데이터들을 추출하는 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법
|
4 |
4
제 1항에 있어서,서열 다양성 분석 모듈은 단계 1에서 추출된 모든 단백질 서열을 정렬(alignment)하고, 정렬된 서열들에 있어 서로 상응하는 각 잔기에 대하여 하기의 수학식 1에 따라 아미노산 가변성을 나타내는 엔트로피를 연산하여 그 값이 미리 설정된 기준값 이상인 경우 가변성 아미노산 잔기로 선별하는 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법:[수학식 1](S : 엔트로피; pi : 각 아미노산 잔기에서 관찰되는 아미노산 i의 빈도)
|
5 |
5
제 1항에 있어서,단백질 구조 분석 모듈은 각 잔기의 곁사슬(side chain) SASA(solvent accessible surface area) 값과 상기 잔기가 완전히 노출된 경우의 SASA 값의 상대적 비가 미리 설정된 기준값 이상인 경우 표면 잔기로 선별하는 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법
|
6 |
6
제 1항에 있어서, 단백질 구조 분석 모듈은 각 잔기의 α-탄소 및 β-탄소로부터의 거리가 미리 설정된 기준값 이내이며, α-탄소와 β-탄소와의 각도가 미리 설정된 기준값 이상인 구역을 접근 가능 구역으로 설정하는 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법
|
7 |
7
제 6항에 있어서, 가변성 아미노산 잔기가 아닌 아미노산 잔기의 원자 주변부는 접근 가능 구역에서 제외하는 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법
|
8 |
8
제 6항에 있어서, 단백질 구조 분석 모듈은 두 잔기가 공유하는 접근 가능 구역의 부피로써 공간상 인접도를 연산하는 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법
|
9 |
9
제 1항에 있어서, 다양성 표면 분석 모듈은 하기의 수학식 2로 표현되는 스코어 함수를 최대화시키는 가변성 아미노산 잔기의 집합을 탐색하는 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법
|
10 |
10
제 9항에 있어서, 아미노산 잔기에 위치할 수 있는 서로 다른 아미노산의 개수는 하기의 수학식 3에 의해 연산되는 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법;[수학식 3](Nr : 아미노산 잔기 r에 위치할 수 있는 서로 다른 아미노산의 개수; 및Br,i: 아미노산 잔기 r에서 아미노산 i의 존재유무에 따른 값으로, 존재하는 경우 1, 존재하지 않는 경우 0의 값을 가짐)
|
11 |
11
제 10항에 있어서, 아미노산 잔기 r에서 아미노산 i의 존재유무에 따른 값(Br,i)은 하기의 수학식 4에 의해 연산되는 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법;[수학식 4](Br,i: 아미노산 잔기 r에서 아미노산 i의 존재유무에 따른 값으로, 존재하는 경우 1, 존재하지 않는 경우 0의 값을 가짐; fr,i은 아미노산 잔기 r에서 관찰되는 아미노산 i의 빈도; 및fi는 단백질 표면에서 관찰되는 아미노산 i의 빈도)
|
12 |
12
제 9항에 있어서, 가변성 아미노산 잔기의 집합의 탐색은 하기의 단계를 포함하는 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법;(a) 상호 연결된 3개의 가변성 아미노산 잔기들의 집합(Y)을 탐색 추출하여, 이들을 원소로 가지는 단백질 표면 집합(X)을 생성하는 단계;(b) 각 단백질 표면 집합(X)의 원소인 가변성 아미노산 잔기들의 집합(Y)에 대해 하기의 ①내지 ④의 연산을 수행하는 단계;① Y의 원소 개수가 최대 원소개수(N)과 같으면 작업종료;② Y의 원소인 가변성 아미노산 잔기에 연결되어 있는 가변성 아미노산 잔기를 검색하고, 이들을 원소로 가지는 주변부 집합(Z)을 생성;③ Z의 각 원소가 Y에 추가되었을 때 스코어 함수를 연산; 및④ Z의 원소 중 최대 스코어 함수를 가지는 원소를 Y에 추가하고 X의 기존의 원소를 대체; 및(c) X의 원소가 단계 (b)를 통해 변경된 경우 단계 (b)를 반복하고 그렇지 않은 경우 가변성 아미노산 집합의 탐색을 종료하는 단계
|
13 |
13
삭제
|
14 |
14
제 1항에 있어서, 확장 다양성 표면 분석 모듈은 단백질 표면 집합(X)을 노드로 가지는 그래프(Z)를 생성한 후 community search algorithm을 적용하여 확장 다양성 표면을 탐색하는 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법
|
15 |
15
제 14항에 있어서, community search algorithm은 fast greedy modularity optimization 알고리즘인 것을 특징으로 하는 결합단백질 라이브러리 제조를 위한 전산학적 방법
|
16 |
16
제1항 내지 제12항, 제14항, 및 제15항 중 어느 한 항에 따른 결합단백질 라이브러리 제조를 위한 전산학적 방법을 실행시키기 위한 명령들을 포함하는 프로그램이 저장된 컴퓨터로 판독가능한 매체
|
17 |
17
입력된 단백질 서열 데이터로부터 그 서열과 진화적 관련성이 있는 단백질 서열 데이터들을 데이터베이스로부터 추출하는 진화적 서열 분석 모듈;상기 진화적 서열 분석 모듈로부터 추출된 진화적 관련성이 있는 단백질 서열 데이터들에 기초하여 아미노산 잔기 중 다양한 아미노산으로 치환될 수 있는 가변성 아미노산 잔기를 선별하는 서열 다양성 분석 모듈;선별된 가변성 아미노산 잔기에 대해서 표면 잔기를 선별하고, 선별된 표면 잔기에서 외부로부터의 접근 가능 구역을 설정하여 이를 통해 그 잔기들 사이의 공간상 인접도를 연산하는 단백질 구조 분석 모듈; 다양한 아미노산으로 치환될 수 있는 가변성 및 외부로부터의 접근성이 높은 단백질 표면을 선별하는 다양성 표면 분석 모듈; 및선별된 단백질 표면들의 공간상 인접도를 분석하여 가변성이 높은 확장 다양성 표면을 선별하는 확장 다양성 표면 분석 모듈을 포함하는 결합단백질 라이브러리 제조 시스템
|
18 |
18
삭제
|