1 |
1
질병 관련 유전자 탐색 장치에 있어서,미리 정해진 일정한 종류의 유전자들에 대하여 복수 개의 샘플들의 제1 유전자 발현량 정보를 포함하는 제1 유전자 발현량 데이터를 입력받고, 상기 복수 개의 샘플들 중에서 자신의 상기 샘플을 제외한 나머지 상기 샘플들 중에서 상기 샘플의 제1 유전자 발현량 간에 미리 정해진 정도 이상의 상관관계를 가지는 상기 샘플들을 각 상기 샘플의 이웃샘플로 선정하고, 상기 각 샘플 별로 선정된 이웃샘플들의 제1 유전자 발현량을 이용하여 상기 각 샘플의 제2 유전자 발현량을 예측하는 협업 필터링부; 및상기 협업 필터링부에서 예측된 상기 각 샘플의 제2 유전자 발현량에 관한 제2 유전자 발현량 예측 데이터와 상기 제1 유전자 발현량 데이터를 이용하여, 각 상기 유전자의 질병 관련성 점수를 산출하는 질병 관련성 점수 산출부를 포함하며,상기 제1 유전자 발현량 데이터는 상기 제1 유전자 발현량 값을 나타내는 2차원의 제1 유전자 발현량 행렬로 표현되고, 상기 제2 유전자 발현량 예측 데이터는 상기 제2 유전자 발현량 값을 나타내는 2차원의 제2 유전자 발현량 예측 행렬로 표현되며,상기 제2 유전자 발현량 예측 데이터는 상기 이웃샘플의 특정 유전자의 제1 유전자 발현량 및 상기 이웃샘플의 제1 유전자 발현량의 평균값 간의 차이값에 대하여, 상기 샘플의 제1 유전자 발현량 및 상기 이웃샘플의 제1 유전자 발현량로부터 산출한 상관계수를 적용하여 정규화하고, 상기 샘플의 제1 유전자 발현량의 평균값을 더한 값인 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
2 |
2
삭제
|
3 |
3
제1항에 있어서, 상기 샘플들은 특정 질병 또는 생물학적 특성을 가지는 집단을 나타내는 제1 클래스와, 그 이외의 집단을 나타내는 제2 클래스로 미리 분류되는 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
4 |
4
제1항에 있어서, 상기 질병 관련성 점수 산출부에서 산출된 상기 질병 관련성 점수를 기준으로 상기 유전자들 중 질병 관련 유전자를 선별하는 질병 관련 유전자 선별부를 더 포함하는 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
5 |
5
제1항에 있어서,상기 협업 필터링부는,상기 샘플의 제1 유전자 발현량 간의 상관계수(Correlation Coefficient)를 산출하고, 각 상기 샘플에 대하여 미리 정해진 문턱값 이상의 상기 상관계수를 가지는 상기 샘플들을 각 상기 샘플의 상기 이웃샘플로 선정하는 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
6 |
6
제5항에 있어서, 상기 상관계수는 피어슨(Pearson) 상관계수인 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
7 |
7
제5항에 있어서, 상기 상관계수는 하기 식 1과 같이 산출되는 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
8 |
8
삭제
|
9 |
9
삭제
|
10 |
10
제1항에 있어서,상기 협업 필터링부는, 하기 식 2와 같이 상기 샘플의 상기 특정 유전자의 제2 유전자 발현량을 예측하는 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
11 |
11
제3항에 있어서,상기 질병 관련성 점수 산출부는,상기 제1 클래스의 상기 제1 유전자 발현량 데이터와 상기 제1 클래스의 상기 제2 유전자 발현량 예측 데이터 간의 차이값과, 상기 제2 클래스의 상기 제1 유전자 발현량 데이터와 상기 제2 클래스의 상기 제2 유전자 발현량 예측 데이터 간의 차이값을 이용하여, 상기 질병 관련성 점수를 산출하는 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
12 |
12
제11항에 있어서,상기 질병 관련성 점수 산출부는,각 상기 유전자 별로, 상기 제1 클래스의 상기 유전자의 상기 제1 유전자 발현량 데이터와 상기 제1 클래스의 상기 유전자의 상기 제2 유전자 발현량 예측 데이터 간의 제1 차이값을 산출하고, 상기 제2 클래스의 상기 유전자의 상기 제1 유전자 발현량 데이터와 상기 제2 클래스의 상기 유전자의 상기 제2 유전자 발현량 예측 데이터 간의 제2 차이값을 산출하고, 상기 제1 차이값과 상기 제2 차이값 간의 차이가 클수록, 상기 유전자의 상기 질병 관련성 점수가 크도록, 상기 질병 관련성 점수를 산출하는 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
13 |
13
제12항에 있어서,상기 질병 관련성 점수 산출부는, 상기 유전자 별로,상기 제1 클래스의 상기 유전자의 상기 제1 유전자 발현량 데이터를 나타내는 행렬과 상기 제1 클래스의 상기 유전자의 상기 제2 유전자 발현량 예측 데이터를 나타내는 행렬 간의 차분 행렬의 원소들의 절대값의 합으로 상기 제1 차이값을 산출하고, 상기 제2 클래스의 상기 유전자의 상기 제1 유전자 발현량 데이터를 나타내는 행렬과 상기 제2 클래스의 상기 유전자의 상기 제2 유전자 발현량 예측 데이터를 나타내는 행렬 간의 차분 행렬의 원소들의 절대값의 합으로 상기 제2 차이값을 산출하고, 상기 유전자의 상기 제1 차이값과 상기 제2 차이값 간의 차이의 크기를 상기 질병 관련성 점수로 하는 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
14 |
14
제11항에 있어서,상기 질병 관련성 점수는 하기 식 3과 같이 산출되는 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
15 |
15
삭제
|
16 |
16
질병 관련 유전자 탐색 장치에 있어서,미리 정해진 일정한 종류의 유전자들에 대하여 복수 개의 샘플들의 제1 유전자 발현량 정보를 포함하는 제1 유전자 발현량 데이터를 입력받고, 상기 각 샘플 별로 상기 복수 개의 샘플들 중에서 자신의 상기 샘플을 제외한 나머지 상기 샘플들 중 일부 샘플들의 제1 유전자 발현량을 이용하여 상기 각 샘플의 제2 유전자 발현량을 예측하는 협업 필터링부;상기 협업 필터링부에서 예측된 상기 각 샘플의 제2 유전자 발현량에 관한 제2 유전자 발현량 예측 데이터와 상기 제1 유전자 발현량 데이터를 이용하여, 각 상기 유전자의 질병 관련성 점수를 산출하는 질병 관련성 점수 산출부; 및상기 질병 관련성 점수 산출부에서 산출된 상기 질병 관련성 점수를 기준으로 상기 유전자들 중 질병 관련 유전자를 선별하는 질병 관련 유전자 선별부를 포함하며,상기 제1 유전자 발현량 데이터는 상기 제1 유전자 발현량 값을 나타내는 2차원의 제1 유전자 발현량 행렬로 표현되고, 상기 제2 유전자 발현량 예측 데이터는 상기 제2 유전자 발현량 값을 나타내는 2차원의 제2 유전자 발현량 예측 행렬로 표현되며,상기 제2 유전자 발현량 예측 데이터는 상기 이웃샘플의 특정 유전자의 제1 유전자 발현량 및 상기 이웃샘플의 제1 유전자 발현량의 평균값 간의 차이값에 대하여, 상기 샘플의 제1 유전자 발현량 및 상기 이웃샘플의 제1 유전자 발현량로부터 산출한 상관계수를 적용하여 정규화하고, 상기 샘플의 제1 유전자 발현량의 평균값을 더한 값이며,상기 샘플들은 특정 질병 또는 생물학적 특성을 가지는 집단을 나타내는 제1 클래스와, 그 이외의 집단을 나타내는 제2 클래스로 미리 분류되고,상기 질병 관련성 점수 산출부는, 상기 제1 클래스의 상기 제1 유전자 발현량 데이터와 상기 제1 클래스의 상기 제2 유전자 발현량 예측 데이터 간의 차이값과, 상기 제2 클래스의 상기 제1 유전자 발현량 데이터와 상기 제2 클래스의 상기 제2 유전자 발현량 예측 데이터 간의 차이값을 이용하여, 상기 질병 관련성 점수를 산출하는 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
17 |
17
제16항에 있어서,상기 질병 관련성 점수 산출부는,각 상기 유전자 별로, 상기 제1 클래스의 상기 유전자의 상기 제1 유전자 발현량 데이터와 상기 제1 클래스의 상기 유전자의 상기 제2 유전자 발현량 예측 데이터 간의 제1 차이값을 산출하고, 상기 제2 클래스의 상기 유전자의 상기 제1 유전자 발현량 데이터와 상기 제2 클래스의 상기 유전자의 상기 제2 유전자 발현량 예측 데이터 간의 제2 차이값을 산출하고, 상기 제1 차이값과 상기 제2 차이값 간의 차이가 클수록, 상기 유전자의 상기 질병 관련성 점수가 크도록, 상기 질병 관련성 점수를 산출하는 것을 특징으로 하는, 질병 관련 유전자 탐색 장치
|
18 |
18
질병 관련 유전자 탐색 장치에 의한 질병 관련 유전자 탐색 방법에 있어서,협업 필터링부에 의한, 미리 정해진 일정한 종류의 유전자들에 대하여 복수 개의 샘플들의 제1 유전자 발현량 정보를 포함하는 제1 유전자 발현량 데이터를 입력받고, 상기 복수 개의 샘플들 중에서 자신의 상기 샘플을 제외한 나머지 상기 샘플들 중에서 상기 샘플의 제1 유전자 발현량 간에 미리 정해진 정도 이상의 상관계수를 가지는 상기 샘플들을 각 상기 샘플의 이웃샘플로 선정하고, 상기 각 샘플 별로 선정된 이웃샘플들의 제1 유전자 발현량을 이용하여 상기 각 샘플의 제2 유전자 발현량을 예측하는 협업 필터링 단계;질병 관련성 점수 산출부에 의한, 상기 예측된 상기 각 샘플의 제2 유전자 발현량에 관한 제2 유전자 발현량 예측 데이터와 상기 제1 유전자 발현량 데이터를 이용하여, 각 상기 유전자의 질병 관련성 점수를 산출하는 질병 관련성 점수 산출 단계; 및 질병 관련 유전자 선별부에 의한, 상기 산출된 상기 질병 관련성 점수를 기준으로 상기 유전자들 중 질병 관련 유전자를 선별하는 질병 관련 유전자 선별 단계를 포함하며,상기 제1 유전자 발현량 데이터는 상기 제1 유전자 발현량 값을 나타내는 2차원의 제1 유전자 발현량 행렬로 표현되고, 상기 제2 유전자 발현량 예측 데이터는 상기 제2 유전자 발현량 값을 나타내는 2차원의 제2 유전자 발현량 예측 행렬로 표현되며,상기 제2 유전자 발현량 예측 데이터는 상기 이웃샘플의 특정 유전자의 제1 유전자 발현량 및 상기 이웃샘플의 제1 유전자 발현량의 평균값 간의 차이값에 대하여, 상기 샘플의 제1 유전자 발현량 및 상기 이웃샘플의 제1 유전자 발현량로부터 산출한 상관계수를 적용하여 정규화하고, 상기 샘플의 제1 유전자 발현량의 평균값을 더한 값인 것을 특징으로 하는 질병 관련 유전자 탐색 방법
|
19 |
19
삭제
|
20 |
20
제18항에 있어서,상기 샘플들은 특정 질병 또는 생물학적 특성을 가지는 집단을 나타내는 제1 클래스와, 그 이외의 집단을 나타내는 제2 클래스로 미리 분류되고,상기 질병 관련성 점수 산출 단계는,각 상기 유전자 별로, 상기 제1 클래스의 상기 유전자의 상기 제1 유전자 발현량 데이터와 상기 제1 클래스의 상기 유전자의 상기 제2 유전자 발현량 예측 데이터 간의 제1 차이값을 산출하고, 상기 제2 클래스의 상기 유전자의 상기 제1 유전자 발현량 데이터와 상기 제2 클래스의 상기 유전자의 상기 제2 유전자 발현량 예측 데이터 간의 제2 차이값을 산출하고, 상기 제1 차이값과 상기 제2 차이값 간의 차이가 클수록, 상기 유전자의 상기 질병 관련성 점수가 크도록, 상기 질병 관련성 점수를 산출하는 것을 특징으로 하는, 질병 관련 유전자 탐색 방법
|
21 |
21
프로세서에 의해 실행 가능한 컴퓨터 프로그램 명령어들을 포함하는 컴퓨터 판독 가능한 매체에 기록된 질병 관련 유전자 탐색을 위한 컴퓨터 프로그램으로서, 상기 프로세서에 의해 실행되는 경우에,미리 정해진 일정한 종류의 유전자들에 대하여 복수 개의 샘플들의 제1 유전자 발현량 정보를 포함하는 제1 유전자 발현량 데이터를 입력받고, 상기 복수 개의 샘플들 중에서 자신의 상기 샘플을 제외한 나머지 상기 샘플들 중에서 상기 샘플의 제1 유전자 발현량 간에 미리 정해진 정도 이상의 상관계수를 가지는 상기 샘플들을 각 상기 샘플의 이웃샘플로 선정하고, 상기 각 샘플 별로 선정된 이웃샘플들의 제1 유전자 발현량을 이용하여 상기 각 샘플의 제2 유전자 발현량을 예측하는 협업 필터링 단계;상기 예측된 상기 각 샘플의 제2 유전자 발현량에 관한 제2 유전자 발현량 예측 데이터와 상기 제1 유전자 발현량 데이터를 이용하여, 각 상기 유전자의 질병 관련성 점수를 산출하는 질병 관련성 점수 산출 단계; 및 상기 산출된 상기 질병 관련성 점수를 기준으로 상기 유전자들 중 질병 관련 유전자를 선별하는 질병 관련 유전자 선별 단계들을 수행하도록 하는 명령어들을 포함하며,상기 제1 유전자 발현량 데이터는 상기 제1 유전자 발현량 값을 나타내는 2차원의 제1 유전자 발현량 행렬로 표현되고, 상기 제2 유전자 발현량 예측 데이터는 상기 제2 유전자 발현량 값을 나타내는 2차원의 제2 유전자 발현량 예측 행렬로 표현되며,상기 제2 유전자 발현량 예측 데이터는 상기 이웃샘플의 특정 유전자의 제1 유전자 발현량 및 상기 이웃샘플의 제1 유전자 발현량의 평균값 간의 차이값에 대하여, 상기 샘플의 제1 유전자 발현량 및 상기 이웃샘플의 제1 유전자 발현량로부터 산출한 상관계수를 적용하여 정규화하고, 상기 샘플의 제1 유전자 발현량의 평균값을 더한 값인 것을 특징으로 하는 컴퓨터 프로그램
|