1 |
1
GEO(Gene Expression Omnibus) 데이터를 수집하고, 상기 수집된 GEO 데이터를 표현형 데이터와, 유전자 발현값 데이터 및 GPL(GEO Platform)을 포함하는 유전자 발현형 데이터로 구분하는 GEO 데이터 처리부; 상기 표현형 데이터의 핵심어(Feature Word)에 기초하여 상기 표현형 데이터를 표준화하는 표현형 데이터 변환부;상기 유전자 발현형 데이터에 포함된 상기 유전자 발현값 데이터를 정규화하는 유전자 발현형 데이터 변환부; 상기 표준화된 표현형 데이터 및 정규화된 유전자 발현형 데이터를, 범주형 변수, 연속형 변수, 또는 생존분석 변수 중 어느 하나에 기초하여 P값(p-value)을 계산하는 통계 기법을 활용하여 복수의 데이터 그룹으로 구분하되,상기 연속형 변수, 또는 상기 생존분석 변수에서는 P값(p-value)이 컷오프(cut-off)값을 갖는 그룹과,상기 범주형 변수에서는 가장 작은 P값(p-value)을 갖는 그룹으로 구분하는 데이터 그룹 생성부;상기 구분된 데이터 그룹을 분석하여 상기 분석 결과를 출력하는 데이터 분석부; 및TCGA(The Cancer Genome Atlas) 데이터르 수집하고, 상기 수집된 TCGA 데이터에 가상의 GSE 번호(GEO Series Number)를 부여하여 상기 TCGA 데이터를 상기 표현형 데이터의 형태 및 상기 유전자 발현형 데이터의 형태 중 적어도 하나의 형태로 변환하는 TCGA 데이터 변환부를 포함하며,상기 데이터 분석부는,행(X축)은 상기 표현형 데이터의 핵심값을 표시하고, 열(Y축)은 각 집단별 데이터 및 통계적 유의성을 나타내기 위한 상기 P값을 상기 표시한 분석 결과를 제공하는통합 분석 처리 장치
|
2 |
2
제1항에 있어서,상기 GEO 데이터 처리부는 GSE 번호(GEO Series Number)에 기초하여 상기 GEO 데이터 수집하고, 상기 수집된 GEO 데이터에서 상기 표현형 데이터는 환자의 나이, 성별, 조직 위치 및 조직 상태 중에서 적어도 하나를 포함하고, 상기 유전자 발현값 데이터는 mRNA의 발현량을 포함하며, 상기 GPL(GEO Platform)은 상기 유전자 발현값 데이터의 탐지자(Probe)를 생물학적 기호로 변환하는통합 분석 처리 장치
|
3 |
3
제2항에 있어서,상기 표현형 데이터 변환부는상기 표현형 데이터에서 상기 핵심어(Feature Word)와 값(Value)을 분리하고, 상기 분리된 핵심어 및 값에 기초하여 상기 표현형 데이터를 정형화된 데이터 형태로 변환하는 상기 표준화를 수행하는통합 분석 처리 장치
|
4 |
4
제3항에 있어서,상기 표현형 데이터 변환부는 상기 표현형 데이터를 표준화하기 위하여 참고하는 데이터가 저장된 표현형 데이터베이스를 포함하고, 상기 표현형 데이터베이스는 대표핵심어-유사어 데이터베이스, 대표값-유사값 데이터베이스 및 변환 스크립트 데이터베이스 중에서 적어도 하나를 포함하는 통합 분석 처리 장치
|
5 |
5
제1항에 있어서,상기 유전자 발현형 데이터 변환부는 상기 유전자 발현형 데이터에 포함된 탐지자(Probe) 이름을 상기 탐지자 이름과 생물학적으로 공통적인 의미를 가진 유전자 이름들 중에서 기설정된 임계값 이상으로 활용되고 있는 유전자 이름을 기준으로 하여 변경하고, 상기 변경된 탐지자 이름에 대응되는 각 유전자 발현값 데이터를 정규화하는 통합 분석 처리 장치
|
6 |
6
삭제
|
7 |
7
제1항에 있어서,상기 표현형 데이터 변환부는 상기 표현형 데이터 형태의 TCGA 데이터를 수신하고, 상기 표현형 데이터 형태의 TCGA 데이터와 상기 GEO 데이터 처리부에서 수신한 표현형 데이터를 통합하며, 상기 통합된 표현형 데이터를 표준화하고,상기 유전자 발현형 데이터 변환부는상기 유전자 발현형 데이터 형태의 TCGA 데이터를 수신하고, 상기 유전자 발현형 데이터 형태의 TCGA 데이터와 상기 GEO 데이터 처리부에서 수신한 유전자 발현형 데이터를 통합하며, 상기 통합된 유전자 발현형 데이터에 포함된 유전자 발현값 데이터를 정규화하는통합 분석 처리 장치
|
8 |
8
삭제
|
9 |
9
GEO 데이터 처리부에서 GEO(Gene Expression Omnibus) 데이터를 수집하고, 상기 수집된 GEO 데이터를 표현형 데이터와, 유전자 발현값 데이터 및 GPL(GEO Platform)을 포함하는 유전자 발현형 데이터로 구분하는 단계; 표현형 데이터 변환부에서 상기 표현형 데이터의 핵심어(Feature Word)에 기초하여 상기 표현형 데이터를 표준화하는 단계;유전자 발현형 데이터 변환부에서 상기 유전자 발현형 데이터에 포함된 상기 유전자 발현값 데이터를 정규화하는 단계; 데이터 그룹 생성부에서 상기 표준화된 표현형 데이터 및 정규화된 유전자 발현형 데이터를, 범주형 변수, 연속형 변수, 또는 생존분석 변수에 기초하여 P값(p-value)을 계산하는 통계 기법을 활용하여 복수의 데이터 그룹으로 구분하는 단계;데이터 분석부에서 상기 구분된 데이터 그룹을 분석하여 상기 분석 결과를 출력하는 단계; 및TCGA 데이터 변환부에서 TCGA(The Cancer Genome Atlas) 데이터르 수집하고, 상기 수집된 TCGA 데이터에 가상의 GSE 번호(GEO Series Number)를 부여하여 상기 TCGA 데이터를 상기 표현형 데이터의 형태 및 상기 유전자 발현형 데이터의 형태 중 적어도 하나의 형태로 변환하는 단계를 포함하고,상기 복수의 데이터 그룹으로 구분하는 단계는,상기 연속형 변수, 또는 상기 생존분석 변수에서는 P값(p-value)이 컷오프(cut-off)값을 갖는 그룹으로 구분하는 단계; 및상기 범주형 변수에서는 가장 작은 P값(p-value)을 갖는 그룹으로 구분하는 단계를 포함하는거,상기 분석 결과를 출력하는 단계는,행(X축)은 상기 표현형 데이터의 핵심값을 표시하고, 열(Y축)은 각 집단별 데이터 및 통계적 유의성을 나타내기 위한 상기 P값을 상기 표시한 분석 결과를 제공하는 단계를 포함하는통합 분석 처리 방법
|
10 |
10
제9항에 있어서, 상기 표현형 데이터와 유전자 발현형 데이터로 구분하는 단계는GSE 번호(GEO Series Number)에 기초하여 상기 GEO 데이터 수집하고, 상기 수집된 GEO 데이터에서 상기 표현형 데이터는 환자의 나이, 성별, 조직 위치 및 조직 상태 중에서 적어도 하나를 포함하고, 상기 유전자 발현값 데이터는 mRNA의 발현량을 포함하며, 상기 GPL(GEO Platform)은 상기 유전자 발현값 데이터의 탐지자(Probe)를 생물학적 기호로 변환하는통합 분석 처리 방법
|
11 |
11
삭제
|
12 |
12
제9항에 있어서,상기 표현형 데이터를 표준화하는 단계는상기 표현형 데이터 형태의 TCGA 데이터를 수신하고, 상기 표현형 데이터 형태의 TCGA 데이터와 상기 GEO 데이터 처리부에서 수신한 표현형 데이터를 통합하며, 상기 통합된 표현형 데이터를 표준화하고,상기 유전자 발현값 데이터를 정규화하는 단계는상기 유전자 발현형 데이터 형태의 TCGA 데이터를 수신하고, 상기 유전자 발현형 데이터 형태의 TCGA 데이터와 상기 GEO 데이터 처리부에서 수신한 유전자 발현형 데이터를 통합하며, 상기 통합된 유전자 발현형 데이터에 포함된 유전자 발현값 데이터를 정규화하는통합 분석 처리 방법
|
13 |
13
삭제
|