1 |
1
공개 DB로부터 복수의 유형의 암에 관한 암 발현 데이터세트를 수집하여 전처리하는 전처리 모듈;상기 전처리된 암 발현 데이터세트를 재배열하여 새로운 암 정보 DB를 구축하는 데이터베이스 모듈; 및상기 구축된 새로운 암 정보 DB를 기초로, 제 1 유형의 암을 평가하기 위해 결정된 제 1 암 바이오마커를 제 2 유형의 암의 정보 DB에 적용하여, 상기 제 2 유형의 암에 대한 상기 제 1 암 바이오마커의 성능을 평가하는 성능 평가 모듈; 을 포함하는 암 바이오마커의 성능 평가 장치
|
2 |
2
제1항에 있어서,암 유형별로 평가된 암 바이오마커의 성능 평가 결과를 맵핑, 그래프 또는 표로 표시하는 웹-인터페이스 모듈을 더 포함하는 암 바이오마커의 성능 평가 장치
|
3 |
3
제1항에 있어서,상기 전처리 모듈은, 상기 수집된 암 발현 데이터세트를 분석하여 변위치 정규화(quantile normalization) 및 로우버스트 다중-어레이 평균(robust multiple-array; RMA) 정규화를 이용하여 정규화하는 것을 특징으로 하는 암 바이오마커의 성능 평가 장치
|
4 |
4
제3항에 있어서,상기 전처리 모듈은, TCGA 공개 DB에서 RNA 시퀀싱에 의한 RNA 발현 데이터에 대해서는, 정규화된 계수를 발현값으로 사용하는 것을 특징으로 하는 암 바이오마커의 성능 평가 장치
|
5 |
5
제1항에 있어서,상기 전처리 모듈은, 그룹-내 상관관계(within-group correlation) 및 그룹-간 상관관계(between-group correlation)를 이용해 이상값(outlier)을 검출하는 것을 특징으로 하는 암 바이오마커의 성능 평가 장치
|
6 |
6
제5항에 있어서,상기 전처리 모듈은, 사용자의 외부 입력에 따라 상기 검출된 이상값을 갖는 샘플을 배제하는 것을 특징으로 하는 암 바이오마커의 성능 평가 장치
|
7 |
7
제1항에 있어서,상기 전처리 모듈은, 상기 수집된 암 발현 데이터세트가 임상적 정보 및 샘플 주석을 포함하는 경우, 진단, 예후 및 약물 반응 정보의 분석을 통하여 새로운 데이터세트로 설계하여 정확한 암 타입 또는 서브타입을 규정하는 것을 특징으로 하는 암 바이오마커의 성능 평가 장치
|
8 |
8
제1항에 있어서,상기 데이터베이스 모듈은 상기 전처리된 발현 데이터세트 및 이에 상응하는 주석데이터를 포함하는 것을 특징으로 하는 암 바이오마커의 성능 평가 장치
|
9 |
9
제8항에 있어서,상기 데이터베이스 모듈은, 모든 발현 데이터를 사용자 맞춤형 인덱스 바이너리 파일 형태로 저장하는 것을 특징으로 하는 암 바이오마커의 성능 평가 장치
|
10 |
10
제1항에 있어서, 상기 성능 평가 모듈은 사용자-선별된 다중 마커의 경우, 곡선 아래 면적(AUC), 밸런스 정확도(BA), 민감도, 특이성, 양성 예측값(PPV), 음성 예측값(NPV), 위양성율(FPR), 위발견율(FDR), 및 F1 스코어 중 적어도 어느 하나를 포함하는 평가 결과를 제공하는 것을 특징으로 하는 암 바이오마커의 성능 평가 장치
|
11 |
11
제1항에 있어서,상기 성능 평가 모듈은, 다중-마커의 성능에 대한 단일 마커의 기여도를 측정하기 위해, 모든 마커에 대한 밸런스 정확도(BA)와 단일 마커 이외의 모든 마커에 대한 밸런스 정확도(BA) 간의 차이를 제공하는 것을 특징으로 하는 암 바이오마커의 성능 평가 장치
|
12 |
12
제2항에 있어서,상기 웹-인터페이스 모듈는, 사용자-선별 다중 마커와 쿼리 파라미터(queried parameter)를 상기 성능 평가 모듈로 트랜스퍼하는 인풋 레이아웃; 및 상기 성능 평가 결과에 대한 표 및 그래프 시각화를 제공하는 결과 익스플로어를 포함하는 것을 특징으로 하는 암 바이오마커의 성능 평가 장치
|
13 |
13
제12항에 있어서,상기 인풋 레이아웃은, 트레이닝 데이터세트로서 전처리된 공개 데이터세트 또는 사용자 제공 개별 데이터세트를 선별하는 것을 특징으로 하는 암 바이오마커의 성능 평가 장치
|
14 |
14
전처리 모듈에서, 공개 DB로부터 복수의 유형의 암에 관한 암 발현 데이터세트를 수집하여 전처리하는 단계;데이터베이스 모듈에서, 상기 전처리된 암 발현 데이터세트를 재배열하여 새로운 암 정보 DB를 구축하는 단계; 및성능 평가 모듈에서, 상기 구축된 새로운 암 정보 DB를 기초로, 제 1 유형의 암을 평가하기 위해 결정된 제 1 암 바이오마커를 제 2 유형의 암의 정보 DB에 적용하여, 상기 제 2 유형의 암에 대한 상기 제 1 암 바이오마커의 성능을 평가하는 단계; 를 포함하는 성능 평가 장치에서의 암 바이오마커에 대한 성능 평가 방법
|
15 |
15
제14항에 있어서,웹 인터페이스 모듈에서, 암 유형별로 평가된 암 바이오마커의 성능 평가 결과를 맵핑, 그래프 또는 표로 표시하는 성능 평가 결과 표시 단계를 더 포함하는 성능 평가 장치에서의 암 바이오마커에 대한 성능 평가 방법
|
16 |
16
제14항에 있어서,상기 전처리하는 단계에서는, 상기 수집된 암 발현 데이터세트를 분석하여 변위치 정규화(quantile normalization) 및 로우버스트 다중-어레이 평균(robust multiple-array; RMA) 정규화를 이용하여 정규화하는 것을 특징으로 하는 성능 평가 장치에서의 암 바이오마커에 대한 성능 평가 방법
|
17 |
17
제14항에 있어서,상기 전처리하는 단계에서는, 그룹-내 상관관계(within-group correlation) 및 그룹-간 상관관계(between-group correlation)를 이용해 이상값(outlier)을 검출하는 것을 특징으로 하는 성능 평가 장치에서의 암 바이오마커에 대한 성능 평가 방법
|
18 |
18
제14항에 있어서,상기 전처리하는 단계에서는, 상기 수집된 암 발현 데이터세트가 임상적 정보 및 샘플 주석을 포함하는 경우, 진단, 예후 및 약물 반응 정보의 분석을 통하여 새로운 데이터세트로 설계하여 정확한 암 타입 또는 서브타입을 규정하는 것을 특징으로 하는 성능 평가 장치에서의 암 바이오마커에 대한 성능 평가 방법
|
19 |
19
제14항에 있어서,상기 새로운 암 정보 DB를 구축하는 단계에서는, 모든 발현 데이터를 사용자 맞춤형 인덱스 바이너리 파일 형태로 저장하는 것을 특징으로 하는 성능 평가 장치에서의 암 바이오마커에 대한 성능 평가 방법
|
20 |
20
제14항에 있어서,상기 성능 평가 단계에서는, 사용자-선별된 다중 마커의 경우, 곡선 아래 면적(AUC), 밸런스 정확도(BA), 민감도, 특이성, 양성 예측값(PPV), 음성 예측값(NPV), 위양성율(FPR), 위발견율(FDR), 및 F1 스코어 중 적어도 어느 하나를 포함하는 평가 결과를 제공하는 것을 특징으로 하는 성능 평가 장치에서의 암 바이오마커에 대한 성능 평가 방법
|
21 |
21
제14항에 있어서,상기 성능 평가 단계에서는, 다중-마커의 성능에 대한 단일 마커의 기여도를 측정하기 위해, 모든 마커에 대한 밸런스 정확도(BA)와 단일 마커 이외의 모든 마커에 대한 밸런스 정확도(BA) 간의 차이를 제공하는 것을 특징으로 하는 성능 평가 장치에서의 암 바이오마커에 대한 성능 평가 방법
|
22 |
22
제20항 또는 제21항에 있어서,상기 성능 평가 결과 표시 단계에서는, 선별된 트레이닝 및 테스팅 데이터세트를 이용한 다중 마커의 평가와, 임의의 선별된 테스팅 데이터세트에 대한 저장된 예측 모델을 이용한 평가와, 선별된 데이터세트를 이용한 리브-원-아웃 교차-검증(LOOCV)의 평가와, 사용자-제공의 트레이닝 데이터세트 및 선별된 테스팅 데이터세트를 이용한 평가 중 적어도 어느 하나의 평가를 수행하는 것을 특징으로 하는 성능 평가 장치에서의 암 바이오마커에 대한 성능 평가 방법
|
23 |
23
제15항에 있어서,상기 성능 평가 결과 표시 단계에서는, 트레이닝 데이터세트로서 전처리된 공개 데이터세트 또는 사용자 제공 개별 데이터세트를 선별하는 것을 특징으로 하는 성능 평가 장치에서의 암 바이오마커에 대한 성능 평가 방법
|