1 |
1
학습용 DNA 데이터셋 및 추론용 DNA 데이터셋을 전처리하는 데이터 전처리 모듈;상기 전처리된 학습용 DNA 데이터셋을 기초로 결정 트리로 구성된 랜덤 포레스트 모델을 학습시켜 종양 분류 모델을 생성하는 학습 모듈; 및상기 전처리된 추론용 DNA 데이터셋을 기초로 상기 종양 분류 모델을 통해 상기 추론용 DNA 데이터셋의 각 샘플에 대한 종양 여부 및 종양 종류를 추론하는 추론 모듈;을 포함하는 종양 분류 기계학습 장치
|
2 |
2
제1항에 있어서, 상기 데이터 전처리 모듈은,상기 학습용 DNA 데이터셋을 TCGA(The Cancer Genome Atlas) 데이터베이스에서 수집하는 것인 종양 분류 기계학습 장치
|
3 |
3
제1항에 있어서, 상기 데이터 전처리 모듈은,상기 학습용 DNA 데이터셋 및 추론용 DNA 데이터셋에서, 종양 종류와의 상관 계수의 절대값이 소정의 상관계수 절대값 임계치보다 낮은 변수를 제거하는 것인 종양 분류 기계학습 장치
|
4 |
4
제1항에 있어서, 상기 데이터 전처리 모듈은,상기 학습용 DNA 데이터셋 및 추론용 DNA 데이터셋에서 유일성(uniqueness)을 지닌 변수를 제거하는 것인 종양 분류 기계학습 장치
|
5 |
5
제1항에 있어서, 상기 데이터 전처리 모듈은,상기 학습용 DNA 데이터셋 및 추론용 DNA 데이터셋에서 문자열로 표현된 데이터를 수치 데이터로 변환하는 것인 종양 분류 기계학습 장치
|
6 |
6
제1항에 있어서, 상기 데이터 전처리 모듈은,상기 학습용 DNA 데이터셋 및 추론용 DNA 데이터셋에서 문자열로 표현된 데이터를 정수로 변환하는 것인 종양 분류 기계학습 장치
|
7 |
7
제1항에 있어서, 상기 데이터 전처리 모듈은,상기 학습용 DNA 데이터셋 및 추론용 DNA 데이터셋의 각 변수의 데이터 분포를 정규화하는 것인 종양 분류 기계학습 장치
|
8 |
8
제1항에 있어서, 상기 데이터 전처리 모듈은,상기 학습용 DNA 데이터셋 및 추론용 DNA 데이터셋에 포함된 각 변수의 평균과 표준편차를 각각 특정한 평균값과 특정한 표준편차값이 되도록 상기 각 변수의 데이터를 변환하는 것인 종양 분류 기계학습 장치
|
9 |
9
제1항에 있어서, 상기 학습 모듈은,상기 랜덤 포레스트 모델을 구성하는 결정 트리 수(n_estimator)를 100 이하의 값으로 설정하여 상기 종양 분류 모델을 생성하는 것인 종양 분류 기계학습 장치
|
10 |
10
제1항에 있어서, 상기 학습 모듈은,상기 랜덤 포레스트 모델에 포함된 상기 결정 트리의 노드 분할을 위한 최소한의 샘플 데이터 수(min_samples_split)를 5 미만으로 설정하여 상기 종양 분류 모델을 생성하는 것인 종양 분류 기계학습 장치
|
11 |
11
제1항에 있어서, 상기 학습 모듈은,상기 랜덤 포레스트 모델에 포함된 상기 결정 트리의 최대 깊이(max_depth)를 제한하지 않는 것인 종양 분류 기계학습 장치
|
12 |
12
제1항에 있어서, 상기 학습 모듈은,지니 불순도(Gini impurity)를 상기 랜덤 포레스트 모델의 학습 평가기준(Criterion)으로 사용하는 것인 종양 분류 기계학습 장치
|
13 |
13
제1항에 있어서, 상기 추론 모듈은,상기 전처리된 추론용 DNA 데이터셋을 상기 종양 분류 모델에 입력하고, 상기 종양 분류 모델에 포함된 각 결정 트리에서 출력한 종양 종류 분류 결과를 집계하여, 다수결(Majority Voting)에 따라 상기 추론용 DNA 데이터셋의 각 샘플에 대한 종양 여부 및 종양 종류를 결정하는 방식으로 추론하는 것인 종양 분류 기계학습 장치
|
14 |
14
학습용 DNA 데이터셋을 입력받는 학습용 데이터셋 입력 단계;상기 학습용 DNA 데이터셋을 변수 제거, 문자열 데이터 수치화 및 데이터 분포 조정 중 적어도 어느 하나의 전처리 기법을 통해 전처리하는 학습용 데이터셋 전처리 단계; 및상기 전처리된 학습용 DNA 데이터셋을 기초로 결정 트리로 구성된 랜덤 포레스트 모델을 학습시켜 종양 분류 모델을 생성하는 인공지능 모델 학습 단계;를 포함하는 종양 분류 기계학습 방법
|
15 |
15
제14항에 있어서, 상기 학습용 데이터셋 전처리 단계는,상기 학습용 DNA 데이터셋에서, 종양 종류와의 상관 계수의 절대값이 소정의 상관계수 절대값 임계치보다 낮은 변수를 제거하는 것인 종양 분류 기계학습 방법
|
16 |
16
제14항에 있어서, 상기 학습용 데이터셋 전처리 단계는,상기 학습용 DNA 데이터셋에서 문자열로 표현된 데이터를 정수로 변환하는 것인 종양 분류 기계학습 방법
|
17 |
17
제14항에 있어서, 상기 학습용 데이터셋 전처리 단계는,상기 학습용 DNA 데이터셋에 포함된 각 변수의 평균과 표준편차를 각각 특정한 평균값과 특정한 표준편차값이 되도록 상기 각 변수의 데이터를 변환하는 방식의 데이터 분포 조정을 수행하는 것인 종양 분류 기계학습 방법
|
18 |
18
제14항에 있어서, 상기 인공지능 모델 학습 단계는,상기 랜덤 포레스트 모델을 구성하는 결정 트리 수(n_estimator)를 100 이하의 값으로 설정하여 상기 종양 분류 모델을 생성하는 것인 종양 분류 기계학습 방법
|
19 |
19
제14항에 있어서, 상기 인공지능 모델 학습 단계는,상기 랜덤 포레스트 모델에 포함된 상기 결정 트리의 노드 분할을 위한 최소한의 샘플 데이터 수(min_samples_split)를 5 미만으로 설정하여 상기 종양 분류 모델을 생성하는 것인 종양 분류 기계학습 방법
|
20 |
20
학습용 DNA 데이터셋을 입력받는 학습용 데이터셋 입력 단계;상기 학습용 DNA 데이터셋을 전처리하는 학습용 데이터셋 전처리 단계;상기 전처리된 학습용 DNA 데이터셋을 기초로 결정 트리로 구성된 랜덤 포레스트 모델을 학습시켜 종양 분류 모델을 생성하는 인공지능 모델 학습 단계;추론용 DNA 데이터셋을 입력받는 추론용 데이터셋 입력 단계;상기 추론용 DNA 데이터셋을 전처리하는 추론용 데이터셋 전처리 단계; 및상기 전처리된 추론용 DNA 데이터셋을 기초로 상기 종양 분류 모델을 통해 상기 추론용 DNA 데이터셋의 각 샘플에 대한 종양 여부 및 종양 종류를 추론하는 종양 종류 추론 단계;를 포함하는 종양 분류 기계학습 및 추론 방법
|