1 |
1
학습데이터로 사용될 입력 데이터를 토대로 데이터 평가 기준별 데이터 특성을 추출하는 단계;추출한 특성을 토대로 품질요소를 평가하는 단계; 및각각의 품질요소의 평가 결과들을 종합해 데이터의 추적성 품질을 도출하는 단계;를 포함하는 것을 특징으로 하는 기계학습 기반 소프트웨어의 학습데이터 품질 평가 방법
|
2 |
2
제 1항에 있어서,상기 데이터 평가 기준별 데이터 특성을 추출하는 단계는,데이터 커버리지 관련 특성, 데이터 분포성 관련 특성, 데이터 완전성 관련 특성 및 데이터 중복성 관련 특성을 추출하는 단계를 포함하는 것을 특징으로 하는 기계학습 기반 소프트웨어의 학습데이터 품질 평가 방법
|
3 |
3
제 1항에 있어서,상기 추출한 특성을 토대로 품질요소를 평가하는 단계는,추출한 상기 특성들을 토대로 데이터 커버리지, 데이터 분포, 데이터 완전성 및 데이터 중복성에 대하여 평가를 수행하는 단계를 포함하는 것을 특징으로 하는 기계학습 기반 소프트웨어의 학습데이터 품질 평가 방법
|
4 |
4
제 1항에 있어서,상기 데이터의 추적성 품질을 도출하는 단계는,학습 데이터 집합으로 지능 소프트웨어 시스템이 학습을 진행하는 단계;학습결과가 기준을 만족하는지 확인하는 단계;입력데이터 관련 특성을 추출하는 단계;데이터 추적성을 평가하는 단계;추적성이 존재하는지 판단하는 단계; 및추적성이 존재한다면 평가결과를 보고하고, 학습데이터를 재구성하는 단계;를 포함하는 것을 특징으로 하는 기계학습 기반 소프트웨어의 학습데이터 품질 평가 방법
|
5 |
5
제 2항에 있어서,상기 데이터 커버리지는 학습하고자 하는 대상에 대한 데이터의 유형을 나타내주는 척도로서,학습 데이터 커버리지를 산출하는 척도는 하기 식 (1)과 같이 정의하는 것을 특징으로 하는 기계학습 기반 소프트웨어의 학습데이터 품질 평가 방법
|
6 |
6
제 2항에 있어서,상기 데이터 분포성은 학습 데이터가 정규 분포를 따르는지 확인하는 척도로서,데이터의 분포성을 나타내는 척도는 하기 식(2)와 같이 정의하는 것을 특징으로 하는 기계학습 기반 소프트웨어의 학습데이터 품질 평가 방법
|
7 |
7
제 2항에 있어서,상기 데이터 완전성은 학습 데이터 집합에 학습하고자 하는 대상의 모든 속성이 포함되어 있는가를 나타내주는 척도로서,상기 데이터의 완전성에 대한 산정은 식 (3)과 같이 정의하는 것을 특징으로 하는 기계학습 기반 소프트웨어의 학습데이터 품질 평가 방법
|
8 |
8
제 2항에 있어서,상기 데이터의 중복성은 학습 데이터 집합에 중복되는 데이터가 얼마나 포함되어 있는가를 나타내주는 척도로서,상기 데이터 중복성은 데이터 유사도를 통해 판별할 수 있으며, 하기 식 (4)를 통해 계산할 수 있는 것을 특징으로 하는 기계학습 기반 소프트웨어의 학습데이터 품질 평가 방법
|
9 |
9
제 4항에 있어서,상기 추적성은 기계 학습을 진행한 후의 데이터 품질 평가 기준의 척도로서,상기 추적성은 하기 식(5)로 표현될 수 있으며, 이는 추적성 존재 유무에 대하여 바이너리 값으로 평가되는 것을 특징으로 하는 기계학습 기반 소프트웨어의 학습데이터 품질 평가 방법
|