1 |
1
업로드부(10)가 CSV(Comma-Separated Values) 형식으로 마련된 원시 데이터셋 파일을 업로드하는 제1단계;파싱부(20)가 상기 업로드 된 원시 데이터셋 파일의 구조를 파싱(Parsing)하는 제2단계;개수확인부(30)가 상기 파싱된 구조에서 컬럼(Column)의 군집화 개수 및 전체 컬럼값의 개수를 확인하는 제3단계;기준값계산부(40)가 상기 컬럼(Column)의 군집화 개수 및 전체 컬럼값의 개수를 이용하여 기준값을 계산하는 제4단계;기준값비교부(50)가 하나의 군집을 선택한 후, 상기 선택된 군집의 컬럼값 개수와 상기 기준값을 비교하는 제5단계;하위데이터셋생성부(60)가 상기 제5단계에서 비교 된 값을 이용하여 포함 될 컬럼값의 개수를 확정하는 제6단계; 컬럼값제거부(70)가 상기 확정된 컬럼값의 개수를 포함한 데이터를 조합하여 하위데이터셋을 생성하는 제7단계;반복수행부(80)가 상기 컬럼(Column)의 군집화 개수만큼 상기 제5단계 내지 상기 제7단계를 반복 수행(Loop)하여 하위데이터셋을 추가로 생성하는 제8단계; 및데이터취합부(90)가 상기 추가로 생성된 하위데이터셋의 데이터를 취합하는 제9단계;에 의해 실행되는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법
|
2 |
2
제 1항에 있어서,상기 제2단계에서 상기 원시 데이터셋 파일의 구조를 파싱(parsing)은,컬럼값 개수, 컬럼(Column) 개수, 컬럼(Column)의 군집화, 컬럼(Column)의 군집화 개수 및 컬럼 이름(column header) 중 어느 하나 이상을 확인하여 추출하는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법
|
3 |
3
제 1항에 있어서,상기 기준값은 아래 [식 1]에 의해 계산되는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법 : [식 1]
|
4 |
4
제 1항에 있어서,상기 제9단계에서 추가로 생성된 하위데이터셋의 데이터 취합은,상기 선택된 군집의 컬럼값 개수, 기준값 및 선택된 컬럼을 입력값(input)으로 하고 상기 제7단계에서 추가로 생성된 하위데이터를 결과값(output)으로 하는 취합모듈(association module)로 취합하는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법
|
5 |
5
제 1항에 있어서,상기 제6단계는,상기 제5단계에서 상기 선택된 군집의 컬럼값 개수가 상기 기준값 이상인 경우, 상기 기준값과 동일한 값의 컬럼값 개수만 포함하는 제6-1단계; 및상기 제5단계에서 상기 선택된 군집의 컬럼값 개수가 상기 기준값 미만인 경우, 상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 값을 비교하는 제6-2단계;로 분리하여 수행하는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법
|
6 |
6
제 5항에 있어서,상기 제7단계는,상기 제6-2단계에서 상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 이상인 경우 및 상기 제6-1단계에서 상기 기준값과 동일한 값의 컬럼값 개수만 포함한 데이터를 조합하여 하위데이터셋을 생성하는 제7-1단계; 및상기 제6-2단계에서 상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 미만인 경우, 상기 선택된 군집의 컬럼값은 제거하는 제7-2단계;로 분리하여 수행하는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법
|
7 |
7
CSV(Comma-Separated Values) 형식으로 마련된 원시 데이터셋 파일을 업로드하는 업로드부(10);상기 업로드 된 원시 데이터셋 파일의 구조를 파싱(Parsing)하는 파싱부(20);상기 파싱된 구조에서 컬럼(Column)의 군집화 개수 및 전체 컬럼값의 개수를 확인하는 개수확인부(30);상기 컬럼(Column)의 군집화 개수 및 전체 컬럼값의 개수를 이용하여 기준값을 계산하는 기준값계산부(40);하나의 군집을 선택한 후, 상기 선택된 군집의 컬럼값 개수와 상기 기준값을 비교하는 기준값비교부(50);상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 이상인 경우 및 상기 기준값과 동일한 값의 컬럼값 개수만 포함한 데이터를 조합하는 하위데이터셋생성부(60);상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 미만인 경우, 상기 선택된 군집의 컬럼값은 제거하는 컬럼값제거부(70);상기 컬럼(Column)의 군집화 개수만큼 상기 기준값비교부(50), 하위데이터셋생성부(60) 및 컬럼값제거부(70)를 반복 수행(Loop)하여 하위데이터셋을 추가로 생성하는 반복수행부(80);상기 반복수행부(80)에 의해 상기 추가로 생성된 하위데이터셋의 데이터를 취합하는 데이터취합부(90);에 의해 실행되는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 장치
|
8 |
8
제 7항에 있어서,상기 파싱부는,상기 원시 데이터셋 파일의 구조에서 컬럼값 개수, 컬럼(Column) 개수, 컬럼(Column)의 군집화, 컬럼(Column)의 군집화 개수 및 컬럼 이름(column header) 중 어느 하나 이상을 확인하여 추출하는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 장치
|
9 |
9
제 7항에 있어서,상기 기준값은 아래 [식 1]에 의해 계산되는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 장치 : [식 1]
|
10 |
10
제 7항에 있어서,상기 데이터취합부(90)는,상기 선택된 군집의 컬럼값 개수, 기준값 및 선택된 컬럼을 입력값(input)으로 하고 상기 추가로 생성된 하위데이터를 결과값(output)으로 하는 취합모듈(association module)로 취합하는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 장치
|