맞춤기술찾기

이전대상기술

다차원의 부분집합 연관 분석에 기반한 인공지능 학습 데이터셋 공정성을 보장하는 장치 및 이를 이용한 인공지능 학습 데이터셋 공정성을 보장하는 방법

  • 기술번호 : KST2022000227
  • 담당센터 : 부산기술혁신센터
  • 전화번호 : 051-606-6561
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 인공지능 학습을 위한 원시 데이터셋 속성에 해당하는 속성값의 편향을 편향성을 제거하고 공정성이 보장된 인공지능 학습 데이터셋을 만드는 다차원의 부분집합 연관 분석에 기반한 인공지능 학습 데이터셋 공정성을 보장하는 장치 및 이를 이용한 인공지능 학습 데이터셋 공정성을 보장하는 방법에 관한 것이다. 본 발명에 따른 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법은, CSV(Comma-Separated Values) 형식으로 마련된 원시 데이터셋 파일을 업로드하는 제1단계; 상기 업로드 된 원시 데이터셋 파일의 구조를 파싱(Parsing)하는 제2단계; 상기 파싱된 구조에서 컬럼(Column)의 군집화 개수 및 전체 컬럼값의 개수를 확인하는 제3단계; 상기 컬럼(Column)의 군집화 개수 및 전체 컬럼값의 개수를 이용하여 기준값을 계산하는 제4단계; 하나의 군집을 선택한 후, 상기 선택된 군집의 컬럼값 개수와 상기 기준값을 비교하는 제5단계; 상기 제5단계에서 상기 선택된 군집의 컬럼값 개수가 상기 기준값 이상인 경우, 상기 기준값과 동일한 값의 컬럼값 개수만 포함하는 제6-1단계; 상기 제5단계에서 상기 선택된 군집의 컬럼값 개수가 상기 기준값 미만인 경우, 상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 값을 비교하는 제6-2단계; 상기 제6-2단계에서 상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 이상인 경우 및 상기 제6-1단계에서 상기 기준값과 동일한 값의 컬럼값 개수만 포함한 데이터를 조합하여 하위데이터셋을 생성하는 제7-1단계; 상기 제6-2단계에서 상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 미만인 경우, 상기 선택된 군집의 컬럼값은 제거하는 제7-2단계; 상기 컬럼(Column)의 군집화 개수만큼 상기 제5단계 내지 상기 제7단계를 반복 수행(Loop)하여 하위데이터셋을 추가로 생성하는 제8단계; 및 상기 추가로 생성된 하위데이터셋의 데이터를 취합하는 제9단계;를 포함하는 것을 특징으로 한다.
Int. CL G06N 20/00 (2019.01.01) G06N 5/02 (2006.01.01)
CPC G06N 20/00(2013.01) G06N 5/02(2013.01)
출원번호/일자 1020200185398 (2020.12.29)
출원인 부산대학교 산학협력단
등록번호/일자 10-2321735-0000 (2021.10.29)
공개번호/일자
공고번호/일자 (20211104) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020200161943   |   2020.11.27
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.12.29)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 부산대학교 산학협력단 대한민국 부산광역시 금정구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 권준호 부산 금정구
2 김구 부산 동래구
3 김진우 부산 사하구
4 신현실 부산 남구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김종석 대한민국 부산광역시 해운대구 센텀중앙로 ** 우동, 에이스하이테크** **층 ****호(브릿지특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 부산대학교 산학협력단 부산광역시 금정구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.12.29 수리 (Accepted) 1-1-2020-1423592-68
2 [우선심사신청]심사청구서·우선심사신청서
2021.07.05 수리 (Accepted) 1-1-2021-0770703-01
3 선행기술조사의뢰서
Request for Prior Art Search
2021.07.12 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2021.08.02 발송처리완료 (Completion of Transmission) 9-6-2021-0144107-52
5 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2021.09.13 수리 (Accepted) 1-1-2021-1056757-20
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2021.09.13 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2021-1056800-07
7 의견제출통지서
Notification of reason for refusal
2021.09.13 발송처리완료 (Completion of Transmission) 9-5-2021-0725264-50
8 등록결정서
Decision to grant
2021.10.28 발송처리완료 (Completion of Transmission) 9-5-2021-0848474-37
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
업로드부(10)가 CSV(Comma-Separated Values) 형식으로 마련된 원시 데이터셋 파일을 업로드하는 제1단계;파싱부(20)가 상기 업로드 된 원시 데이터셋 파일의 구조를 파싱(Parsing)하는 제2단계;개수확인부(30)가 상기 파싱된 구조에서 컬럼(Column)의 군집화 개수 및 전체 컬럼값의 개수를 확인하는 제3단계;기준값계산부(40)가 상기 컬럼(Column)의 군집화 개수 및 전체 컬럼값의 개수를 이용하여 기준값을 계산하는 제4단계;기준값비교부(50)가 하나의 군집을 선택한 후, 상기 선택된 군집의 컬럼값 개수와 상기 기준값을 비교하는 제5단계;하위데이터셋생성부(60)가 상기 제5단계에서 비교 된 값을 이용하여 포함 될 컬럼값의 개수를 확정하는 제6단계; 컬럼값제거부(70)가 상기 확정된 컬럼값의 개수를 포함한 데이터를 조합하여 하위데이터셋을 생성하는 제7단계;반복수행부(80)가 상기 컬럼(Column)의 군집화 개수만큼 상기 제5단계 내지 상기 제7단계를 반복 수행(Loop)하여 하위데이터셋을 추가로 생성하는 제8단계; 및데이터취합부(90)가 상기 추가로 생성된 하위데이터셋의 데이터를 취합하는 제9단계;에 의해 실행되는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법
2 2
제 1항에 있어서,상기 제2단계에서 상기 원시 데이터셋 파일의 구조를 파싱(parsing)은,컬럼값 개수, 컬럼(Column) 개수, 컬럼(Column)의 군집화, 컬럼(Column)의 군집화 개수 및 컬럼 이름(column header) 중 어느 하나 이상을 확인하여 추출하는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법
3 3
제 1항에 있어서,상기 기준값은 아래 [식 1]에 의해 계산되는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법 : [식 1]
4 4
제 1항에 있어서,상기 제9단계에서 추가로 생성된 하위데이터셋의 데이터 취합은,상기 선택된 군집의 컬럼값 개수, 기준값 및 선택된 컬럼을 입력값(input)으로 하고 상기 제7단계에서 추가로 생성된 하위데이터를 결과값(output)으로 하는 취합모듈(association module)로 취합하는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법
5 5
제 1항에 있어서,상기 제6단계는,상기 제5단계에서 상기 선택된 군집의 컬럼값 개수가 상기 기준값 이상인 경우, 상기 기준값과 동일한 값의 컬럼값 개수만 포함하는 제6-1단계; 및상기 제5단계에서 상기 선택된 군집의 컬럼값 개수가 상기 기준값 미만인 경우, 상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 값을 비교하는 제6-2단계;로 분리하여 수행하는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법
6 6
제 5항에 있어서,상기 제7단계는,상기 제6-2단계에서 상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 이상인 경우 및 상기 제6-1단계에서 상기 기준값과 동일한 값의 컬럼값 개수만 포함한 데이터를 조합하여 하위데이터셋을 생성하는 제7-1단계; 및상기 제6-2단계에서 상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 미만인 경우, 상기 선택된 군집의 컬럼값은 제거하는 제7-2단계;로 분리하여 수행하는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 방법
7 7
CSV(Comma-Separated Values) 형식으로 마련된 원시 데이터셋 파일을 업로드하는 업로드부(10);상기 업로드 된 원시 데이터셋 파일의 구조를 파싱(Parsing)하는 파싱부(20);상기 파싱된 구조에서 컬럼(Column)의 군집화 개수 및 전체 컬럼값의 개수를 확인하는 개수확인부(30);상기 컬럼(Column)의 군집화 개수 및 전체 컬럼값의 개수를 이용하여 기준값을 계산하는 기준값계산부(40);하나의 군집을 선택한 후, 상기 선택된 군집의 컬럼값 개수와 상기 기준값을 비교하는 기준값비교부(50);상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 이상인 경우 및 상기 기준값과 동일한 값의 컬럼값 개수만 포함한 데이터를 조합하는 하위데이터셋생성부(60);상기 선택된 군집의 컬럼값 개수와 상기 기준값의 10% 미만인 경우, 상기 선택된 군집의 컬럼값은 제거하는 컬럼값제거부(70);상기 컬럼(Column)의 군집화 개수만큼 상기 기준값비교부(50), 하위데이터셋생성부(60) 및 컬럼값제거부(70)를 반복 수행(Loop)하여 하위데이터셋을 추가로 생성하는 반복수행부(80);상기 반복수행부(80)에 의해 상기 추가로 생성된 하위데이터셋의 데이터를 취합하는 데이터취합부(90);에 의해 실행되는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 장치
8 8
제 7항에 있어서,상기 파싱부는,상기 원시 데이터셋 파일의 구조에서 컬럼값 개수, 컬럼(Column) 개수, 컬럼(Column)의 군집화, 컬럼(Column)의 군집화 개수 및 컬럼 이름(column header) 중 어느 하나 이상을 확인하여 추출하는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 장치
9 9
제 7항에 있어서,상기 기준값은 아래 [식 1]에 의해 계산되는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 장치 : [식 1]
10 10
제 7항에 있어서,상기 데이터취합부(90)는,상기 선택된 군집의 컬럼값 개수, 기준값 및 선택된 컬럼을 입력값(input)으로 하고 상기 추가로 생성된 하위데이터를 결과값(output)으로 하는 취합모듈(association module)로 취합하는 것을 특징으로 하는 다차원의 부분집합 연관 분석에 기반 한 인공지능 학습 데이터셋 공정성을 보장하는 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 부산대학교산학협력단 SW컴퓨팅산업원천기술개발(R&D,정보화) 데이터 품질 평가기반 데이터 고도화 및 데이터셋 보정 기술 개발