맞춤기술찾기

이전대상기술

준합성 데이터 생성 장치 및 데이터 생성 방법

  • 기술번호 : KST2022008418
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명의 일실시예에 데이터 생성 장치는, 제1 데이터 세트를 입력하는 데이터 입력부; 상기 제1 데이터 세트를 정규화하고 상기 정규화된 제1 데이터 세트를 제1 트레이닝 데이터 세트와 제1 테스트 데이터 세트로 분할하는 데이터 전처리부; 상기 제1 트레이닝 데이터 세트로 제1 머신러닝 모델을 학습시키고 미리지정된 수의 교차 검증을 사용하여 상기 제1 머신러닝 모델의 하이퍼파라미터를 최적화함으로서, 제1학습모델을 생성하는 학습모델 생성부; 상기 생성된 제1학습모델을 상기 제1 테스트 데이터 세트로 검증하는 검증부; 상기 제1 데이터 세트에 의해 정의된 경계 공간 (boundary space) 내에서 신규 파라미터를 선택하여 생성하고 상기 신규 파라미터에 기초하여 상기 제1학습모델을 사용하여 데이터 예측(prediction)을 수행하여 준합성(semi-synthetized)된 데이터 세트를 생성하는 준합성 데이터 생성부; 및 상기 제1 데이터 세트 및 상기 준합성된 데이터 세트를 저장하는 데이터베이스를 포함하도록 구성된다. 이러한 구성에 따르면, 높은 정확성을 가지는 머신러닝 시스템을 생성하도록 충분한 학습 데이터를 확보하기 위해 데이터를 증폭하는 데 있어서 상대적으로 단순하고 신속한 프로세스를 통해 신뢰성이 높은, 즉 유효 데이터를 다량 생성할 수 있는 데이터 생성 장치 또는 그 방법을 제공할 수 있다.
Int. CL G06N 20/20 (2019.01.01) G06N 5/02 (2006.01.01)
CPC G06N 20/20(2013.01) G06N 5/022(2013.01)
출원번호/일자 1020200172677 (2020.12.10)
출원인 한국과학기술원
등록번호/일자
공개번호/일자 10-2022-0082618 (2022.06.17) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.12.10)
심사청구항수 20

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 홍승범 대전 유성구
2 리오치하오 대전 유성구
3 최영우 대전 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 한상수 대한민국 서울시 서초구 효령로**길 ** *층 (브릿지웰빌딩)(에이치앤피국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.12.10 수리 (Accepted) 1-1-2020-1343160-04
2 선행기술조사의뢰서
Request for Prior Art Search
2021.10.19 수리 (Accepted) 9-1-9999-9999999-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
제1 데이터 세트를 입력하는, 데이터 입력부;상기 제1 데이터 세트를 정규화하고, 상기 정규화된 제1 데이터 세트를 제1 트레이닝 데이터 세트와 제1 테스트 데이터 세트로 분할하는, 데이터 전처리부;상기 제1 트레이닝 데이터 세트로 제1 머신러닝 모델을 학습시키고, 미리지정된 수의 교차 검증을 사용하여 상기 제1 머신러닝 모델의 하이퍼파라미터를 최적화함으로서, 제1학습모델을 생성하는, 학습모델 생성부;상기 생성된 제1학습모델을 상기 제1 테스트 데이터 세트로 검증하는, 검증부;상기 제1 데이터 세트에 의해 정의된 경계 공간 (boundary space) 내에서 신규 파라미터를 선택하여 생성하고, 상기 신규 파라미터에 기초하여 상기 제1학습모델을 사용하여 데이터 예측(prediction)을 수행하여 준합성(semi-synthetized)된 데이터 세트를 생성하는, 준합성 데이터 생성부; 및상기 제1 데이터 세트 및 상기 준합성된 데이터 세트를 저장하는, 데이터베이스를 포함하는, 데이터 생성 장치
2 2
제1항에 있어서, 상기 데이터 전처리부는, 상기 준합성된 데이터 세트를 상기 제1 데이터 세트와 결합하여 제2 데이터 세트를 생성하며, 상기 제2 데이터 세트를 제2 트레이닝 데이터 세트와 제2 테스트 데이터 세트로 분할하고,상기 학습모델 생성부는, 상기 제2 트레이닝 데이터 세트로 제2 머신러닝 모델을 학습시키고 미리지정된 수의 교차검증을 사용하여 상기 제2 머신러닝 모델의 하이퍼파리미터를 최적화함으로서 제2학습모델을 더 생성하는 것을 특징으로 하는, 데이터 생성 장치
3 3
제2항에 있어서, 상기 검증부는, 상기 제2 머신러닝 모델을 상기 제2 테스트 데이터 세트로 검증하여, 상기 제2학습모델의 검증정확성(validation accuracy)가 미리정해진 검증정확성 임계값보다 높은지 여부를 판정함으로서 상기 신규 파라미터의 적합성을 판정하는 것을 특징으로 하는, 데이터 생성 장치
4 4
제3항에 있어서, 상기 준합성 데이터 생성부는, 상기 신규 파라미터가 적합하다고 판정되면 상기 준합성된 데이터 세트를 유효한 데이터 세트로 식별하고 상기 제2 데이터 세트를 상기 데이터베이스에 저장하며,상기 신규 파라미터가 부적합하다고 판정되면 상기 준합성된 데이터 세트를 폐기하는 것을 특징으로 하는, 데이터 생성 장치
5 5
제1항에 있어서,상기 준합성 데이터 생성부는,상기 신규 파라미터의 선택시, 상기 제1 데이터 세트로부터 획득될 수 없었던 파라미터를 생성하도록 플로팅 포인트(floating poinit) 또는 정수(integer)의 무작위 수 생성기(random number generator)를 사용하여 신규 파라미터를 생성하는 것을 특징으로 하는, 데이터 생성 장치
6 6
제1항에 있어서, 상기 준합성 데이터 생성부는,상기 신규 파라미터의 선택시, 상기 제1 데이터 세트에 의해 정의된 경계 공간의 경계 조건(boundary condition)에 기초하여 산출된 신규 파라미터를 선택하여 생성하는 것을 특징으로 하는, 데이터 생성 장치
7 7
제1항에 있어서,상기 제1 머신러닝 모델은 SVM(Support Vector Machine) 또는 XGB(XGboost)을 사용하는 것을 특징으로 하는, 데이터 생성 장치
8 8
제2항에 있어서, 상기 제2 머신러닝 모델은 상기 제1 머신러닝 모델과 동일한 것을 특징으로 하는, 데이터 생성 장치
9 9
제1 데이터 세트를 입력하는, 데이터 입력부;상기 제1 데이터 세트를 정규화하고, 상기 정규화된 제1 데이터 세트를 제1 트레이닝 데이터 세트와 제1 테스트 데이터 세트로 분할하는, 데이터 전처리부;상기 제1 트레이닝 데이터 세트로 제1 머신러닝 모델을 학습시키고 최적화함으로서 제1학습모델을 생성하는, 학습모델 생성부;상기 생성된 제1학습모델을 상기 제1 테스트 데이터 세트로 검증하는, 검증부;상기 제1 데이터 세트에 의해 정의된 경계 공간 (boundary space) 내에서부터 신규 파라미터를 선택하여 생성하고, 상기 신규 파라미터에 기초하여 상기 제1학습모델을 사용하여 데이터 예측(prediction)을 수행하여 준합성(semi-synthetized)된 데이터 세트를 생성하는, 준합성 데이터 생성부; 상기 준합성된 데이터 세트와 상기 제1 데이터 세트가 결합하여 생성된 제2 데이터 세트 및 상기 제1 머신러닝 모델에 기초하여 상기 신규 파라미터의 적합성을 판정하고, 그 적합성 여부에 따라 상기 준합성된 데이터 세트의 유효 데이터로의 수용 및 폐기를 결정하는, 준합성 데이터 필터부; 및상기 제1 데이터 세트 및 상기 준합성된 데이터 세트를 저장하는, 데이터베이스를 포함하는, 데이터 생성 장치
10 10
데이터 생성 장치에 의해 수행되는 데이터 생성 방법으로서,제1 데이터 세트를 입력하는 단계;상기 제1 데이터 세트를 정규화하고 상기 정규화된 제1 데이터 세트를 제1 트레이닝 데이터 세트와 제1 테스트 데이터 세트로 분할하는 단계;상기 제1 트레이닝 데이터 세트로 제1 머신러닝 모델을 학습시키고, 미리지정된 수의 교차 검증을 사용하여 상기 제1 머신러닝 모델의 하이퍼파라미터를 최적화함으로서, 제1학습모델을 생성하는 단계;상기 제1학습모델을 상기 제1 테스트 데이터 세트로 검증하는 단계;상기 제1 데이터 세트에 의해 정의된 경계 공간 (boundary space) 내에서부터 신규 파라미터를 선택하여 생성하는 단계; 및상기 신규 파라미터에 기초하여 상기 제1학습모델을 사용하여 데이터 예측(prediction)을 수행하여 준합성(semi-synthetized)된 데이터 세트를 생성하는 단계를 포함하는, 데이터 생성 방법
11 11
제10항에 있어서, 상기 준합성된 데이터 세트를 상기 제1 데이터 세트와 결합하여 제2 데이터 세트를 생성하는 단계를 더 포함하는, 데이터 생성 방법
12 12
제11항에 있어서,상기 제2 데이터 세트를 제2 트레이닝 데이터 세트와 제2 테스트 데이터 세트로 분할하는 단계; 및상기 제2 트레이닝 데이터 세트로 제2 머신러닝 모델을 학습시키고 미리지정된 수의 교차검증을 사용하여 상기 제2 머신러닝 모델의 하이퍼파리미터를 최적화함으로서 제2학습모델을 생성하는 단계를 더 포함하는, 데이터 생성 방법
13 13
제12항에 있어서, 상기 제2 머신러닝 모델을 상기 제2 테스트 데이터 세트로 검증하여, 상기 제2학습모델의 검증정확성(validation accuracy)가 미리정해진 검증정확성 임계값보다 높은지 여부를 판정함으로서 상기 신규 파라미터의 적합성을 판정하는 단계를 더 포함하는, 데이터 생성 방법
14 14
제13항에 있어서, 상기 신규 파라미터가 적합하다고 판정되면, 상기 준합성된 데이터 세트를 유효한 데이터 세트로 식별하고 상기 제2 데이터 세트를 데이터베이스에 저장하고, 상기 신규 파라미터가 부적합하다고 판정되면, 상기 준합성된 데이터 세트를 폐기하는 단계를 더 포함하는, 데이터 생성 방법
15 15
제10항에 있어서,상기 신규 파라미터를 선택하여 생성하는 단계에서, 상기 제1 데이터 세트로부터 획득될 수 없었던 파라미터를 생성하도록 플로팅 포인트(floating poinit) 또는 정수(integer)의 무작위 수 생성기(random number generator)를 사용하여 신규 파라미터를 생성하는 것을 특징으로 하는, 데이터 생성 방법
16 16
제10항에 있어서,상기 신규 파라미터를 선택하여 생성하는 단계에서, 상기 제1 데이터 세트에 의해 정의된 경계 공간의 경계 조건(boundary condition)에 기초하여 산출된 신규 파라미터를 선택하여 생성하는 것을 특징으로 하는, 데이터 생성 방법
17 17
제12항에 있어서,상기 제1 머신러닝 모델은 SVM(Support Vector Machine) 또는 XGB(XGboost)을 사용하는 것을 특징으로 하는, 데이터 생성 방법
18 18
제12항에 있어서,상기 제2 머신러닝 모델은 상기 제1 머신러닝 모델과 동일한 것을 특징으로 하는, 데이터 생성 방법
19 19
제11항에 있어서,상기 제2 데이터 세트 및 상기 제1 머신러닝 모델에 기초하여 상기 신규 파라미터의 적합성을 판정함으로서 상기 준합성 데이터 세트를 필터링하는 단계를 더 포함하고,상기 준합성 데이터 세트 필터링 단계에서,상기 신규 파라미터의 적합하다고 판정되면, 상기 준합성 데이터 세트를 유효한 데이터 세트로 식별하여 상기 데이터베이스에 저장하고,상기 신규 파라미터가 부적합하다고 판정되면, 상기 준합성 데이터 세트를 폐기하는 것을 특징으로 하는, 데이터 생성 방법
20 20
제10항 내지 19항 중 어느 한 항의 데이터 생성 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 KAIST KAIST자체연구사업 카이스트 신소재 혁명 : M3I3 이니셔티브(2차)