맞춤기술찾기

이전대상기술

불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법 및 장치

  • 기술번호 : KST2020002188
  • 담당센터 : 경기기술혁신센터
  • 전화번호 : 031-8006-1570
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법 및 장치에 관한 것으로, 본 발명의 일 실시 예에 따른 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법은, 불균형 원본 데이터를 복수의 클래스 데이터로 구분하고, 상기 구분된 복수의 클래스 데이터를 각각 학습하여 각각의 클래스에 대한 리프리젠테이션 모델(Representation model)을 구축하는 단계, 및 상기 복수의 클래스 데이터와 상기 구축된 복수의 리프리젠테이션 모델을 각각 조합하여 계산된 클래스 데이터 및 리프리젠테이션 모델 간의 적합도에 따라, 상기 계산된 적합도가 임계값 미만인 클래스 데이터를 제거하여 상기 불균형 원본 데이터를 언더 샘플링(Under-sampling)하는 단계를 포함한다.
Int. CL G06F 16/00 (2019.01.01) G06N 99/00 (2019.01.01)
CPC G06F 16/353(2013.01) G06F 16/353(2013.01)
출원번호/일자 1020180106142 (2018.09.05)
출원인 성균관대학교산학협력단
등록번호/일자
공개번호/일자 10-2020-0027834 (2020.03.13) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.09.05)
심사청구항수 17

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 성균관대학교산학협력단 대한민국 경기도 수원시 장안구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 임윤규 경기도 하남시 위례중앙로 ***, **
2 김누리 경기도 수원시 장안구
3 이지형 서울특별시 용산구
4 이상헌 경기도 수원시 장안구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 인비전 특허법인 대한민국 서울특별시 강남구 테헤란로 **길**, *층(대치동, 동산빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 성균관대학교산학협력단 경기도 수원시 장안구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.09.05 수리 (Accepted) 1-1-2018-0884468-67
2 [출원서등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2018.12.24 수리 (Accepted) 1-1-2018-1299150-11
3 의견제출통지서
Notification of reason for refusal
2019.12.16 발송처리완료 (Completion of Transmission) 9-5-2019-0906007-20
4 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2020.02.05 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2020-0122377-08
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2020.02.05 수리 (Accepted) 1-1-2020-0122376-52
6 최후의견제출통지서
Notification of reason for final refusal
2020.04.27 발송처리완료 (Completion of Transmission) 9-5-2020-0291786-23
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2020.06.09 보정승인 (Acceptance of amendment) 1-1-2020-0592555-74
8 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2020.06.09 수리 (Accepted) 1-1-2020-0592556-19
9 등록결정서
Decision to grant
2020.07.28 발송처리완료 (Completion of Transmission) 9-5-2020-0512630-94
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
데이터 처리 장치에 의해 수행되는 불균형 데이터를 위한 데이터 처리 방법으로서, 불균형 원본 데이터를 복수의 클래스 데이터로 구분하고, 상기 구분된 복수의 클래스 데이터를 각각 학습하여 각각의 클래스에 대한 리프리젠테이션 모델(Representation model)을 구축하는 단계; 상기 복수의 클래스 데이터와 상기 구축된 복수의 리프리젠테이션 모델을 각각 조합하여 계산된 클래스 데이터 및 리프리젠테이션 모델 간의 적합도에 따라, 상기 계산된 적합도가 임계값 미만인 클래스 데이터를 제거하여 상기 불균형 원본 데이터를 언더 샘플링(Under-sampling)하는 단계; 상기 언더 샘플링된 불균형 원본 데이터를 분류기를 이용하여 분류하는 단계; 및 상기 분류기의 분류 결과, 분류기의 성능이 기설정된 분류 기준치 미만인 경우 상기 임계값을 업데이트하는 단계를 포함하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
2 2
삭제
3 3
삭제
4 4
제1항에 있어서,상기 임계값을 업데이트하는 단계는, 상기 임계값을 임계 조정값만큼 조정하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
5 5
제1항에 있어서,상기 모델을 구축하는 단계는,각 클래스 데이터의 구조적 특징을 학습하여 각 클래스 데이터에 대한 리프리젠테이션 모델을 생성하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
6 6
제1항에 있어서,상기 모델을 구축하는 단계는,각 클래스 데이터에 대한 리프리젠테이션 모델 생성 시, 각 클래스 데이터에 대한 리프리젠테이션 모델의 입력과 출력을 동일한 데이터로 설정하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
7 7
제1항에 있어서,상기 리프리젠테이션 모델은, 오토 인코더(Auto-encoder) 구조를 사용하고, 복수의 층 구조와 정류된 선형 유닛(ReLU, Rectified Linear Unit) 함수로 이루어지는 인코더(encoder)와, 복수의 층 구조와 쌍곡선 탄젠트 함수(tanh, Hyperbolic Tangent) 함수로 이루어지는 디코더(decoder)를 포함하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
8 8
제1항에 있어서,상기 언더 샘플링하는 단계는, 상기 복수의 클래스 데이터 중에서 어느 하나의 클래스 데이터와, 상기 복수의 리프리젠테이션 모델 중에서 어느 하나의 리프리젠테이션 모델을 조합하여 데이터 및 모델 간의 적합도를 계산하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
9 9
제1항에 있어서,상기 언더 샘플링하는 단계는, 데이터 및 모델 간의 적합도 계산 시, 조합된 클래스 데이터의 인스턴스(instance)와 조합된 리프리젠테이션 모델 간의 복원 에러(reconstruction error)를 데이터 및 모델 간의 적합도로 계산하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
10 10
제1항에 있어서,상기 복수의 클래스 데이터 중에서 제2 클래스 데이터의 적합도가 특정값을 초과하는 제2 클래스 데이터의 집합 수가, 제1 클래스 데이터의 수 이상이고 제2 클래스 데이터의 수 미만인 경우에 상기 특정값을 탐색하여 임계값으로 정의하는 단계를 더 포함하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 방법
11 11
불균형 원본 데이터를 저장하는 메모리; 및 상기 메모리와 연결된 프로세서를 포함하고, 상기 프로세서는 불균형 원본 데이터를 복수의 클래스 데이터로 구분하고, 상기 구분된 복수의 클래스 데이터를 각각 학습하여 각각의 클래스에 대한 리프리젠테이션 모델(Representation model)을 구축하고, 상기 복수의 클래스 데이터와 상기 구축된 복수의 리프리젠테이션 모델을 각각 조합하여 계산된 클래스 데이터 및 리프리젠테이션 모델 간의 적합도에 따라, 상기 계산된 적합도가 임계값 미만인 클래스 데이터를 제거하여 상기 불균형 원본 데이터를 언더 샘플링(Under-sampling)하고,상기 언더 샘플링된 불균형 원본 데이터를 분류하는 분류기를 더 포함하고,상기 프로세서는, 상기 분류기의 분류 결과, 분류기의 성능이 기설정된 분류 기준치 미만인 경우 상기 임계값을 업데이트하는, 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
12 12
삭제
13 13
삭제
14 14
제11항에 있어서,상기 프로세서는, 상기 임계값을 임계 조정값만큼 조정하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
15 15
제11항에 있어서,상기 프로세서는, 각 클래스 데이터의 구조적 특징을 학습하여 각 클래스 데이터에 대한 리프리젠테이션 모델을 생성하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
16 16
제11항에 있어서,상기 프로세서는, 각 클래스 데이터에 대한 리프리젠테이션 모델 생성 시, 각 클래스 데이터에 대한 리프리젠테이션 모델의 입력과 출력을 동일한 데이터로 설정하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
17 17
제11항에 있어서,상기 리프리젠테이션 모델은, 오토 인코더(Auto-encoder) 구조를 사용하고, 복수의 층 구조와 정류된 선형 유닛(ReLU, Rectified Linear Unit) 함수로 이루어지는 인코더(encoder)와, 복수의 층 구조와 쌍곡선 탄젠트 함수(tanh, Hyperbolic Tangent) 함수로 이루어지는 디코더(decoder)를 포함하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
18 18
제11항에 있어서,상기 프로세서는, 상기 복수의 클래스 데이터 중에서 어느 하나의 클래스 데이터와, 상기 복수의 리프리젠테이션 모델 중에서 어느 하나의 리프리젠테이션 모델을 조합하여 데이터 및 모델 간의 적합도를 계산하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
19 19
제11항에 있어서,상기 프로세서는, 데이터 및 모델 간의 적합도 계산 시, 조합된 클래스 데이터의 인스턴스(instance)와 조합된 리프리젠테이션 모델 간의 복원 에러(reconstruction error)를 데이터 및 모델 간의 적합도로 계산하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
20 20
제11항에 있어서,상기 프로세서는, 상기 복수의 클래스 데이터 중에서 제2 클래스 데이터의 적합도가 특정값을 초과하는 제2 클래스 데이터의 집합 수가, 제1 클래스 데이터의 수 이상이고 제2 클래스 데이터의 수 미만인 경우에 상기 특정값을 탐색하여 임계값으로 정의하는 불균형 데이터를 위한 리프리젠테이션 모델 기반의 데이터 처리 장치
21 21
불균형 데이터를 위한 리프리젠테이션 모델 기반의 언더 샘플링 방법을 컴퓨터에 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체로서, 불균형 원본 데이터를 복수의 클래스 데이터로 구분하고, 상기 구분된 복수의 클래스 데이터를 각각 학습하여 각각의 클래스에 대한 리프리젠테이션 모델(Representation model)을 구축하는 단계; 상기 복수의 클래스 데이터와 상기 구축된 복수의 리프리젠테이션 모델을 각각 조합하여 계산된 클래스 데이터 및 리프리젠테이션 모델 간의 적합도에 따라, 상기 계산된 적합도가 임계값 미만인 클래스 데이터를 제거하여 상기 불균형 원본 데이터를 언더 샘플링(Under-sampling)하는 단계; 상기 언더 샘플링된 불균형 원본 데이터를 분류기를 이용하여 분류하는 단계; 및 상기 분류기의 분류 결과, 분류기의 성능이 기설정된 분류 기준치 미만인 경우 상기 임계값을 업데이트하는 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 성균관대학교(자연과학캠퍼스) 중견연구자지원사업(중견연구 총연구비1.5억초과~3억이하) 3/3 초불균형 데이터의 분석 및 예측을 위한 기계학습 원천기술 개발
2 과학기술정보통신부 성균관대학교 산학협력단 SW중심대학지원사업 4/4 SW중심대학(성균관대)
3 과학기술정보통신부 성균관대학교(자연과학캠퍼스) 차세대정보컴퓨팅기술개발사업 2단계 1/2 의미 분석을 통한 연구내용 기반 상시 모니터링 시스템 개발