맞춤기술찾기

이전대상기술

강화 학습을 기반으로 한 데이터 전처리 시스템 및 방법

  • 기술번호 : KST2022001999
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 강화 학습을 이용한 데이터 전처리 장치 및 방법에 관한 것이다. 상기 데이터 전처리 장치는, 컨트롤러 모델과 차일드 모델을 구비하여, 결측값을 대치하는 결측값 대치 모듈; 및 DQN(Deep Q-Network) 알고리즘을 이용한 강화 학습을 통해 불균형 데이터를 분류하는 불균형 데이터 분류 모듈;을 구비한다. 상기 결측값 대치 모듈은, 컨트롤러 모델에 의해 결측값에 대치할 값들의 벡터를 샘플링하고, 차일드 모델을 통해 상기 샘플링된 값들을 결측값에 대치시킨 후 성능을 계산하고, 상기 차일드 모델에 의해 계산된 보상값을 기반으로 하여 PPO(Proximal Policy Optimization) 알고리즘을 적용하여 차일드 모델의 정확도가 높아지도록 상기 컨트롤러 모델을 강화 학습시키게 된다. 상기 불균형 데이터 분류 모듈은 DQN 알고리즘을 통하여 각 클래스 샘플 수에 따라 보상을 줌으로써 소수 범주에 있는 데이터가 더 잘 분류될 수 있게 된다.
Int. CL G06N 3/08 (2006.01.01) G06N 3/04 (2006.01.01)
CPC G06N 3/08(2013.01) G06N 3/04(2013.01)
출원번호/일자 1020200094758 (2020.07.29)
출원인 서강대학교산학협력단
등록번호/일자
공개번호/일자 10-2022-0014744 (2022.02.07) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.07.02)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서강대학교산학협력단 대한민국 서울특별시 마포구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 최서린 전라남도 순천시 삼산로 *
2 양지훈 서울특별시 은평구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이지연 대한민국 서울특별시 관악구 남부순환로 ****, ***호 제니스국제특허법률사무소 (봉천동, 청동빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.07.29 수리 (Accepted) 1-1-2020-0797277-83
2 직권정정안내서
Notification of Ex officio Correction
2020.07.29 발송처리완료 (Completion of Transmission) 1-5-2020-0112813-17
3 수수료 반환 안내서
Notification of Return of Official Fee
2020.07.29 발송처리완료 (Completion of Transmission) 1-5-2020-0112812-72
4 [심사청구]심사청구서·우선심사신청서
2021.07.02 수리 (Accepted) 1-1-2021-0765638-13
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
강화 학습을 이용한 데이터 전처리 장치에 있어서, 컨트롤러 모델과 차일드 모델을 구비하여, 결측값을 대치하는 결측값 대치 모듈;을 포함하며, 상기 컨트롤러 모델은 결측값에 대치할 값들의 벡터를 샘플링해주는 것을 특징으로 하며, 상기 차일드 모델은 상기 컨트롤러 모델에 의해 샘플링된 값들을 결측값에 대치시킨 후 성능을 계산하는 것을 특징으로 하며, 상기 차일드 모델에 의해 계산된 성능을 이용하여 상기 컨트롤러 모델을 학습시키는 것을 특징으로 하는 강화 학습을 이용한 데이터 전처리 장치
2 2
제1항에 있어서, 상기 컨트롤러 모델에 의해 샘플링된 벡터는 결측값들에 대치될 값들의 분포의 평균으로 이루어진 벡터와 표준 편차로 이루어진 벡터인 것을 특징으로 하는 데이터 전처리 장치
3 3
제1항에 있어서, 상기 컨트롤러 모델은, 데이터의 결측값에 이전 액션의 값인 대치값을 채워 넣은 후 1차원 배열로 변환시킨 벡터가 입력되며, 입력된 데이터들에 대하여 학습하여 결측값에 대치할 값들을 샘플링하는 신경망 구조; 및상기 신경망 구조로부터 제공된 샘플링된 값들에 대하여 Fully-Connected layer를 거쳐 가우시안 분포의 평균(μ)과 표준편차(σ)를 생성하여 제공하는 연속적인 액션 공간에서의 정책 생성 네트워크;를 구비하는 것을 특징으로 하는 데이터 전처리 장치
4 4
제1항에 있어서, 상기 차일드 모델은,결측값이 대치된 데이터들 중 학습 데이터로 학습시키고 시험 데이터로 정확도를 계산하며,현재 상태에서 계산된 정확도와 이전 상태에서 계산된 정확도의 차이를 보상값으로 정의하는 것을 특징으로 하며, 상기 컨트롤러 모델은 상기 차일드 모델에 의해 계산된 보상값을 기반으로 하여 PPO(Proximal Policy Optimization) 알고리즘을 적용하여 강화 학습시키는 것을 특징으로 하는 데이터 전처리 장치
5 5
제1항에 있어서, 상기 컨트롤러 모델은 PPO 알고리즘을 이용한 정책 기반 강화 학습을 통해 업데이트시키는 것을 특징으로 하며, 상기 정책 기반 강화 학습의 목표는 정책을 근사하는 정책 함수()를 최대화시키는 정책 함수 파라미터(θ)를 찾는 것을 특징으로 하는 데이터 전처리 장치
6 6
제1항에 있어서, 상기 데이터 전처리 장치는, DQN(Deep Q-Network) 알고리즘을 이용한 강화 학습을 통해 불균형 데이터를 분류하는 불균형 데이터 분류 모듈;을 더 구비하고, 상기 DQN 알고리즘은 CNN(Convolution Neural Network)을 이용하여 Q 함수를 학습하는 것을 특징으로 하au,상기 Q 함수는 강화 학습에서 상태-액션 조합의 질을 계산하는 함수인 것을 특징으로 하는 데이터 전처리 장치
7 7
제6항에 있어서, 상기 DQN 알고리즘은, 입력 데이터가 들어오면 입력 데이터가 속하는 클래스를 예측하고, 옳게 예측하면 양의 보상을 주고 옳지 않게 예측하면 음의 보상을 주는 것을 특징으로 하며, 보상을 주기 위하여, 입력 데이터마다 클래스별 샘플수를 계산하고, 소수 클래스는 전체 데이터수를 가장 많은 클래스별 샘플수로 나누어준 값을 보상으로 주고, 다수 클래스는 전체 데이터수를 자장 작은 클래스별 샘플수로 나누어준 값을 보상으로 줌으로써, 소수 범주에 있는 데이터가 더 잘 분류되도록 구성된 것을 특징으로 하는 데이터 전처리 장치
8 8
강화 학습을 이용한 데이터 전처리 방법에 있어서, (a1) 컨트롤러 모델에 의해 결측값에 대치할 값들의 벡터를 샘플링해주는 단계; (a2) 차일드 모델에 의해 상기 컨트롤러 모델에 의해 샘플링된 값들을 결측값에 대치시킨 후 성능을 계산하는 단계; (a3) 상기 차일드 모델에 의해 계산된 성능을 이용하여 상기 컨트롤러 모델을 학습시키는 단계;를 포함하여, 결측값을 대치하는 결측값을 대치하는 것을 특징으로 하는 강화 학습을 이용한 데이터 전처리 방법
9 9
제8항에 있어서, 상기 (a1) 단계는, 데이터의 결측값에 이전 액션의 값인 대치값을 채워 넣은 후 1차원 배열로 변환시킨 벡터가 신경망 구조로 입력되고,신경망 구조로 입력된 데이터들에 대하여 학습하여 결측값에 대치할 값들을 샘플링하고, 상기 신경망 구조로부터 제공된 샘플링된 값들에 대하여 Fully-Connected layer를 거쳐 가우시안 분포의 평균(μ)과 표준편차(σ)를 생성하여 제공하는 것을 특징으로 하는 데이터 전처리 방법
10 10
제8항에 있어서, 상기 (a2) 단계는,결측값이 대치된 데이터들 중 학습 데이터로 학습시키고 시험 데이터로 정확도를 계산하며,현재 상태에서 계산된 정확도와 이전 상태에서 계산된 정확도의 차이를 보상값으로 정의하는 것을 특징으로 하며, 상기 컨트롤러 모델은 상기 차일드 모델에 의해 계산된 보상값을 기반으로 하여 PPO(Proximal Policy Optimization) 알고리즘을 적용하여 강화 학습시키는 것을 특징으로 하는 데이터 전처리 방법
11 11
제8항에 있어서, 상기 데이터 전처리 방법은, (b) 결측값이 대치된 데이터들에 대하여, DQN(Deep Q-Network) 알고리즘을 이용한 강화 학습을 통해 불균형 데이터를 분류하는 단계;를 더 구비하고, 상기 DQN 알고리즘은 CNN(Convolution Neural Network)을 이용하여 Q 함수를 학습하는 것을 특징으로 하며,상기 Q 함수는 강화 학습에서 상태-액션 조합의 질을 계산하는 함수인 것을 특징으로 하는 데이터 전처리 방법
12 12
제11항에 있어서, 상기 DQN 알고리즘은, 입력 데이터가 들어오면 입력 데이터가 속하는 클래스를 예측하고, 옳게 예측하면 양의 보상을 주고 옳지 않게 예측하면 음의 보상을 주는 것을 특징으로 하며, 보상을 주기 위하여, 입력 데이터마다 클래스별 샘플수를 계산하고, 소수 클래스는 전체 데이터수를 가장 많은 클래스별 샘플수로 나누어준 값을 보상으로 주고, 다수 클래스는 전체 데이터수를 자장 작은 클래스별 샘플수로 나누어준 값을 보상으로 줌으로써, 소수 범주에 있는 데이터가 더 잘 분류되도록 구성된 것을 특징으로 하는 데이터 전처리 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.