1 |
1
수치형 변수 및 범주형 변수를 포함하는 혼합형 결측 데이터에 대한 데이터 보간을 수행하는 장치에 있어서, 디노이징 셀프 어텐션 네트워크를 저장하는 저장부; 및상기 수치형 변수 중 일부가 결측값을 포함하고, 상기 범주형 변수 중 일부가 결측값을 포함하는 상기 혼합형 결측 데이터를 디노이징 셀프 어텐션 네트워크에 입력하여 상기 수치형 변수의 결측값을 복원하고, 상기 범주형 변수의 결측값을 복원하는 보간부를 포함하고,상기 디노이징 셀프 어텐션 네트워크는,상기 수치형 변수, 상기 수치형 변수를 이산화한 수치형 변수 및 상기 범주형 변수에 대한 임베딩 특징 벡터를 도출하는 특징 표현 레이어;상기 수치형 변수, 상기 이산화한 수치형 변수 및 상기 범주형 변수 각각에 대한 임베딩 특징 벡터에 기초하여 상기 수치형 변수의 결측값 및 상기 범주형 변수의 결측값을 복원하는데 필요한 공유 파라미터를 도출하는 공유 레이어; 및상기 수치형 변수, 상기 이산화한 수치형 변수 및 상기 범주형 변수 각각에 대한 임베딩 특징 벡터에 기초하여 상기 수치형 변수의 결측값 및 상기 범주형 변수의 결측값을 복원하는데 필요한 각 변수별 개별 파라미터를 도출하는 태스크 개별 레이어를 포함하되,학습 수치형 변수 및 학습 범주형 변수를 포함하는 학습용 결측 데이터에 대하여 상기 특징 표현 레이어가 상기 학습 수치형 변수에 대한 임베딩 특징 벡터, 상기 학습 수치형 변수를 이산화한 학습 수치형 변수에 대한 임베딩 특징 벡터 및 상기 학습 범주형 변수에 대한 임베딩 특징 벡터를 도출하도록 상기 특징 표현 레이어를 학습시키는 학습부를 더 포함하는 것인, 데이터 보간 수행 장치
|
2 |
2
제 1 항에 있어서, 상기 특징 표현 레이어는 셀프 어텐션 레이어를 통해 상기 이산화한 수치형 변수 및 상기 범주형 변수 간의 문맥적 임베딩 벡터를 도출하는 것인, 데이터 보간 수행 장치
|
3 |
3
제 2 항에 있어서, 상기 공유 레이어는 상기 문맥적 임베딩 벡터 및 상기 수치형 변수에 대한 임베딩 특징 벡터에 기초하여 상기 수치형 변수의 결측값 및 상기 범주형 변수의 결측값을 복원하는데 필요한 공유 파라미터를 도출하는 것인, 데이터 보간 수행 장치
|
4 |
4
제 1 항에 있어서, 상기 보간부는 상기 공유 파라미터 및 상기 변수별 개별 파라미터를 이용하여 상기 수치형 변수의 결측값을 복원하고, 상기 범주형 변수의 결측값을 복원하는 것인, 데이터 보간 수행 장치
|
5 |
5
삭제
|
6 |
6
제 1 항에 있어서, 상기 학습부는 상기 특징 표현 레이어에 포함된 셀프 어텐션 레이어가 상기 이산화한 학습 수치형 변수에 대한 임베딩 특징 벡터 및 상기 학습 범주형 변수에 대한 임베딩 특징 벡터 간의 문맥적 임베딩 벡터를 도출하도록 상기 셀프 어텐션 레이어를 학습시키는 것인, 데이터 보간 수행 장치
|
7 |
7
제 6 항에 있어서, 상기 학습부는 상기 학습 수치형 변수에 대한 임베딩 특징 벡터 및 상기 문맥적 임베딩 벡터에 기초하여 상기 공유 레이어가 상기 학습 수치형 변수의 결측값 및 상기 학습 범주형 변수의 결측값을 복원하는데 필요한 공유 파라미터를 도출하도록 상기 공유 레이어를 학습시키는 것인, 데이터 보간 수행 장치
|
8 |
8
제 7 항에 있어서, 상기 학습부는 상기 태스크 개별 레이어가 상기 학습 수치형 변수의 결측값을 복원하는데 필요한 제 1 개별 파라미터를 도출하고, 상기 학습 범주형 변수 결측값을 복원하는데 필요한 제 2 개별 파라미터를 도출하도록 상기 태스크 개별 레이어를 학습시키는 것인, 데이터 보간 수행 장치
|
9 |
9
제 1 항에 있어서, 상기 보간부는 평균 복원 오차(Mean Squared Error) 손실 함수를 통해 상기 수치형 변수의 결측값을 복원하고, 교차 엔트로피(Cross Entropy) 손실 함수를 통해 상기 범주형 변수의 결측값을 복원하는 것인, 데이터 보간 수행 장치
|
10 |
10
데이터 보간 수행 장치에 의해 수행되는 수치형 변수 및 범주형 변수를 포함하는 혼합형 결측 데이터에 대한 데이터 보간을 수행하는 방법에 있어서,디노이징 셀프 어텐션 네트워크를 저장하는 단계; 및상기 수치형 변수 중 일부가 결측값을 포함하고, 상기 범주형 변수 중 일부가 결측값을 포함하는 상기 혼합형 결측 데이터를 디노이징 셀프 어텐션 네트워크에 입력하여 상기 수치형 변수의 결측값을 복원하고, 상기 범주형 변수의 결측값을 복원하는 단계를 포함하고,상기 디노이징 셀프 어텐션 네트워크는,상기 수치형 변수, 상기 수치형 변수를 이산화한 수치형 변수 및 상기 범주형 변수에 대한 임베딩 특징 벡터를 도출하는 특징 표현 레이어;상기 수치형 변수, 상기 이산화한 수치형 변수 및 상기 범주형 변수 각각에 대한 임베딩 특징 벡터에 기초하여 상기 수치형 변수의 결측값 및 상기 범주형 변수의 결측값을 복원하는데 필요한 공유 파라미터를 도출하는 공유 레이어; 및상기 수치형 변수, 상기 이산화한 수치형 변수 및 상기 범주형 변수 각각에 대한 임베딩 특징 벡터에 기초하여 상기 수치형 변수의 결측값 및 상기 범주형 변수의 결측값을 복원하는데 필요한 각 변수별 개별 파라미터를 도출하는 태스크 개별 레이어를 포함하되,상기 데이터 보간을 수행하는 방법은 학습 수치형 변수 및 학습 범주형 변수를 포함하는 학습용 결측 데이터에 대하여 상기 특징 표현 레이어가 상기 학습 수치형 변수에 대한 임베딩 특징 벡터, 상기 학습 수치형 변수를 이산화한 학습 수치형 변수에 대한 임베딩 특징 벡터 및 상기 학습 범주형 변수에 대한 임베딩 특징 벡터를 도출하도록 상기 특징 표현 레이어를 학습시키는 단계를 더 포함하는 것인, 데이터 보간 방법
|