1 |
1
Weighted Integral Probability Metric (WIPM) 연산을 포함하는 함수들의 함수들의 집합이 가설공간 Reproducing Kernel Hilbert Space (RKHS)의 닫힌 구 형태인 조건을 만족할 때 상기 Weighted Integral Probability Metric (WIPM) 연산이 가지는 성질을 이용하여 Supervised Learning의 기법을 Positive Unlabeled Learning에 접목함으로써 미분류된 표본들 외에 일부의 양성 표본만을 가지고도 적은 계산량으로 양성 자료와 음성 자료를 구분할 수 있는 Weighted Maximum Mean Discrepancy (WMMD) 이진 분류 방법에 있어서,(a) 컴퓨팅 장치가, 미지의 테스트 자료 벡터를 획득하면, (i) 기획득된 양성 표본 벡터들에 대한 정보를 참조로 하여 상기 테스트 자료 벡터에 상기 WIPM 연산의 성질을 이용한 WMMD 커널 연산을 적용함으로써 양성 WMMD 스코어를 생성하는 프로세스 및 (ii) 기획득된 미분류 표본 벡터들에 대한 정보를 참조로 하여 상기 테스트 자료 벡터에 상기 WMMD 커널 연산을 적용함으로써 미분류 WMMD 스코어를 생성하는 프로세스를 수행하는 단계; 및(b) 상기 컴퓨팅 장치가, 상기 양성 WMMD 스코어 및 상기 미분류 WMMD 스코어를 참조로 하여 클래시피케이션 스코어를 생성한 후, (i) 상기 클래시피케이션 스코어 및 (ii) WMMD 바운더리 스코어를 이용하여 상기 테스트 자료 벡터가 상기 양성 자료에 속하는지 또는 상기 음성 자료에 속하는지 여부를 판단한 후 결과를 출력하는 단계를 포함하되,상기 WMMD 바운더리 스코어는, 미분류 자료의 분포 중에서 상기 양성 자료의 분포가 차지하는 비율 값에 대응하는 Class-Prior 값 또는 상기 미분류 자료의 상기 분포 및 상기 양성 자료의 상기 분포에 대응하는 소정 표본을 통해 상기 비율 값으로 추정된 값을 참조로 하여 획득된 것을 특징으로 하는 방법
|
2 |
2
제 1항에 있어서,상기 WMMD 커널 연산은 특정 가정 하에서 경험적 WMMD 최적화 함수를 해석적으로 계산할 수 있는 Reproducing Kernel 연산들 중 적어도 하나로 선택되되,상기 수식에서, 는 상기 양성 표본 벡터들에 대응하는 제1 확률 분포이고, 는 상기 미분류 표본 벡터들에 대응하는 제2 확률 분포며, 은 상기 RKHS 상의 반지름 을 가지는 닫힌 구 형태의 공간을 의미하며, 는 상기 미분류 표본 벡터들의 개수를 의미하고, 는 상기 양성 표본 벡터들의 개수를 의미하며, 는 상기 Class-Prior 값에 대응하는 weight 값을 의미하고, 는 제i 양성 표본 벡터를 의미하며, 는 제i 미분류 표본 벡터를 의미할 때, 는 상기 수식을 만족하는 상기 경험적 WMMD 최적화 함수이고, 상기 Reproducing Kernel 연산은, 상기 WMMD 연산이 상기 RKHS 상의 반지름 을 가지는 닫힌 구 형태의 공간 상에서 이루어진다는 가정인 상기 특정 가정 하에서 상기 경험적 WMMD 최적화 함수를 해석적으로 계산할 수 있는 것을 특징으로 하는 방법
|
3 |
3
제 2항에 있어서,상기 (a) 단계 이전에,상기 WMMD 커널 연산은, 소정 관리자에 의해 상기 Reproducing Kernel 연산들 중 하나인 가우시안 커널 연산으로 선택된 후 상기 컴퓨팅 장치에 입력되되,상기 가우시안 커널 연산은 상기 수식을 따르고, 상기 수식의 하이퍼파라미터 는 상기 양성 표본 벡터들과 상기 미분류 표본 벡터들에 대한 분류 결과를 이용해 생성된 경험적 오분류 추정 값을 최소화하는 값으로 결정되는 것을 특징으로 하는 방법
|
4 |
4
제 1항에 있어서,상기 (a) 단계는,상기 컴퓨팅 장치가, 하기 수식에 따라 상기 양성 WMMD 스코어를 생성하고,는 상기 양성 표본 벡터의 개수를 의미하고, 는 제i 양성 표본 벡터를 의미하며, 는 상기 테스트 자료 벡터를 의미하고, 은 상기 WMMD 커널 연산을 의미하는 것을 특징으로 하는 방법
|
5 |
5
제 1항에 있어서,상기 (a) 단계는,상기 컴퓨팅 장치가, 하기 수식에 따라 상기 미분류 WMMD 스코어를 생성하고,는 상기 미분류 표본 벡터의 개수를 의미하고, 는 제i 미분류 표본 벡터를 의미하며, 는 상기 테스트 자료 벡터를 의미하고, 는 상기 WMMD 커널 연산을 의미하는 것을 특징으로 하는 방법
|
6 |
6
제 1항에 있어서,상기 (b) 단계는,상기 컴퓨팅 장치가, 상기 양성 WMMD 스코어의 상기 미분류 WMMD 스코어에 대한 비율 값을 계산하고, 상기 비율 값을 참조로 하여 상기 클래시피케이션 스코어를 생성한 후, 상기 클래시피케이션 스코어가, 상기 WMMD 바운더리 스코어를 기준으로 하여 제1 영역에 속하는지 또는 제2 영역에 속하는지 여부를 판단함으로써 상기 테스트 자료 벡터가 상기 양성 자료에 속하는지 또는 상기 음성 자료에 속하는지 여부를 판단하는 것을 특징으로 하는 방법
|
7 |
7
제 1항에 있어서,상기 미분류 자료의 분포 중에서 상기 양성 자료의 분포가 차지하는 상기 비율 값이 주어지지 않은 경우, 상기 컴퓨팅 장치가, 상기 RKHS 상에서 동작하는 KM1 방식을 통해 상기 비율 값을 추정하고, 이를 이용하여 상기 WMMD 바운더리 스코어를 생성하는 것을 특징으로 하는 방법
|
8 |
8
Weighted Integral Probability Metric (WIPM) 연산을 포함하는 함수들의 집합이 가설공간 Reproducing Kernel Hilbert Space (RKHS)의 닫힌 구 형태인 조건을 만족할 때 상기 Weighted Integral Probability Metric (WIPM)연산이 가지는 성질을 이용하여 Supervised Learning의 기법을 Positive Unlabeled Learning에 접목함으로써 미분류된 표본들 외에 일부의 양성 표본만을 가지고도 적은 계산량으로 양성 자료와 음성 자료를 구분할 수 있는 Weighted Maximum Mean Discrepancy (WMMD) 이진 분류 방법을 수행하는 컴퓨팅 장치에 있어서,인스트럭션들을 저장하는 하나 이상의 메모리; 및상기 인스트럭션들을 수행하도록 설정된 하나 이상의 프로세서를 포함하되,상기 프로세서는, (I) 미지의 테스트 자료 벡터를 획득하면, (i) 기획득된 양성 표본 벡터들에 대한 정보를 참조로 하여 상기 테스트 자료 벡터에 상기 WIPM 연산의 성질을 이용한 WMMD 커널 연산을 적용함으로써 양성 WMMD 스코어를 생성하는 프로세스 및 (ii) 기획득된 미분류 표본 벡터들에 대한 정보를 참조로 하여 상기 테스트 자료 벡터에 상기 WMMD 커널 연산을 적용함으로써 미분류 WMMD 스코어를 생성하는 프로세스를 수행하는 프로세스; 및 (II) 상기 컴퓨팅 장치가, 상기 양성 WMMD 스코어 및 상기 미분류 WMMD 스코어를 참조로 하여 클래시피케이션 스코어를 생성한 후, (i) 상기 클래시피케이션 스코어 및 (ii) WMMD 바운더리 스코어를 이용하여 상기 테스트 자료 벡터가 상기 양성 자료에 속하는지 또는 상기 음성 자료에 속하는지 여부를 판단한 후 결과를 출력하는 프로세스를 수행하는 것을 특징으로 하되,상기 WMMD 바운더리 스코어는, 미분류 자료의 분포 중에서 상기 양성 자료의 분포가 차지하는 비율 값에 대응하는 Class-Prior 값 또는 상기 미분류 자료의 상기 분포 및 상기 양성 자료의 상기 분포에 대응하는 소정 표본을 통해 상기 비율 값으로 추정된 값을 참조로 하여 획득된 것을 특징으로 하는 컴퓨팅 장치
|
9 |
9
제 8항에 있어서,상기 WMMD 커널 연산은 특정 가정 하에서 경험적 WMMD 최적화 함수를 해석적으로 계산할 수 있는 Reproducing Kernel 연산들 중 적어도 하나로 선택되되,상기 수식에서, 는 상기 양성 표본 벡터들에 대응하는 제1 확률 분포이고, 는 상기 미분류 표본 벡터들에 대응하는 제2 확률 분포며, 은 상기 RKHS 상의 반지름 을 가지는 닫힌 구 형태의 공간을 의미하며, 는 상기 미분류 표본 벡터들의 개수를 의미하고, 는 상기 양성 표본 벡터들의 개수를 의미하며, 는 상기 Class-Prior 값에 대응하는 weight 값을 의미하고, 는 제i 양성 표본 벡터를 의미하며, 는 제i 미분류 표본 벡터를 의미할 때, 는 상기 수식을 만족하는 상기 경험적 WMMD 최적화 함수이고, 상기 Reproducing Kernel 연산은, 상기 WMMD 연산이 상기 RKHS 상의 반지름 을 가지는 닫힌 구 형태의 공간 상에서 이루어진다는 가정인 상기 특정 가정 하에서 상기 경험적 WMMD 최적화 함수를 해석적으로 계산할 수 있는 것을 특징으로 하는 컴퓨팅 장치
|
10 |
10
제 9항에 있어서,상기 (I) 프로세스 이전에,상기 WMMD 커널 연산은, 소정 관리자에 의해 상기 Reproducing Kernel 연산들 중 하나인 가우시안 커널 연산으로 선택된 후 상기 컴퓨팅 장치에 입력되되,상기 가우시안 커널 연산은 상기 수식을 따르고, 상기 수식의 하이퍼파라미터 는 상기 양성 표본 벡터들과 상기 미분류 표본 벡터들에 대한 분류 결과를 이용해 생성된 경험적 오분류 추정 값을 최소화하는 값으로 결정되는 것을 특징으로 하는 컴퓨팅 장치
|
11 |
11
제 8항에 있어서,상기 (I) 프로세스는,상기 프로세서가, 하기 수식에 따라 상기 양성 WMMD 스코어를 생성하고,는 상기 양성 표본 벡터의 개수를 의미하고, 는 제i 양성 표본 벡터를 의미하며, 는 상기 테스트 자료 벡터를 의미하고, 은 상기 WMMD 커널 연산을 의미하는 것을 특징으로 하는 컴퓨팅 장치
|
12 |
12
제 8항에 있어서,상기 (I) 프로세스는,상기 프로세서가, 하기 수식에 따라 상기 미분류 WMMD 스코어를 생성하고,는 상기 미분류 표본 벡터의 개수를 의미하고, 는 제i 미분류 표본 벡터를 의미하며, 는 상기 테스트 자료 벡터를 의미하고, 는 상기 WMMD 커널 연산을 의미하는 것을 특징으로 하는 컴퓨팅 장치
|
13 |
13
제 8항에 있어서,상기 (II) 프로세스는,상기 프로세서가, 상기 양성 WMMD 스코어의 상기 미분류 WMMD 스코어에 대한 비율 값을 계산하고, 상기 비율 값을 참조로 하여 상기 클래시피케이션 스코어를 생성한 후, 상기 클래시피케이션 스코어가, 상기 WMMD 바운더리 스코어를 기준으로 하여 제1 영역에 속하는지 또는 제2 영역에 속하는지 여부를 판단함으로써 상기 테스트 자료 벡터가 상기 양성 자료에 속하는지 또는 상기 음성 자료에 속하는지 여부를 판단하는 것을 특징으로 하는 컴퓨팅 장치
|
14 |
14
제 8항에 있어서,상기 미분류 자료의 분포 중에서 상기 양성 자료의 분포가 차지하는 상기 비율 값이 주어지지 않은 경우, 상기 프로세서가, 상기 RKHS 상에서 동작하는 KM1 방식을 통해 상기 비율 값을 추정하고, 이를 이용하여 상기 WMMD 바운더리 스코어를 생성하는 것을 특징으로 하는 컴퓨팅 장치
|