맞춤기술찾기

이전대상기술

Weighted Maximum Mean Discrepancy 연산의 성질을 사용하여 양성-미분류 자료 학습 방법을 적용함으로써 이진 분류를 수행하는 방법 및 장치

  • 기술번호 : KST2021000296
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 함수들의 집합이 가설공간 Reproducing Kernel Hilbert Space (RKHS)의 닫힌 구 형태인 조건을 만족할 때 Weighted Integral Probability Metric (WIPM)연산이 가지는 성질을 이용하여 Supervised Learning의 기법을 Positive Unlabeled Learning에 접목함으로써 미분류된 표본들 외에 일부의 양성 표본만을 가지고도 적은 계산량으로 양성 자료와 음성 자료를 구분할 수 있는 Weighted Maximum Mean Discrepancy (WMMD) 이진 분류 방법이 개시된다. 즉, (a) 컴퓨팅 장치가, 미지의 테스트 자료 벡터를 획득하면, (i) 기획득된 양성 표본 벡터들에 대한 정보를 참조로 하여 상기 테스트 자료 벡터에 상기 WIPM 연산의 성질을 이용한 WMMD 커널 연산을 적용함으로써 양성 WMMD 스코어를 생성하는 프로세스 및 (ii) 기획득된 미분류 표본 벡터들에 대한 정보를 참조로 하여 상기 테스트 자료 벡터에 상기 WMMD 커널 연산을 적용함으로써 미분류 WMMD 스코어를 생성하는 프로세스를 수행하는 단계; 및 (b) 상기 컴퓨팅 장치가, 상기 양성 WMMD 스코어 및 상기 미분류 WMMD 스코어를 참조로 하여 클래시피케이션 스코어를 생성한 후, (i) 상기 클래시피케이션 스코어 및 (ii) WMMD 바운더리 스코어를 이용하여 상기 테스트 자료 벡터가 상기 양성 자료에 속하는지 또는 상기 음성 자료에 속하는지 여부를 판단한 후 결과를 출력하는 단계를 포함하되, 상기 WMMD 바운더리 스코어는, 미분류 자료의 분포에 대한 상기 양성 자료의 분포가 차지하는 비율 값에 대응하는 Class-Prior 값 또는 표본을 통해 상기 비율 값으로 추정된 값을 참조로 하여 획득된 것을 특징으로 하는 방법이 개시된다.
Int. CL G06N 3/08 (2006.01.01) G06N 20/10 (2019.01.01)
CPC G06N 3/08(2013.01) G06N 20/10(2013.01) G06F 17/16(2013.01)
출원번호/일자 1020190097032 (2019.08.08)
출원인 서울대학교산학협력단
등록번호/일자 10-2202823-0000 (2021.01.08)
공개번호/일자
공고번호/일자 (20210115) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2019.08.08)
심사청구항수 14

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 백명희조 서울시 강남구
2 마사시 스기야마 리켄, 인공지능 프로젝트 센터, 니혼바시 *촌 미쯔
3 권용찬 경상북도 포항시 남구
4 김원영 경기도 남양주시

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 수 대한민국 서울특별시 강남구 강남대로**길 **, *층(역삼동, 케이앤와이빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 서울특별시 관악구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2019.08.08 수리 (Accepted) 1-1-2019-0816042-38
2 선행기술조사의뢰서
Request for Prior Art Search
2020.05.11 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2020.08.12 발송처리완료 (Completion of Transmission) 9-6-2020-0114799-33
4 의견제출통지서
Notification of reason for refusal
2020.08.28 발송처리완료 (Completion of Transmission) 9-5-2020-0592618-09
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2020.10.28 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2020-1149935-75
6 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2020.10.28 수리 (Accepted) 1-1-2020-1149925-18
7 [출원서 등 보완]보정서
2020.10.28 수리 (Accepted) 1-1-2020-1149916-18
8 [공지예외적용 보완 증명서류]서류제출서
2020.10.28 수리 (Accepted) 1-1-2020-1149923-27
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.11.25 수리 (Accepted) 4-1-2020-5265458-48
10 등록결정서
Decision to grant
2020.12.24 발송처리완료 (Completion of Transmission) 9-5-2020-0906148-73
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
Weighted Integral Probability Metric (WIPM) 연산을 포함하는 함수들의 함수들의 집합이 가설공간 Reproducing Kernel Hilbert Space (RKHS)의 닫힌 구 형태인 조건을 만족할 때 상기 Weighted Integral Probability Metric (WIPM) 연산이 가지는 성질을 이용하여 Supervised Learning의 기법을 Positive Unlabeled Learning에 접목함으로써 미분류된 표본들 외에 일부의 양성 표본만을 가지고도 적은 계산량으로 양성 자료와 음성 자료를 구분할 수 있는 Weighted Maximum Mean Discrepancy (WMMD) 이진 분류 방법에 있어서,(a) 컴퓨팅 장치가, 미지의 테스트 자료 벡터를 획득하면, (i) 기획득된 양성 표본 벡터들에 대한 정보를 참조로 하여 상기 테스트 자료 벡터에 상기 WIPM 연산의 성질을 이용한 WMMD 커널 연산을 적용함으로써 양성 WMMD 스코어를 생성하는 프로세스 및 (ii) 기획득된 미분류 표본 벡터들에 대한 정보를 참조로 하여 상기 테스트 자료 벡터에 상기 WMMD 커널 연산을 적용함으로써 미분류 WMMD 스코어를 생성하는 프로세스를 수행하는 단계; 및(b) 상기 컴퓨팅 장치가, 상기 양성 WMMD 스코어 및 상기 미분류 WMMD 스코어를 참조로 하여 클래시피케이션 스코어를 생성한 후, (i) 상기 클래시피케이션 스코어 및 (ii) WMMD 바운더리 스코어를 이용하여 상기 테스트 자료 벡터가 상기 양성 자료에 속하는지 또는 상기 음성 자료에 속하는지 여부를 판단한 후 결과를 출력하는 단계를 포함하되,상기 WMMD 바운더리 스코어는, 미분류 자료의 분포 중에서 상기 양성 자료의 분포가 차지하는 비율 값에 대응하는 Class-Prior 값 또는 상기 미분류 자료의 상기 분포 및 상기 양성 자료의 상기 분포에 대응하는 소정 표본을 통해 상기 비율 값으로 추정된 값을 참조로 하여 획득된 것을 특징으로 하는 방법
2 2
제 1항에 있어서,상기 WMMD 커널 연산은 특정 가정 하에서 경험적 WMMD 최적화 함수를 해석적으로 계산할 수 있는 Reproducing Kernel 연산들 중 적어도 하나로 선택되되,상기 수식에서, 는 상기 양성 표본 벡터들에 대응하는 제1 확률 분포이고, 는 상기 미분류 표본 벡터들에 대응하는 제2 확률 분포며, 은 상기 RKHS 상의 반지름 을 가지는 닫힌 구 형태의 공간을 의미하며, 는 상기 미분류 표본 벡터들의 개수를 의미하고, 는 상기 양성 표본 벡터들의 개수를 의미하며, 는 상기 Class-Prior 값에 대응하는 weight 값을 의미하고, 는 제i 양성 표본 벡터를 의미하며, 는 제i 미분류 표본 벡터를 의미할 때, 는 상기 수식을 만족하는 상기 경험적 WMMD 최적화 함수이고, 상기 Reproducing Kernel 연산은, 상기 WMMD 연산이 상기 RKHS 상의 반지름 을 가지는 닫힌 구 형태의 공간 상에서 이루어진다는 가정인 상기 특정 가정 하에서 상기 경험적 WMMD 최적화 함수를 해석적으로 계산할 수 있는 것을 특징으로 하는 방법
3 3
제 2항에 있어서,상기 (a) 단계 이전에,상기 WMMD 커널 연산은, 소정 관리자에 의해 상기 Reproducing Kernel 연산들 중 하나인 가우시안 커널 연산으로 선택된 후 상기 컴퓨팅 장치에 입력되되,상기 가우시안 커널 연산은 상기 수식을 따르고, 상기 수식의 하이퍼파라미터 는 상기 양성 표본 벡터들과 상기 미분류 표본 벡터들에 대한 분류 결과를 이용해 생성된 경험적 오분류 추정 값을 최소화하는 값으로 결정되는 것을 특징으로 하는 방법
4 4
제 1항에 있어서,상기 (a) 단계는,상기 컴퓨팅 장치가, 하기 수식에 따라 상기 양성 WMMD 스코어를 생성하고,는 상기 양성 표본 벡터의 개수를 의미하고, 는 제i 양성 표본 벡터를 의미하며, 는 상기 테스트 자료 벡터를 의미하고, 은 상기 WMMD 커널 연산을 의미하는 것을 특징으로 하는 방법
5 5
제 1항에 있어서,상기 (a) 단계는,상기 컴퓨팅 장치가, 하기 수식에 따라 상기 미분류 WMMD 스코어를 생성하고,는 상기 미분류 표본 벡터의 개수를 의미하고, 는 제i 미분류 표본 벡터를 의미하며, 는 상기 테스트 자료 벡터를 의미하고, 는 상기 WMMD 커널 연산을 의미하는 것을 특징으로 하는 방법
6 6
제 1항에 있어서,상기 (b) 단계는,상기 컴퓨팅 장치가, 상기 양성 WMMD 스코어의 상기 미분류 WMMD 스코어에 대한 비율 값을 계산하고, 상기 비율 값을 참조로 하여 상기 클래시피케이션 스코어를 생성한 후, 상기 클래시피케이션 스코어가, 상기 WMMD 바운더리 스코어를 기준으로 하여 제1 영역에 속하는지 또는 제2 영역에 속하는지 여부를 판단함으로써 상기 테스트 자료 벡터가 상기 양성 자료에 속하는지 또는 상기 음성 자료에 속하는지 여부를 판단하는 것을 특징으로 하는 방법
7 7
제 1항에 있어서,상기 미분류 자료의 분포 중에서 상기 양성 자료의 분포가 차지하는 상기 비율 값이 주어지지 않은 경우, 상기 컴퓨팅 장치가, 상기 RKHS 상에서 동작하는 KM1 방식을 통해 상기 비율 값을 추정하고, 이를 이용하여 상기 WMMD 바운더리 스코어를 생성하는 것을 특징으로 하는 방법
8 8
Weighted Integral Probability Metric (WIPM) 연산을 포함하는 함수들의 집합이 가설공간 Reproducing Kernel Hilbert Space (RKHS)의 닫힌 구 형태인 조건을 만족할 때 상기 Weighted Integral Probability Metric (WIPM)연산이 가지는 성질을 이용하여 Supervised Learning의 기법을 Positive Unlabeled Learning에 접목함으로써 미분류된 표본들 외에 일부의 양성 표본만을 가지고도 적은 계산량으로 양성 자료와 음성 자료를 구분할 수 있는 Weighted Maximum Mean Discrepancy (WMMD) 이진 분류 방법을 수행하는 컴퓨팅 장치에 있어서,인스트럭션들을 저장하는 하나 이상의 메모리; 및상기 인스트럭션들을 수행하도록 설정된 하나 이상의 프로세서를 포함하되,상기 프로세서는, (I) 미지의 테스트 자료 벡터를 획득하면, (i) 기획득된 양성 표본 벡터들에 대한 정보를 참조로 하여 상기 테스트 자료 벡터에 상기 WIPM 연산의 성질을 이용한 WMMD 커널 연산을 적용함으로써 양성 WMMD 스코어를 생성하는 프로세스 및 (ii) 기획득된 미분류 표본 벡터들에 대한 정보를 참조로 하여 상기 테스트 자료 벡터에 상기 WMMD 커널 연산을 적용함으로써 미분류 WMMD 스코어를 생성하는 프로세스를 수행하는 프로세스; 및 (II) 상기 컴퓨팅 장치가, 상기 양성 WMMD 스코어 및 상기 미분류 WMMD 스코어를 참조로 하여 클래시피케이션 스코어를 생성한 후, (i) 상기 클래시피케이션 스코어 및 (ii) WMMD 바운더리 스코어를 이용하여 상기 테스트 자료 벡터가 상기 양성 자료에 속하는지 또는 상기 음성 자료에 속하는지 여부를 판단한 후 결과를 출력하는 프로세스를 수행하는 것을 특징으로 하되,상기 WMMD 바운더리 스코어는, 미분류 자료의 분포 중에서 상기 양성 자료의 분포가 차지하는 비율 값에 대응하는 Class-Prior 값 또는 상기 미분류 자료의 상기 분포 및 상기 양성 자료의 상기 분포에 대응하는 소정 표본을 통해 상기 비율 값으로 추정된 값을 참조로 하여 획득된 것을 특징으로 하는 컴퓨팅 장치
9 9
제 8항에 있어서,상기 WMMD 커널 연산은 특정 가정 하에서 경험적 WMMD 최적화 함수를 해석적으로 계산할 수 있는 Reproducing Kernel 연산들 중 적어도 하나로 선택되되,상기 수식에서, 는 상기 양성 표본 벡터들에 대응하는 제1 확률 분포이고, 는 상기 미분류 표본 벡터들에 대응하는 제2 확률 분포며, 은 상기 RKHS 상의 반지름 을 가지는 닫힌 구 형태의 공간을 의미하며, 는 상기 미분류 표본 벡터들의 개수를 의미하고, 는 상기 양성 표본 벡터들의 개수를 의미하며, 는 상기 Class-Prior 값에 대응하는 weight 값을 의미하고, 는 제i 양성 표본 벡터를 의미하며, 는 제i 미분류 표본 벡터를 의미할 때, 는 상기 수식을 만족하는 상기 경험적 WMMD 최적화 함수이고, 상기 Reproducing Kernel 연산은, 상기 WMMD 연산이 상기 RKHS 상의 반지름 을 가지는 닫힌 구 형태의 공간 상에서 이루어진다는 가정인 상기 특정 가정 하에서 상기 경험적 WMMD 최적화 함수를 해석적으로 계산할 수 있는 것을 특징으로 하는 컴퓨팅 장치
10 10
제 9항에 있어서,상기 (I) 프로세스 이전에,상기 WMMD 커널 연산은, 소정 관리자에 의해 상기 Reproducing Kernel 연산들 중 하나인 가우시안 커널 연산으로 선택된 후 상기 컴퓨팅 장치에 입력되되,상기 가우시안 커널 연산은 상기 수식을 따르고, 상기 수식의 하이퍼파라미터 는 상기 양성 표본 벡터들과 상기 미분류 표본 벡터들에 대한 분류 결과를 이용해 생성된 경험적 오분류 추정 값을 최소화하는 값으로 결정되는 것을 특징으로 하는 컴퓨팅 장치
11 11
제 8항에 있어서,상기 (I) 프로세스는,상기 프로세서가, 하기 수식에 따라 상기 양성 WMMD 스코어를 생성하고,는 상기 양성 표본 벡터의 개수를 의미하고, 는 제i 양성 표본 벡터를 의미하며, 는 상기 테스트 자료 벡터를 의미하고, 은 상기 WMMD 커널 연산을 의미하는 것을 특징으로 하는 컴퓨팅 장치
12 12
제 8항에 있어서,상기 (I) 프로세스는,상기 프로세서가, 하기 수식에 따라 상기 미분류 WMMD 스코어를 생성하고,는 상기 미분류 표본 벡터의 개수를 의미하고, 는 제i 미분류 표본 벡터를 의미하며, 는 상기 테스트 자료 벡터를 의미하고, 는 상기 WMMD 커널 연산을 의미하는 것을 특징으로 하는 컴퓨팅 장치
13 13
제 8항에 있어서,상기 (II) 프로세스는,상기 프로세서가, 상기 양성 WMMD 스코어의 상기 미분류 WMMD 스코어에 대한 비율 값을 계산하고, 상기 비율 값을 참조로 하여 상기 클래시피케이션 스코어를 생성한 후, 상기 클래시피케이션 스코어가, 상기 WMMD 바운더리 스코어를 기준으로 하여 제1 영역에 속하는지 또는 제2 영역에 속하는지 여부를 판단함으로써 상기 테스트 자료 벡터가 상기 양성 자료에 속하는지 또는 상기 음성 자료에 속하는지 여부를 판단하는 것을 특징으로 하는 컴퓨팅 장치
14 14
제 8항에 있어서,상기 미분류 자료의 분포 중에서 상기 양성 자료의 분포가 차지하는 상기 비율 값이 주어지지 않은 경우, 상기 프로세서가, 상기 RKHS 상에서 동작하는 KM1 방식을 통해 상기 비율 값을 추정하고, 이를 이용하여 상기 WMMD 바운더리 스코어를 생성하는 것을 특징으로 하는 컴퓨팅 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.