1 |
1
입력 영상을 수신하는 단계;상기 입력 영상의 특징 분포를 지시하는 잠재 변수(latent variable)를 생성하는 단계; 및상기 잠재 변수에 기초하여, 상기 입력 영상 내 객체를 검출하는 단계를 포함하는, 객체 검출 방법
|
2 |
2
제1항에 있어서, 상기 잠재 변수를 생성하는 단계는상기 입력 영상을 인코딩하는 신경망을 이용하여 상기 입력 영상의 특징을 추출하는 단계; 및상기 입력 영상의 특징에 대응하는 특징 분포를 결정하는 신경망을 이용하여 상기 잠재 변수를 획득하는 단계를 포함하는, 객체 검출 방법
|
3 |
3
제2항에 있어서,상기 신경망은 실제 영상, 및 합성 영상(synthesized image)을 상기 실제 영상(real image)의 페이크 영상(fake image)으로 변환한 합성 영상의 스코어에 기초하여 필터링된 합성 영상중 적어도 하나에 기초하여 학습된 것인, 객체 검출 방법
|
4 |
4
제1항에 있어서, 상기 잠재 변수는상기 입력 영상의 도메인을 변환하기 위한 특징; 및 상기 객체를 검출하기 위한 특징을 내재하는, 객체 검출 방법
|
5 |
5
제4항에 있어서, 상기 입력 영상의 도메인을 변환하기 위한 특징은합성 영상의 제1 도메인을 실제 영상의 제2 도메인으로 변환하기 위한 특징, 및 상기 제2 도메인을 상기 제1 도메인으로 변환하기 위한 특징 사이의 공유되는(shared) 특징을 포함하는, 객체 검출 방법
|
6 |
6
제1항에 있어서, 상기 잠재 변수는다차원 평균 벡터와 다차원 분산 벡터를 포함하는, 객체 검출 방법
|
7 |
7
제1항에 있어서, 상기 객체를 검출하는 단계는상기 입력 영상 내 객체의 위치를 지시하는 정보를 획득하는 단계; 및상기 객체를 분류(classify)하는 정보를 획득하는 단계중 적어도 하나를 포함하는, 객체 검출 방법
|
8 |
8
합성 영상의 제1 도메인을 실제 영상의 제2 도메인으로 변환하는 단계;상기 변환된 합성 영상의 스코어(score)를 산출하는 단계;상기 스코어를 기초로, 상기 변환된 합성 영상을 필터링하는 단계; 및 상기 필터링한 합성 영상을 이용하여 입력 영상에 포함된 객체를 검출하는 신경망을 학습하는 단계를 포함하는, 학습 방법
|
9 |
9
제8항에 있어서, 상기 필터링하는 단계는상기 스코어와 임계치를 비교하는 단계;상기 스코어가 상기 임계치보다 크거나 같은 경우에 상기 제1 도메인으로 변환된 합성 영상을 선택하는 단계를 포함하는, 학습 방법
|
10 |
10
제8항에 있어서, 상기 신경망을 학습하는 단계는상기 실제 영상 및 상기 필터링된 합성 영상 중 적어도 하나를 이용하여 상기 신경망을 학습하는 단계를 포함하는, 학습 방법
|
11 |
11
제10항에 있어서,상기 신경망을 학습하는 단계는상기 제2 도메인의 인코더에 기초하여, 상기 필터링된 합성 영상을 인코딩하는 단계;상기 인코딩 결과에 기초하여 잠재 변수를 생성하는 단계;상기 잠재 변수 및 검출기에 기초하여 상기 입력 영상에 포함된 객체를 검출하는 단계;상기 객체와 관련된 실측 정보(ground truth)와 상기 검출 결과가 서로 유사한 정도에 기초한 검출 로스(detection loss)를 획득하는 단계; 및상기 검출 로스에 기초하여, 상기 검출기를 학습하는 단계를 포함하는, 학습 방법
|
12 |
12
제11항에 있어서, 상기 신경망을 학습하는 단계는상기 잠재 변수를 상기 제1 도메인에서 디코딩함으로써, 상기 제1 도메인의 페이크 영상을 생성하는 단계;상기 잠재 변수를 상기 제2 도메인에서 디코딩함으로써, 상기 제2 도메인의 페이크 영상을 생성하는 단계;상기 합성 영상과 상기 제1 도메인의 페이크 영상이 서로 구별되는 정도에 기초한 제1 적대 로스(adversarial loss)를 획득하는 단계;상기 필터링된 합성 영상과 상기 제2 도메인의 페이크 영상이 서로 유사한 정도에 기초한 제1 로스(loss)를 획득하는 단계; 및상기 제1 적대 로스 및 상기 제1 로스에 기초하여, 상기 제2 도메인의 인코더를 학습하는 단계를 더 포함하는, 학습 방법
|
13 |
13
제11항에 있어서, 상기 잠재 변수는상기 합성 영상의 제1 도메인을 상기 실제 영상의 제2 도메인으로 변환하기 위한 특징, 및 상기 제2 도메인을 상기 제1 도메인으로 변환하기 위한 특징 사이의 공유되는 특징; 및 상기 객체를 검출하기 위한 특징을 내재하는, 학습 방법
|
14 |
14
하드웨어와 결합되어 제1항 내지 제13항 중 어느 하나의 항의 방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램
|
15 |
15
입력 영상을 수신하는 통신 인터페이스; 및 상기 입력 영상의 특징 분포를 지시하는 잠재 변수를 생성하고, 상기 잠재 변수에 기초하여, 상기 입력 영상 내 객체를 검출하는 프로세서를 포함하는, 객체 검출 장치
|
16 |
16
제15항에 있어서, 상기 프로세서는상기 입력 영상을 인코딩하는 신경망을 이용하여 상기 입력 영상의 특징을 추출하고, 상기 입력 영상의 특징에 대응하는 특징 분포를 결정하는 신경망을 이용하여 상기 잠재 변수를 획득하는, 객체 검출 장치
|
17 |
17
제16항에 있어서,상기 신경망은 실제 영상, 및 합성 영상을 상기 실제 영상의 페이크 영상으로 변환한 합성 영상의 스코어에 기초하여 필터링된 합성 영상중 적어도 하나에 기초하여 학습된 것인, 객체 검출 장치
|
18 |
18
제15항에 있어서, 상기 잠재 변수는상기 입력 영상의 도메인을 변환하기 위한 특징; 및 상기 객체를 검출하기 위한 특징을 내재하는, 객체 검출 장치
|
19 |
19
제18항에 있어서, 상기 입력 영상의 도메인을 변환하기 위한 특징은합성 영상의 제1 도메인을 실제 영상의 제2 도메인으로 변환하기 위한 특징, 및 상기 제2 도메인을 상기 제1 도메인으로 변환하기 위한 특징 사이의 공유되는 특징을 포함하는, 객체 검출 장치
|
20 |
20
제15항에 있어서, 상기 프로세서는 상기 입력 영상 내 객체의 위치를 지시하는 정보를 획득하고, 상기 객체를 분류하는 정보를 획득하는, 객체 검출 장치
|