1 |
1
객체 검출 모델의 학습 방법에 있어서,학습하고자 하는 타겟 이미지를 일정한 크기를 가진 복수의 셀들로 분할하는 단계;상기 객체 검출 모듈에 포함된 복수의 콘볼루션 레이어(Convolution layer)들을 통해 상기 타겟 이미지로부터 상기 복수의 콘볼루션 레이어들 각각에 대응하는 서로 다른 해상도를 가진 인코딩 특징맵을 생성하는 단계;상기 객체 검출 모듈에 포함된 단일의 디콘볼루션 레이어(Deconvolution layer)를 통해 상기 복수의 콘볼루션 레이어들 중 최후단에 위치한 제1 콘볼루션 레이어에 의해 생성된 저해상도의 인코딩 특징맵과 상기 제1 콘볼루션의 이전단에 위치한 제2 콘볼루션 레이어에 의해 생성된 고해상도의 인코딩 특징맵을 융합함으로써 디코딩 특징맵을 생성하는 단계; 및상기 객체 검출 모듈에 포함된 객체 검출 레이어를 통해 상기 생성된 디코딩 특징맵을 이용하여 상기 복수의 셀들 각각에서 예측된 객체 정보를 검출하는 단계를 포함하고,상기 단일의 디콘볼루션 레이어는,수용 영역(Receptive field)을 증가시키기 위한 콘볼루션 레이어가 추가되는 객체 검출 모델의 학습 방법
|
2 |
2
제1항에 있어서,상기 복수의 셀들 각각에서 예측된 객체 정보는,상기 복수의 셀들 각각에서 예측된 객체의 유무(Objectness) 정보, 상기 예측된 객체의 클래스(Class) 정보 및 상기 예측된 객체가 존재할 것으로 예상되는 영역에 대응하는 바운딩 박스(bounding box) 정보 중 적어도 하나를 포함하는 객체 검출 모델의 학습 방법
|
3 |
3
제1항에 있어서,상기 복수의 셀들 각각에서 예측된 객체 정보 중 중복되는 바운딩 박스의 영역을 제거함으로써 최종적인 객체의 검출 영역을 결정하는 단계를 더 포함하는 객체 검출 모델의 학습 방법
|
4 |
4
제1항에 있어서,상기 복수의 셀들 각각과 미리 설정된 그라운드 트루스(Ground Truth, 이하 GT) 박스 간 거리 정보를 이용하여 상기 객체 검출 모델의 학습 손실(Loss)을 계산하는 단계를 더 포함하는 객체 검출 모델의 학습 방법
|
5 |
5
제4항에 있어서,상기 객체 검출 모델의 학습 손실을 계산하는 단계는,상기 복수의 셀들 각각과 상기 GT 박스 간 거리에 기초하여 상기 복수의 셀들 각각과 상기 GT 박스 간 매칭을 수행하는 단계; 및상기 GT 박스와의 매칭이 수행된 셀에서 예측된 객체 정보와 상기 GT 박스에 대응하는 객체 정보를 이용하여 손실 함수(Loss function)를 계산함으로써 상기 객체 검출 모델의 학습 손실을 계산하는 단계를 포함하는 객체 검출 모델의 학습 방법
|
6 |
6
제5항에 있어서,상기 복수의 셀들 각각과 상기 GT 박스 간 매칭을 수행하는 단계는,상기 복수의 셀들 각각의 셀 크기 및 상기 GT 박스의 크기에 대한 상대적 거리 기준 비율, 최소 거리 기준 비율 및 최대 거리 기준 비율을 이용하여 상기 복수의 셀들 각각의 중심점과 상기 GT 박스의 중심점 간 거리를 결정하는 단계; 및상기 결정된 거리가 미리 설정된 기준 이하인 셀들을 상기 GT 박스에 매칭하는 단계를 포함하는 객체 검출 모델의 학습 방법
|
7 |
7
제4항에 있어서,상기 계산된 객체 검출 모델의 학습 손실이 최소가 되도록 상기 객체 검출 모델의 매개 변수 값을 조절하는 단계를 더 포함하는 객체 검출 모델의 학습 방법
|
8 |
8
제1항 내지 제7항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한 기록 매체
|
9 |
9
객체 검출 모델이 실행되는 객체 검출 장치에 있어서,프로세서;를 포함하고,상기 객체 검출 모델은,일정한 크기를 가진 복수의 셀들로 분할된 타겟 이미지에 대해 서로 다른 해상도를 가진 인코딩 특징맵을 생성하는 복수의 콘볼루션 레이어(Convolution layer)들;상기 복수의 콘볼루션 레이어들 중 최후단에 위치한 제1 콘볼루션 레이어에 의해 생성된 저해상도의 인코딩 특징맵과 상기 제1 콘볼루션 레이어의 이전에 위치한 제2 콘볼루션 레이어에 의해 생성된 고해상도의 인코딩 특징맵을 융합함으로써 디코딩 특징맵을 생성하는 단일의 디콘볼루션 레이어(Deconvolution layer); 및상기 생성된 디코딩 특징맵을 이용하여 상기 복수의 셀들 각각에서 예측된 객체 정보를 검출하는 객체 검출 레이어를 포함하고,상기 단일의 디콘볼루션 레이어는,수용 영역(Receptive field)을 증가시키기 위한 콘볼루션 레이어가 추가되는 객체 검출 장치
|
10 |
10
제9항에 있어서,상기 복수의 셀들 각각에서 예측된 객체 정보는,상기 복수의 셀들 각각에서 예측된 객체의 유무(Objectness) 정보, 상기 예측된 객체의 클래스(Class) 정보 및 상기 예측된 객체가 존재할 것으로 예상되는 영역에 대응하는 바운딩 박스(bounding box) 정보 중 적어도 하나를 포함하는 객체 검출 모델
|
11 |
11
제9항에 있어서,상기 프로세서는,상기 객체 검출 레이어를 통해 예측된 상기 복수의 셀들 각각의 객체 정보 중 중복되는 바운딩 박스의 영역을 제거함으로써 최종적인 객체의 검출 영역을 결정하는 객체 검출 장치
|
12 |
12
제9항에 있어서,상기 프로세서는,상기 복수의 셀들 각각과 미리 설정된 그라운드 트루스(Ground Truth, 이하 GT) 박스 간 거리 정보를 이용하여 상기 객체 검출 모델의 학습 손실(Loss)을 계산하는 객체 검출 장치
|
13 |
13
제12항에 있어서,상기 프로세서는,상기 복수의 셀들 각각과 상기 GT 박스 간 거리에 기초하여 상기 복수의 셀들 각각과 상기 GT 박스 간 매칭을 수행하고, 상기 GT 박스와의 매칭이 수행된 셀에서 예측된 객체 정보와 상기 GT 박스에 대응하는 객체 정보를 이용하여 손실 함수(Loss function)를 계산함으로써 상기 객체 검출 모델의 학습 손실을 계산하는 객체 검출 장치
|
14 |
14
제13항에 있어서,상기 프로세서는,상기 복수의 셀들 각각의 셀 크기 및 상기 GT 박스의 크기에 대한 상대적 거리 기준 비율, 최소 거리 기준 비율 및 최대 거리 기준 비율을 이용하여 상기 복수의 셀들 각각의 중심점과 상기 GT 박스의 중심점 간 거리를 결정하고, 상기 결정된 거리가 미리 설정된 기준 이하인 셀들을 상기 GT 박스에 매칭하는 객체 검출 장치
|
15 |
15
제12항에 있어서,상기 프로세서는,상기 계산된 객체 검출 모델의 학습 손실이 최소가 되도록 상기 객체 검출 모델의 매개 변수 값을 조절하는 객체 검출 장치
|
16 |
16
제9항에 있어서,상기 객체 검출 모델은,상기 복수의 콘볼루션 레이어들의 후단에 서로 다른 객체의 특성에 따라 설계된 복수의 디콘볼루션 레이어들이 병렬로 배치되는 객체 검출 장치
|
17 |
17
제16항에 있어서,상기 프로세서는,상기 병렬로 배치된 복수의 디콘볼루션 레이어들 각각에 대응하는 학습 데이터를 이용하여 상기 복수의 콘볼루션 레이어들 및 상기 복수의 디콘볼루션 레이어들을 순차적으로 반복 학습하는 객체 검출 장치
|