1 |
1
대상의 동작이 촬영된 이미지를 획득하는 단계;상기 이미지에 포함된 프레임들에 대해 광학 흐름(optical flow) 연산을 수행하여 키프레임을 추출하는 단계; 및상기 키프레임에 기초하여 상기 동작을 식별하는 단계를 포함하는, 동작 인식 방법
|
2 |
2
제1항에 있어서,상기 이미지는,상기 동작을 서로 다른 방향에서 촬영한 복수의 이미지를 하나의 이미지로 변환한 이미지인, 동작 인식 방법
|
3 |
3
제1항에 있어서,상기 추출하는 단계는,상기 이미지에 포함되는 연속된 프레임들 사이의 모션 벡터들을 계산하는 단계;상기 모션 벡터들의 평균 크기에 기초하여 제1 키프레임 및 제2 키프레임을 추출하는 단계; 및상기 제1 키프레임 및 상기 제2 키프레임 각각을 채널로 가지는 상기 키프레임을 생성하는 단계를 포함하는, 동작 인식 방법
|
4 |
4
제3항에 있어서,상기 제1 키프레임 및 제2 키프레임을 추출하는 단계는,상기 평균 크기가 가장 큰 프레임을 상기 제1 키프레임으로 추출하는 단계; 및상기 제1 키프레임 이후 프레임들 중 상기 평균 크기가 가장 작은 프레임을 상기 제2 키프레임을 추출하는 단계를 포함하는, 동작 인식 방법
|
5 |
5
제1항에 있어서,상기 식별하는 단계는,상기 키프레임을 컨벌루션 뉴럴 네트워크(convolutional neural network)에 입력하는 단계를 포함하는, 동작 인식 방법
|
6 |
6
제1항에 있어서,상기 이미지는,레드 채널(red channel), 그린 채널(green channel), 블루 채널(blue channel) 및 깊이 채널(depth channel)을 포함하는 이미지이고,상기 키프레임은,레드 채널, 그린 채널, 블루 채널 및 깊이 채널을 각각 두 채널씩 포함하는 이미지인, 동작 인식 방법
|
7 |
7
대상의 동작을 검출하는 뉴럴 네트워크의 학습 방법에 있어서,상기 동작이 촬영된 이미지를 획득하는 단계;상기 이미지의 모든 프레임에 대해 광학 흐름(optical flow) 연산을 수행하여 키프레임을 추출하는 단계; 및상기 키프레임에 기초하여 상기 뉴럴 네트워크의 파라미터를 업데이트하는 단계를 포함하는, 학습 방법
|
8 |
8
제7항에 있어서,상기 이미지는,상기 동작을 서로 다른 방향에서 촬영한 복수의 이미지를 하나의 이미지로 변환한 이미지인, 학습 방법
|
9 |
9
제7항에 있어서,상기 추출하는 단계는,상기 이미지에 포함되는 연속된 프레임들 사이의 모션 벡터들을 계산하는 단계;상기 모션 벡터들의 평균 크기에 기초하여 제1 키프레임 및 제2 키프레임을 추출하는 단계; 및상기 제1 키프레임 및 상기 제2 키프레임 각각을 채널로 가지는 상기 키프레임을 생성하는 단계를 포함하는, 학습 방법
|
10 |
10
제9항에 있어서,상기 제1 키프레임 및 제2 키프레임을 추출하는 단계는,상기 평균 크기가 가장 큰 프레임을 상기 제1 키프레임으로 추출하는 단계; 및상기 제1 키프레임 이후 프레임들 중 상기 평균 크기가 가장 작은 프레임을 상기 제2 키프레임을 추출하는 단계를 포함하는, 학습 방법
|
11 |
11
제7항에 있어서,상기 뉴럴 네트워크는, 컨벌루션 뉴럴 네트워크(convolutional neural network)이고,상기 업데이트하는 단계는,상기 컨벌루션 뉴럴 네트워크의 웨이트(weights) 및 바이어스(bias)를 업데이트하는 단계를 포함하는, 학습 방법
|
12 |
12
제7항에 있어서,상기 이미지는,레드 채널(red channel), 그린 채널(green channel), 블루 채널(blue channel) 및 깊이 채널(depth channel)을 포함하는 이미지이고,상기 키프레임은,레드 채널, 그린 채널, 블루 채널 및 깊이 채널을 각각 두 채널씩 포함하는 이미지인, 학습 방법
|
13 |
13
하드웨어와 결합되어 제1항 내지 제12항 중 어느 하나의 항의 방법을 실행시키기 위하여 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램
|
14 |
14
인스트럭션들을 포함하는 메모리; 및상기 인스트럭션들을 실행하기 위한 프로세서를 포함하고,상기 프로세서에 의해 상기 인스트럭션들이 실행될 때, 상기 프로세서는,대상의 동작이 촬영된 이미지를 획득하고, 상기 이미지에 포함된 프레임들에 대해 광학 흐름(optical flow) 연산을 수행하여 키프레임을 추출하고,상기 키프레임에 기초하여 상기 동작을 검출하는, 동작 인식 장치
|
15 |
15
제14항에 있어서,상기 이미지는,상기 동작을 서로 다른 방향에서 촬영한 복수의 이미지를 하나의 이미지로 변환한 이미지인, 동작 인식 장치
|
16 |
16
제14항에 있어서,상기 프로세서는,상기 이미지에 포함되는 연속된 프레임들 사이의 모션 벡터들을 계산하고,상기 모션 벡터들의 평균 크기에 기초하여 제1 키프레임 및 제2 키프레임을 추출하고,상기 제1 키프레임 및 상기 제2 키프레임 각각을 채널로 가지는 상기 키프레임을 생성하는, 동작 인식 장치
|
17 |
17
제16항에 있어서,상기 프로세서는,상기 평균 크기가 가장 큰 프레임을 상기 제1 키프레임으로 추출하고,상기 제1 키프레임 이후 프레임들 중 상기 평균 크기가 가장 작은 프레임을 상기 제2 키프레임을 추출하는, 동작 인식 장치
|
18 |
18
제14항에 있어서,상기 프로세서는,상기 키프레임을 컨벌루션 뉴럴 네트워크(convolutional neural network)에 입력하는, 동작 인식 장치
|
19 |
19
제14항에 있어서,상기 이미지는,레드 채널(red channel), 그린 채널(green channel), 블루 채널(blue channel) 및 깊이 채널(depth channel)을 포함하는 이미지이고,상기 키프레임은,레드 채널, 그린 채널, 블루 채널 및 깊이 채널을 각각 두 채널씩 포함하는 이미지인, 동작 인식 장치
|