맞춤기술찾기

이전대상기술

과거 얼굴 이미지를 이용한 VA 지표 예측을 위한 전자 장치 및 그 동작 방법

  • 기술번호 : KST2023005655
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 개시의 일 양상으로, 적어도 하나의 명령어(instruction)를 저장하는 적어도 하나의 메모리(memory); 및 상기 메모리에 연결되는 적어도 하나의 프로세서(processor)를 포함하고, 상기 적어도 하나의 프로세서는 상기 적어도 하나의 명령어를 실행하여: 시간 축 상에서 예측 시점 t로부터 이전에 위치한 기 설정된 시간 범위 내에 위치하는 입력 이미지 시퀀스를 순차적으로 입력받고, 여기서 상기 입력 이미지 시퀀스는 각각이 사람의 얼굴을 포함하는 복수의 이미지를 포함하고; 상기 입력 이미지 시퀀스에 기초하여 학습 모델을 학습시키고; 및 상기 학습 모델로부터 사람의 각성도(valence) 값 및 유의성(arousal) 값을 출력하도록 구성되고, 상기 학습 모델은, CNN(Convolutional Neural Network) 모델을 기반으로 구성되며, 상기 입력 이미지 시퀀스를 입력받아 피쳐(feature)를 추출하는 피쳐 추출 레이어; 상기 피쳐를 입력받아 히든 스테이트(hidden state)를 출력하는 LSTM(Long Short-Term Memory) 레이어; 및 상기 히든 스테이트를 입력받아 상기 각성도 값 및 상기 유의성 값을 추출하는 FC(Fully-Connected) 레이어를 포함하는, 전자 장치이다.
Int. CL G06V 40/16 (2022.01.01) G06V 10/774 (2022.01.01) G06V 20/40 (2022.01.01)
CPC G06V 40/174(2013.01) G06V 10/774(2013.01) G06V 20/49(2013.01) G06N 3/082(2013.01) G06N 3/084(2013.01)
출원번호/일자 1020220024538 (2022.02.24)
출원인 국민대학교산학협력단
등록번호/일자
공개번호/일자 10-2023-0106052 (2023.07.12) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020220001292   |   2022.01.05
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.02.24)
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 국민대학교산학협력단 대한민국 서울특별시 성북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 임세준 서울특별시 서초구
2 오기성 서울특별시 양천구
3 정의석 인천광역시 부평구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인주연케이알피 대한민국 서울특별시 강남구 논현로**길**, *층(역삼동, 엘에스빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.02.24 수리 (Accepted) 1-1-2022-0211425-36
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
적어도 하나의 명령어(instruction)를 저장하는 적어도 하나의 메모리(memory); 및상기 메모리에 연결되는 적어도 하나의 프로세서(processor)를 포함하고,상기 적어도 하나의 프로세서는 상기 적어도 하나의 명령어를 실행하여:시간 축 상에서 예측 시점 t로부터 이전에 위치한 기 설정된 시간 범위 내에 위치하는 입력 이미지 시퀀스를 순차적으로 입력받고, 여기서 상기 입력 이미지 시퀀스는 각각이 사람의 얼굴을 포함하는 복수의 이미지를 포함하고;상기 입력 이미지 시퀀스에 기초하여 학습 모델을 학습시키고; 및상기 학습 모델로부터 사람의 각성도(valence) 값 및 유의성(arousal) 값을 출력하도록 구성되고,상기 학습 모델은,CNN(Convolutional Neural Network) 모델을 기반으로 구성되며, 상기 입력 이미지 시퀀스를 입력받아 피쳐(feature)를 추출하는 피쳐 추출 레이어;상기 피쳐를 입력받아 히든 스테이트(hidden state)를 출력하는 LSTM(Long Short-Term Memory) 레이어; 및상기 히든 스테이트를 입력받아 상기 각성도 값 및 상기 유의성 값을 추출하는 FC(Fully-Connected) 레이어를 포함하는,전자 장치
2 2
제1항에 있어서,상기 피쳐 추출 레이어는:상기 입력 이미지 시퀀스를 입력받아 컨볼루션(convolution) 연산을 수행하는 입력 CNN 블록;상기 입력 CNN 블록의 출력에 대하여 풀링(pooling) 연산을 수행하는 풀링 레이어; 및상기 풀링 레이어의 출력으로부터 상기 피쳐를 추출하는 그룹 레이어를 포함하는,전자 장치
3 3
제2항에 있어서,상기 그룹 레이어는 복수의 스테이지를 포함하고,상기 복수의 스테이지 각각은:상기 복수의 스테이지 각각의 입력에 대하여 컨볼루션 연산을 수행하는 잔차 CNN 블록;상기 잔차 CNN 블록의 입력에 대하여 추출(squeeze) 및 재조정(excitation) 연산을 수행하는 SE(Squeeze and Excitation) 블록; 및상기 복수의 스테이지 각각의 입력을 상기 잔차 CNN 블록 및 상기 SE 블록의 출력에 더하는 숏컷(shortcut) 블록을 더 포함하는,전자 장치
4 4
제1항에 있어서,상기 기 설정된 시간 범위는 [t - (d + n/f)]로 정의되고,여기서 d는 예측 소요 시간, n은 s만큼의 간격을 갖는 0 내지 f x (w - d)로 정의되는 범위, f는 상기 입력 이미지 시퀀스의 프레임, s는 상기 입력 이미지 시퀀스의 스트라이드(stride) 이미지의 개수, w는 기 설정된 윈도우 크기인,전자 장치
5 5
제1항에 있어서,상기 입력 이미지 시퀀스가 상기 학습 모델의 학습을 위한 훈련 데이터인 경우, 상기 각성도 값 및 상기 유의성 값이 라벨로서 페어링되는,전자 장치
6 6
제5항에 있어서,상기 적어도 하나의 프로세서는 상기 적어도 하나의 명령어를 실행하여:상기 훈련 데이터를 상기 학습 모델에 입력하여 상기 각성도 값 및 상기 유의성 값의 예측 값을 획득하고; 및상기 예측 값과 상기 라벨로 정의되는 손실 함수에 기초하여 상기 학습 모델을 학습시키도록 더 구성되는,전자 장치
7 7
제6항에 있어서,상기 손실 함수는 으로 정의되고, 여기서 은 상기 손실 함수, n은 상기 훈련 데이터의 개수, 및 는 상기 예측 값, 및 는 상기 라벨, i는 훈련 회차인,전자 장치
8 8
제4항에 있어서,상기 적어도 하나의 프로세서는 상기 적어도 하나의 명령어를 실행하여:상기 입력 이미지 시퀀스에서 t - (d + (n + s)/f) 시점에 대응되는 이미지가 존재하지 않는 경우, t - (d + n/f) + 1 시점까지 순차적으로 탐색하면서 다음 이미지를 샘플링하도록 더 구성되는,전자 장치
9 9
제1항에 있어서,상기 피쳐 추출 레이어는 다른 FC 레이어를 포함하지 않도록 구성되는,전자 장치
10 10
전자 장치에 의해 수행되는 동작 방법으로서,시간 축 상에서 예측 시점 t로부터 이전에 위치한 기 설정된 시간 범위 내에 위치하는 입력 이미지 시퀀스를 순차적으로 입력받는 단계, 여기서 상기 입력 이미지 시퀀스는 각각이 사람의 얼굴을 포함하는 복수의 이미지를 포함하고;상기 입력 이미지 시퀀스에 기초하여 학습 모델을 학습시키는 단계; 및상기 학습 모델로부터 사람의 각성도(valence) 값 및 유의성(arousal) 값을 출력하는 단계를 포함하고,상기 학습 모델은,CNN(Convolutional Neural Network) 모델을 기반으로 구성되며, 상기 입력 이미지 시퀀스를 입력받아 피쳐(feature)를 추출하는 피쳐 추출 레이어;상기 피쳐를 입력받아 히든 스테이트(hidden state)를 출력하는 LSTM(Long Short-Term Memory) 레이어; 및상기 히든 스테이트를 입력받아 상기 각성도 값 및 상기 유의성 값을 추출하는 FC(Fully-Connected) 레이어를 포함하는,동작 방법
11 11
제10항에 있어서,상기 기 설정된 시간 범위는 [t - (d + n/f)]로 정의되고,여기서 d는 예측 소요 시간, n은 s만큼의 간격을 갖는 0 내지 f x (w - d)로 정의되는 범위, f는 상기 입력 이미지 시퀀스의 프레임, s는 상기 입력 이미지 시퀀스의 스트라이드(stride) 이미지의 개수, w는 기 설정된 윈도우 크기인,동작 방법
12 12
제10항에 있어서,상기 입력 이미지 시퀀스가 상기 학습 모델의 학습을 위한 훈련 데이터인 경우, 상기 각성도 값 및 상기 유의성 값이 라벨로서 페어링되고,상기 동작 방법은:상기 훈련 데이터를 상기 학습 모델에 입력하여 상기 각성도 값 및 상기 유의성 값의 예측 값을 획득하는 단계; 및상기 예측 값과 상기 라벨로 정의되는 손실 함수에 기초하여 상기 학습 모델을 학습시키는 단계를 더 포함하는,동작 방법
13 13
제12항에 있어서,상기 손실 함수는 으로 정의되고, 여기서 은 상기 손실 함수, n은 상기 훈련 데이터의 개수, 및 는 상기 예측 값, 및 는 상기 라벨, i는 훈련 회차인,동작 방법
14 14
제11항에 있어서,상기 동작 방법은:상기 입력 이미지 시퀀스에서 t - (d + n/f) 시점에 대응되는 이미지가 존재하지 않는 경우, t - (d + (n + s)/f) + 1 시점까지 순차적으로 탐색하면서 다음 이미지를 샘플링하는 단계를 더 포함하는,동작 방법
15 15
컴퓨터가 읽을 수 있는 코드로서, 전자 장치의 동작 방법을 수행하는 코드를 포함하는 컴퓨터 프로그램이 저장된 기록매체에 있어서,상기 동작 방법은:시간 축 상에서 예측 시점 t로부터 이전에 위치한 기 설정된 시간 범위 내에 위치하는 입력 이미지 시퀀스를 순차적으로 입력받는 단계, 여기서 상기 입력 이미지 시퀀스는 각각이 사람의 얼굴을 포함하는 복수의 이미지를 포함하고;상기 입력 이미지 시퀀스에 기초하여 학습 모델을 학습시키는 단계; 및상기 학습 모델로부터 사람의 각성도(valence) 값 및 유의성(arousal) 값을 출력하는 단계를 포함하고,상기 학습 모델은,CNN(Convolutional Neural Network) 모델을 기반으로 구성되며, 상기 입력 이미지 시퀀스를 입력받아 피쳐(feature)를 추출하는 피쳐 추출 레이어;상기 피쳐를 입력받아 히든 스테이트(hidden state)를 출력하는 LSTM(Long Short-Term Memory) 레이어; 및상기 히든 스테이트를 입력받아 상기 각성도 값 및 상기 유의성 값을 추출하는 FC(Fully-Connected) 레이어를 포함하는,기록매체
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 산업통상자원부 (주)스카이오토넷 지식서비스산업기술개발(R&D) 장기주행 운전자의 안전운전을 위한 차량ICT 융합 첨단안전운전 시스템 및 서비스 개발
2 경찰청 자동차부품연구원 자율주행기술개발혁신사업(R&D)(경찰청) 실시간 교통안전시설 운용을 위한 인프라 정보 융합 및 관리 기술 개발