맞춤기술찾기

이전대상기술

실시간 얼굴 감정 인식을 위한 자원 효율적인 정수-산술 전용 FPGA 기반 CNN 가속기

  • 기술번호 : KST2023002597
  • 담당센터 : 인천기술혁신센터
  • 전화번호 : 032-420-3580
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 실시간 얼굴 감정 인식을 위한 자원 효율적인 정수-산술 전용 FPGA 기반 CNN 가속기 및 그 동작 방법이 제시된다. 본 발명에서 제안하는 CPU(Processing System; PS)와 FPGA(Programmable Logic, PL)를 포함하는 이기종 SoC 플랫폼에서 구현되는 FPGA 기반 CNN 가속기의 동작 방법은 CPU에서 CNN 얼굴 표정 인식 성능을 향상시키기 위해 복수의 이미지 처리 알고리즘을 결합한 훈련 데이터셋을 생성하고, 생성된 훈련 데이터셋에 대하여 플로팅-포인트(floating-point) 훈련을 통해 파라미터를 변환하는 단계, CPU에서 플로팅-포인트 훈련을 통해 변환된 파라미터를에 대하여 양자화 인식 훈련을 통해 양자화된 파라미터를 추출하고, 정수-산술 전용(Integer-Arithmetic-Only) CNN 재구성을 수행하는 단계 및 이기종 SoC(System on Chip) 플랫폼의 FPGA(Programmable Logic; PL) 및 CPU(Processing System; PS) 영역에서 상기 정수-산술 전용 CNN을 이용하여 실시간 얼굴 감정 인식을 수행하는 단계를 포함한다.
Int. CL G06N 3/063 (2023.01.01) G06N 3/08 (2023.01.01) G06N 20/10 (2019.01.01) G06V 40/16 (2022.01.01)
CPC G06N 3/063(2013.01) G06N 3/08(2013.01) G06N 20/10(2013.01) G06V 40/174(2013.01)
출원번호/일자 1020210178711 (2021.12.14)
출원인 인하대학교 산학협력단, 상명대학교 천안산학협력단
등록번호/일자
공개번호/일자 10-2023-0089927 (2023.06.21) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.12.14)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 인하대학교 산학협력단 대한민국 인천광역시 미추홀구
2 상명대학교 천안산학협력단 대한민국 충청남도 천안시 동남구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 강진구 서울특별시 서초구
2 김재명 경기도 고양시 덕양구
3 김용우 서울특별시 송파구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.12.14 수리 (Accepted) 1-1-2021-1448100-94
2 의견제출통지서
Notification of reason for refusal
2023.04.27 발송처리완료 (Completion of Transmission) 9-5-2023-0393866-51
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2023.06.07 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2023-0625628-86
4 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2023.06.07 수리 (Accepted) 1-1-2023-0625627-30
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
CPU(Processing System; PS)와 FPGA(Programmable Logic, PL)를 포함하는 이기종 SoC(System on Chip) 플랫폼에서 구현되는 FPGA 기반 CNN 가속기의 동작 방법에 있어서, CPU에서 CNN 얼굴 표정 인식 성능을 향상시키기 위해 복수의 이미지 처리 알고리즘을 결합한 훈련 데이터셋을 생성하고, 생성된 훈련 데이터셋에 대하여 플로팅-포인트(floating-point) 훈련을 통해 파라미터를 변환하는 단계; CPU에서 플로팅-포인트 훈련을 통해 변환된 파라미터를에 대하여 양자화 인식 훈련을 통해 양자화된 파라미터를 추출하고, 정수-산술 전용(Integer-Arithmetic-Only) CNN 재구성을 수행하는 단계; 및 이기종 SoC 플랫폼의 FPGA 및 CPU 영역에서 상기 정수-산술 전용 CNN을 이용하여 실시간 얼굴 감정 인식을 수행하는 단계를 포함하는 FPGA 기반 CNN 가속기의 동작 방법
2 2
제1항에 있어서,상기 CPU에서 CNN 얼굴 표정 인식 성능을 향상시키기 위해 복수의 이미지 처리 알고리즘을 결합한 훈련 데이터셋을 생성하고, 생성된 훈련 데이터셋에 대하여 플로팅-포인트 훈련을 통해 파라미터를 변환하는 단계는, 제1 계산 모듈(FireA) 및 제2 계산 모듈(FireB)을 포함하는 기본 계산 블록을 통해 연산을 수행하고, 제1 계산 모듈(FireA) 및 제2 계산 모듈(FireB) 각각은, 특징맵의 채널 수를 감소시키고, 이어지는 확장 계층의 연산 수를 감소시키기 위한 스퀴즈 계층; 및 채널을 다시 확장하하기 위한 확장 계층을 포함하고, 수신 필드를 유지하여 정확도 저하를 최소화하기 위해 제1 계산 모듈의 스퀴즈 계층과 제2 계산 모듈의 스퀴즈 계층은 서로 다른 커널 크기를 갖는 FPGA 기반 CNN 가속기의 동작 방법
3 3
제2항에 있어서,특징맵의 해상도를 절반으로 줄이고 최대 풀링 계층을 대체하기 위해 상기 기본 계산 블록의 스트라이드를 2로 설정하고, CNN의 마지막에 추출된 특징을 분류하고 복수의 매개 변수를 포함하는 완전 연결 계층을 글로벌 평균 풀링으로 대체하고 커널 크기가 1인 컨볼루션 계층을 대체하여 상기 파라미터를 감소시키고, CNN의 분류기는 컨볼루션 계층을 통해 클래스 수와 일치하도록 채널 수를 최소화한 후 특징맵의 해상도를 하나의 픽셀로 압축하며, CNN의 수렴 안정성과 성능을 개선하기 위해 컨볼루션 계층과 활성화 함수 사이에 배치 정규화 계층을 삽입하는 FPGA 기반 CNN 가속기의 동작 방법
4 4
제1항에 있어서,상기 CPU에서 플로팅-포인트 훈련을 통해 변환된 파라미터를에 대하여 양자화 인식 훈련을 통해 양자화된 파라미터를 추출하고, 정수-산술 전용 CNN 재구성을 수행하는 단계는, 훈련 가능한 파라미터를 2의 거듭제곱 인수에 매핑하고, 첫 번째 에포크(epoch)의 첫 번째 배치의 활성화 데이터 통계 값으로 활성 기준화 인수를 초기화하여 사전 보정 프로세스를 필요로 하지 않고, 기준화 인수를 2의 거듭제곱 항에 매핑함으로써 스케일에서 발생하는 곱셈 및 나눗셈 연산과 역-양자화 프로세스는 모두 이동 연산으로 대체되는 로그레벨 임계값 정량화(Log Level Threshold Quantization; LLTQ) 방법을 이용하는 FPGA 기반 CNN 가속기의 동작 방법
5 5
CPU(Processing System; PS)와 FPGA(Programmable Logic, PL)를 포함하는 이기종 SoC(System on Chip) 플랫폼에서 구현되는 FPGA 기반 CNN 가속기에 있어서, 상기 CPU는, CNN 얼굴 표정 인식 성능을 향상시키기 위해 복수의 이미지 처리 알고리즘을 결합한 훈련 데이터셋을 생성하고, 생성된 훈련 데이터셋에 대하여 플로팅-포인트(floating-point) 훈련을 통해 파라미터를 변환하고, 플로팅-포인트 훈련을 통해 변환된 파라미터를에 대하여 양자화 인식 훈련을 통해 양자화된 파라미터를 추출하고, 정수-산술 전용(Integer-Arithmetic-Only) CNN 재구성을 수행하며, 이기종 SoC 플랫폼의 FPGA 및 CPU 영역에서 상기 정수-산술 전용 CNN을 이용하여 실시간 얼굴 감정 인식을 수행하는FPGA 기반 CNN 가속기
6 6
제5항에 있어서, 상기 CPU는, CNN 얼굴 표정 인식 성능을 향상시키기 위해 복수의 이미지 처리 알고리즘을 결합한 훈련 데이터셋을 생성하고, 생성된 훈련 데이터셋에 대하여 플로팅-포인트 훈련을 통해 파라미터를 변환하는 과정에서, 제1 계산 모듈(FireA) 및 제2 계산 모듈(FireB)을 포함하는 기본 계산 블록을 통해 연산을 수행하고, 제1 계산 모듈(FireA) 및 제2 계산 모듈(FireB) 각각은, 특징맵의 채널 수를 감소시키고, 이어지는 확장 계층의 연산 수를 감소시키기 위한 스퀴즈 계층; 및 채널을 다시 확장하하기 위한 확장 계층을 포함하고, 수신 필드를 유지하여 정확도 저하를 최소화하기 위해 제1 계산 모듈의 스퀴즈 계층과 제2 계산 모듈의 스퀴즈 계층은 서로 다른 커널 크기를 갖는 FPGA 기반 CNN 가속기
7 7
제6항에 있어서,특징맵의 해상도를 절반으로 줄이고 최대 풀링 계층을 대체하기 위해 상기 기본 계산 블록의 스트라이드를 2로 설정하고, CNN의 마지막에 추출된 특징을 분류하고 복수의 매개 변수를 포함하는 완전 연결 계층을 글로벌 평균 풀링으로 대체하고 커널 크기가 1인 컨볼루션 계층을 대체하여 상기 파라미터를 감소시키고, CNN의 분류기는 컨볼루션 계층을 통해 클래스 수와 일치하도록 채널 수를 최소화한 후 특징맵의 해상도를 하나의 픽셀로 압축하며, CNN의 수렴 안정성과 성능을 개선하기 위해 컨볼루션 계층과 활성화 함수 사이에 배치 정규화 계층을 삽입하는FPGA 기반 CNN 가속기
8 8
제5항에 있어서, 상기 CPU는, 플로팅-포인트 훈련을 통해 변환된 파라미터를에 대하여 양자화 인식 훈련을 통해 양자화된 파라미터를 추출하고, 정수-산술 전용(Integer-Arithmetic-Only) CNN 재구성을 수행하는 과정에서, 훈련 가능한 파라미터를 2의 거듭제곱 인수에 매핑하고, 첫 번째 에포크(epoch)의 첫 번째 배치의 활성화 데이터 통계 값으로 활성 기준화 인수를 초기화하여 사전 보정 프로세스를 필요로 하지 않고, 기준화 인수를 2의 거듭제곱 항에 매핑함으로써 스케일에서 발생하는 곱셈 및 나눗셈 연산과 역-양자화 프로세스는 모두 이동 연산으로 대체되는 로그레벨 임계값 정량화(Log Level Threshold Quantization; LLTQ) 방법을 이용하는 FPGA 기반 CNN 가속기
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 인하대학교 산학협력단 대학 ICT연구센터 육성·지원사업 [Ezbaro][정부] 스마트 모빌리티를 위한 인공지능 시스템반도체 핵심 기술 개발 및 인력 양성 (1차년도)