맞춤기술찾기

이전대상기술

상향식 주의집중과 하향식 주의집중 인공신경망을 이용한 음성 감정 인식 방법 및 장치

  • 기술번호 : KST2021010537
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 상향식 주의집중과 하향식 주의집중 인공신경망을 이용한 음성 감정 인식 방법 및 장치가 제시된다. 일 실시예에 따른 상향식 주의집중(bottom-up attention)과 하향식 주의집중(recurrent top down attention)을 적용한 인공신경망을 이용한 음성 감정 인식 방법은, 입력 받은 음성 신호를 상기 인공신경망의 컨볼루션 레이어(convolution layer)와 풀링 레이어(pooling layer)를 통과시키는 단계; 상기 음성 신호에 대해 감정에 대한 정보가 집중되어야 하는 특징(feature)의 공간적인(spatial) 정보를 유추하는 상향식 주의집중을 통한 값을 곱셈 또는 덧셈 연산하는 단계; 상기 음성 신호에 대해 감정에 대한 정보가 집중되어야 하는 특징의 채널(channel) 정보를 유추하는 하향식 주의집중을 통한 값을 곱셈 또는 덧셈 연산하는 단계; 및 상기 음성 신호에 상기 상향식 주의집중 및 하향식 주의집중을 통한 값을 곱셈 또는 덧셈 연산한 후, 다음 컨볼루션 레이어를 통과시키는 단계를 포함하고, 상기 음성 신호를 상기 인공신경망에 통과시킴에 따라 음성으로부터 감정을 인식할 수 있다.
Int. CL G10L 25/63 (2013.01.01) G10L 15/16 (2006.01.01) G10L 25/18 (2013.01.01) G06N 3/04 (2006.01.01)
CPC
출원번호/일자 1020200069492 (2020.06.09)
출원인 한국과학기술원
등록번호/일자 10-2295860-0000 (2021.08.25)
공개번호/일자 10-2021-0099492 (2021.08.12) 문서열기
공고번호/일자 (20210831) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020200012992   |   2020.02.04
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.06.09)
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이수영 대전광역시 유성구
2 최신국 대전광역시 유성구
3 신영훈 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.06.09 수리 (Accepted) 1-1-2020-0590694-65
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.12 수리 (Accepted) 4-1-2020-5131486-63
3 등록결정서
Decision to grant
2021.08.19 발송처리완료 (Completion of Transmission) 9-5-2021-0657075-09
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
상향식 주의집중(bottom-up attention)과 하향식 주의집중(recurrent top down attention)을 적용한 인공신경망을 이용한 음성 감정 인식 방법에 있어서, 입력 받은 음성 신호를 상기 인공신경망의 컨볼루션 레이어(convolution layer)와 풀링 레이어(pooling layer)를 통과시키는 단계; 상기 음성 신호에 대해 감정에 대한 정보가 집중되어야 하는 특징(feature)의 공간적인(spatial) 정보를 유추하는 상향식 주의집중을 통한 값을 곱셈 또는 덧셈 연산하는 단계; 상기 음성 신호에 대해 감정에 대한 정보가 집중되어야 하는 특징의 채널(channel) 정보를 유추하는 하향식 주의집중을 통한 값을 곱셈 또는 덧셈 연산하는 단계; 및 상기 음성 신호에 상기 상향식 주의집중 및 하향식 주의집중을 통한 값을 곱셈 또는 덧셈 연산한 후, 다음 컨볼루션 레이어를 통과시키는 단계를 포함하고, 상기 음성 신호를 상기 인공신경망에 통과시킴에 따라 음성으로부터 감정을 인식하는, 인공신경망을 이용한 음성 감정 인식 방법
2 2
제1항에 있어서, 상기 음성 신호를 멜-스펙토그램(mel-spectrogram)으로 변환하여 상기 인공신경망의 입력으로 사용하는 전처리 단계를 더 포함하는, 인공신경망을 이용한 음성 감정 인식 방법
3 3
제1항에 있어서, 상기 다음 컨볼루션 레이어를 통과시킨 후, 소프트맥스 함수에 기초하여 특징 별 손실(loss)을 계산하는 단계를 더 포함하는, 인공신경망을 이용한 음성 감정 인식 방법
4 4
제1항에 있어서,상기 인공신경망의 컨볼루션 레이어(convolution layer)와 풀링 레이어(pooling layer)를 통과시키는 단계는, 맥스 풀링 레이어(max pooling layer)의 특징(feature)은 공간적인(spatial) 방향과 채널(channel) 방향의 3 차원의 값을 갖는 것을 특징으로 하는, 인공신경망을 이용한 음성 감정 인식 방법
5 5
제1항에 있어서,상기 상향식 주의집중을 통한 값을 곱셈 또는 덧셈 연산하는 단계는, 상기 음성 신호를 입력으로 하여 감정에 대한 정보가 집중되어야 하는 특징의 공간적인(spatial) 정보를 유추하고, 가중치를 계산하여 상기 특징에 곱하거나 더하여 주의집중시키는 것을 특징으로 하는, 인공신경망을 이용한 음성 감정 인식 방법
6 6
제1항에 있어서,상기 하향식 주의집중을 통한 값을 곱셈 또는 덧셈 연산하는 단계는, 상기 인공신경망을 이용한 감정 분류 예측값을 입력으로 하여 감정에 대한 정보가 집중되어야 하는 특징의 채널(channel) 정보를 유추하고, 가중치를 계산하여 상기 특징에 곱하거나 더하여 특정 채널에 주의집중시키는 것을 특징으로 하는, 인공신경망을 이용한 음성 감정 인식 방법
7 7
제1항에 있어서,상기 곱셈 또는 덧셈 연산을 위한 상기 상향식 주의집중 및 하향식 주의집중을 통한 값은, 공간적인(spatial) 방향과 채널(channel) 방향으로 모두 다른 값을 가지는 것을 특징으로 하는, 인공신경망을 이용한 음성 감정 인식 방법
8 8
제1항에 있어서,상기 곱셈 또는 덧셈 연산을 위한 상기 상향식 주의집중 및 하향식 주의집중을 통한 값은, 공간적인(spatial) 방향으로 일정한 값을 가지거나 채널(channel) 방향으로 일정한 값을 가지는 것을 특징으로 하는, 인공신경망을 이용한 음성 감정 인식 방법
9 9
상향식 주의집중(bottom-up attention)과 하향식 주의집중(recurrent top down attention)을 적용한 인공신경망을 이용한 음성 감정 인식 장치에 있어서, 입력 받은 음성 신호를 상기 인공신경망의 컨볼루션 레이어(convolution layer)와 풀링 레이어(pooling layer)를 통과시키는 제1 처리부; 상기 음성 신호에 대해 감정에 대한 정보가 집중되어야 하는 특징(feature)의 공간적인(spatial) 정보를 유추하는 상향식 주의집중을 통한 값을 곱셈 또는 덧셈 연산하는 상향식 주의집중부; 상기 음성 신호에 대해 감정에 대한 정보가 집중되어야 하는 특징의 채널(channel) 정보를 유추하는 하향식 주의집중을 통한 값을 곱셈 또는 덧셈 연산하는 하향식 주의집중부; 및 상기 음성 신호에 상기 상향식 주의집중 및 하향식 주의집중을 통한 값을 곱셈 또는 덧셈 연산한 후, 다음 컨볼루션 레이어를 통과시키는 제2 처리부를 포함하고, 상기 음성 신호를 상기 인공신경망에 통과시킴에 따라 음성으로부터 감정을 인식하는, 인공신경망을 이용한 음성 감정 인식 장치
10 10
제9항에 있어서, 상기 음성 신호를 멜-스펙토그램(mel-spectrogram)으로 변환하여 상기 인공신경망의 입력으로 사용하는 전처리부를 더 포함하는, 인공신경망을 이용한 음성 감정 인식 장치
11 11
제9항에 있어서, 상기 제2 처리부를 통과시킨 후, 소프트맥스 함수에 기초하여 특징 별 손실(loss)을 계산하는 분류부를 더 포함하는, 인공신경망을 이용한 음성 감정 인식 장치
12 12
제9항에 있어서,상기 제1 처리부는, 맥스 풀링 레이어(max pooling layer)의 특징(feature)은 공간적인(spatial) 방향과 채널(channel) 방향의 3 차원의 값을 갖는 것을 특징으로 하는, 인공신경망을 이용한 음성 감정 인식 장치
13 13
제9항에 있어서,상기 상향식 주의집중부는, 상기 음성 신호를 입력으로 하여 감정에 대한 정보가 집중되어야 하는 특징의 공간적인(spatial) 정보를 유추하고, 가중치를 계산하여 상기 특징에 곱하거나 더하여 주의집중시키는 것을 특징으로 하는, 인공신경망을 이용한 음성 감정 인식 장치
14 14
제9항에 있어서,상기 하향식 주의집중부는, 상기 인공신경망을 이용한 감정 분류 예측값을 입력으로 하여 감정에 대한 정보가 집중되어야 하는 특징의 채널(channel) 정보를 유추하고, 가중치를 계산하여 상기 특징에 곱하거나 더하여 특정 채널에 주의집중시키는 것을 특징으로 하는, 인공신경망을 이용한 음성 감정 인식 장치
15 15
제9항에 있어서,상기 곱셈 또는 덧셈 연산을 위한 상기 상향식 주의집중 및 하향식 주의집중을 통한 값은, 공간적인(spatial) 방향과 채널(channel) 방향으로 모두 다른 값을 가지는 것을 특징으로 하는, 인공신경망을 이용한 음성 감정 인식 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 정보통신.방송 연구개발사업 상대방의 감성을 추론, 판단하여 그에 맞추어 대화하고 대응할 수 있는 감성지능 기술 연구개발(2020)