1 |
1
음성 신호에 기반하여 발화자의 감정을 인식하는 감정 인식 장치에 있어서,음성 기반 감정 인식 프로그램이 저장된 메모리; 및상기 메모리에 저장된 프로그램을 실행하는 프로세서를 포함하며, 상기 음성 기반 감정 인식 프로그램은, 발화자의 음성 데이터를 수신하고, 수신한 음성 데이터를 감정 분류 모델에 입력하여 발화자의 감정을 분류하되,상기 감정 분류 모델은 ConvLSTM을 통해 음성 데이터의 로컬 특징을 추출하는 로컬 특징 추출부, GRU(gated Recurren Unit)를 통해 음성 데이터의 글로벌 특징을 추출하는 글로벌 특징 추출부를 포함하고, 상기 로컬 특징과 글로벌 특징에 기반하여 발화자의 감정을 분류하는 것인, 음성 기반 감정 인식 장치
|
2 |
2
제1항에 있어서,상기 로컬 특징 추출부는 복수의 로컬 기능 학습 블록이 순차적으로 연결된 구조를 갖되, 각각의 로컬 기능 학습 블록은 ConvLSTM 계층, BN 계층 및 풀링 계층이 순차적으로 연결된 구조를 갖는 것인, 음성 기반 감정 인식 장치
|
3 |
3
제1항에 있어서,상기 글로벌 특징 추출부는 적층된 2개의 GRU(gated recurrent unit) 를 각각 포함하는 복수의 단위 레이어를 포함하는 것인, 음성 기반 감정 인식 장치
|
4 |
4
제1항에 있어서,상기 감정 분류 모델은 중심 손실 함수와 소프트 맥스 손실함수를 기초로하는 융합 손실 함수를 통해 상기 로컬 특징 추출부와 글로벌 특징 추출부의 출력에 대한 손실을 산출하고, 상기 손실을 최소화하는 방향으로 가중치 업데이트를 수행하는 것인, 음성 기반 감정 인식 장치
|
5 |
5
음성 기반 감정 인식 장치를 이용한 감정 인식 방법에 있어서,발화자의 음성 데이터를 수신하는 단계, 및수신한 음성 데이터를 감정 분류 모델에 입력하여 발화자의 감정을 분류하는 단계를 포함하되,상기 감정 분류 모델은 ConvLSTM을 통해 음성 데이터의 로컬 특징을 추출하는 로컬 특징 추출부, GRU(gated Recurren Unit)를 통해 음성 데이터의 글로벌 특징을 추출하는 글로벌 특징 추출부를 포함하고, 상기 로컬 특징과 글로벌 특징에 기반하여 발화자의 감정을 분류하는 것인, 음성 기반 감정 인식 방법
|
6 |
6
제5항에 있어서,상기 로컬 특징 추출부는 복수의 로컬 기능 학습 블록이 순차적으로 연결된 구조를 갖되, 각각의 로컬 기능 학습 블록은 ConvLSTM 계층, BN 계층 및 풀링 계층이 순차적으로 연결된 구조를 갖는 것인, 음성 기반 감정 인식 방법
|
7 |
7
제5항에 있어서,상기 글로벌 특징 추출부는 적층된 2개의 GRU(gated recurrent unit) 를 각각 포함하는 복수의 단위 레이어를 포함하는 것인, 음성 기반 감정 인식 방법
|
8 |
8
제5항에 있어서,상기 감정 분류 모델을 업데이트하는 단계를 더 포함하되,중심 손실 함수와 소프트 맥스 손실함수를 기초로하는 융합 손실 함수를 통해 상기 로컬 특징 추출부와 글로벌 특징 추출부의 출력에 대한 손실을 산출하고, 상기 손실을 최소화하는 방향으로 가중치 업데이트를 수행하는 것인, 음성 기반 감정 인식 방법
|