1 |
1
화자의 감정 정보가 포함된 음성 신호로부터 음향학적 특징(acoustic cue)을 추출하는 단계, 상기 감정 정보는 기 설정된 복수의 감정 카테고리 중 적어도 하나를 포함함;상기 추출된 음향학적 특징에 기초하여 상기 음성 신호가 기 설정된 수의 분류 항목에 각각 속할 샘플 확률값 세트를 유추하는 단계;상기 샘플 확률값 세트를 해당 음성 신호에 포함된 상기 감정 정보에 기초하여 상기 감정 카테고리 별로 구분하고, 상기 각 감정 카테고리 별로 구분된 샘플 확률값 세트를 기 설정된 기준에 따라 적어도 하나의 클러스터(cluster)로 분류하는 단계;상기 각 클러스터에 포함된 샘플 확률값 세트의 각 확률값에 기초하여 해당 클러스터의 대표 모델을 생성하는 단계;감정 인식 대상인 음성 신호를 입력 받고, 상기 감정 인식 대상인 음성 신호의 음향학적 특징을 추출하는 단계;상기 감정 인식 대상인 음성 신호의 음향학적 특징에 기초하여 상기 감정 인식 대상인 음성 신호가 상기 분류 항목에 각각 속할 측정 확률값 세트를 유추하는 단계;상기 측정 확률값 세트와 상기 대표 모델의 유사도를 평가하는 단계; 및상기 측정 확률값 세트와 가장 유사도가 높은 대표 모델의 감정을 상기 감정 인식 대상인 음성 신호의 감정 상태로 판별하는 단계; 를 포함하되,상기 샘플 확률값 세트를 유추하는 단계 및 상기 측정 확률값 세트를 유추하는 단계는,토픽 모델링(topic modeling) 기법을 이용하고, 상기 분류 항목은 토픽 모델링 기법의 토픽(topic)이며, 상기 샘플 확률값 세트 및 상기 측정 확률값 세트를 유추할 때 상기 각 음성 신호의 음향학적 특징으로부터 추정된 파라미터를 이용하는 것을 특징으로 하는 감정 인식 시스템의 제어 방법
|
2 |
2
삭제
|
3 |
3
제1항에 있어서,상기 샘플 확률값 세트를 유추하는 단계 및 상기 측정 확률값 세트를 유추하는 단계는,잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 방식을 이용하여 상기 샘플 확률값 세트 및 상기 측정 확률값 세트를 유추하고,상기 측정 확률값 세트를 유추하는 단계는,상기 샘플 확률값 세트를 유추할 때 추정된 적어도 하나의 파라미터를 이용하는 단계인 것을 특징으로 하는 감정 인식 시스템의 제어 방법
|
4 |
4
제3항에 있어서,상기 샘플 확률값 세트를 유추하는 단계 및 상기 측정 확률값 세트를 유추하는 단계는,배리에이셔널 인퍼런스(variational inference) 방식을 이용하여 상기 각 파라미터를 추정하는 단계인 것을 특징으로 하는 감정 인식 시스템의 제어 방법
|
5 |
5
제1항에 있어서,상기 적어도 하나의 클러스터로 분류하는 단계는,상기 각 감정 카테고리 별 샘플 확률값 세트가 하나의 클러스터에 포함된 것으로 가정한 상태에서 상기 클러스터의 센트로이드(centroid)와 상기 각 샘플 확률값 세트 사이의 거리의 제곱의 합을 계산한 1차 클러스터 분포값과,상기 각 감정 카테고리 별 샘플 확률값 세트가 n 개의 클러스터로 분류된 것으로 가정한 상태에서 상기 n 개의 클러스터의 각 센트로이드와 해당 클러스터에 포함된 각 샘플 확률값 세트 사이의 거리의 제곱의 합을 계산한 n차 클러스터 분포값을 상기 각 감정 카테고리마다 구하되,상기 각 감정 카테고리의 1차 클러스터 분포값과 상기 n차 클러스터 분포값의 비율이 기 설정된 특정 범위 이내에 포함되는지 여부에 따라서 상기 각 감정 카테고리의 클러스터의 수 n이 정해지는 단계인 것을 특징으로 하는 감정 인식 시스템의 제어 방법
|
6 |
6
제1항에 있어서,상기 각 클러스터의 대표 모델을 생성하는 단계는,가우시안 혼합 모델을 통해 상기 각 클러스터에 포함된 샘플 확률값 세트의 각 확률값으로부터 확률 분포의 형태를 가지는 대표 모델을 각 클러스터마다 생성하고,상기 측정 확률값 세트와 상기 대표 모델의 유사도를 평가하는 단계는,상기 측정 확률값 세트와 상기 각 대표 모델의 조합으로부터 계산된 공산(likelihood)값의 크기에 기초하여 유사도를 평가하는 단계인 것을 특징으로 하는 감정 인식 시스템의 제어 방법
|
7 |
7
음성 신호를 입력 받는 입력장치;제어장치의 제어에 의해 상기 음성 신호 및 상기 제어장치에서 생성된 정보를 저장하는 저장장치; 및상기 입력장치 및 상기 저장장치의 작동을 제어하고, 상기 음성 신호의 감정 상태를 판별하는 제어장치; 를 포함하되,상기 제어장치는,상기 입력장치를 통해 화자의 감정 정보가 포함된 음성 신호를 입력 받되, 상기 감정 정보는 기 설정된 복수의 감정 카테고리 중 적어도 하나를 포함하고,상기 음성 신호로부터 음향학적 특징을 추출하고,상기 추출된 음향학적 특징에 기초하여 상기 음성 신호가 기 설정된 수의 분류 항목에 각각 속할 샘플 확률값 세트를 유추하고,상기 샘플 확률값 세트를 해당 음성 신호에 포함된 상기 감정 정보에 기초하여 상기 감정 카테고리 별로 구분하고, 상기 각 감정 카테고리 별로 구분된 샘플 확률값 세트를 기 설정된 기준에 따라 적어도 하나의 클러스터로 분류하고,상기 각 클러스터에 포함된 샘플 확률값 세트의 각 확률값에 기초하여 해당 클러스터의 대표 모델을 생성하며, 상기 대표 모델을 상기 저장장치에 저장하고,감정 인식 대상인 음성 신호를 입력 받고, 상기 감정 인식 대상인 음성 신호의 음향학적 특징을 추출하고,상기 감정 인식 대상인 음성 신호의 음향학적 특징에 기초하여 상기 감정 인식 대상인 음성 신호가 상기 분류 항목에 각각 속할 측정 확률값 세트를 유추하고,상기 측정 확률값 세트와 상기 저장 장치에 저장된 대표 모델의 유사도를 평가하고,상기 측정 확률값 세트와 가장 유사도가 높은 대표 모델의 감정을 상기 감정 인식 대상인 음성 신호의 감정 상태로 판별하되,상기 제어장치는 토픽 모델링 기법을 이용하여 상기 샘플 확률값 세트 및 상기 측정 확률값 세트를 유추하고, 상기 분류 항목은 토픽 모델링 기법의 토픽이며, 상기 샘플 확률값 세트 및 상기 측정 확률값 세트를 유추할 때 상기 각 음성 신호의 음향학적 특징으로부터 추정된 파라미터를 이용하는 것을 특징으로 하는 감정 인식 시스템
|
8 |
8
삭제
|
9 |
9
제7항에 있어서,상기 제어장치는,잠재 디리클레 할당 방식을 이용하여 상기 샘플 확률값 세트 및 상기 측정 확률값 세트를 유추하고,상기 측정 확률값 세트를 유추할 때, 상기 샘플 확률값 세트를 유추하는 과정에서 추정된 적어도 하나의 파라미터를 이용하는 것을 특징으로 하는 감정 인식 시스템
|
10 |
10
제9항에 있어서,상기 제어장치는,배리에이셔널 인퍼런스 방식을 이용하여 상기 각 파라미터를 추정하는 것을 특징으로 하는 감정 인식 시스템
|
11 |
11
제7항에 있어서,상기 제어장치는,상기 각 감정 카테고리 별 샘플 확률값 세트가 하나의 클러스터에 포함된 것으로 가정한 상태에서 상기 클러스터의 센트로이드와 상기 각 샘플 확률값 세트 사이의 거리의 제곱의 합을 계산한 1차 클러스터 분포값과,상기 각 감정 카테고리 별 샘플 확률값 세트가 n 개의 클러스터로 분류된 것으로 가정한 상태에서 상기 n 개의 클러스터의 각 센트로이드와 해당 클러스터에 포함된 각 샘플 확률값 세트 사이의 거리의 제곱의 합을 계산한 n차 클러스터 분포값을 상기 각 감정 카테고리마다 구하되,상기 각 감정 카테고리의 1차 클러스터 분포값과 상기 n차 클러스터 분포값의 비율이 기 설정된 특정 범위 이내에 포함되는지 여부에 따라서 상기 각 감정 카테고리의 클러스터의 수 n을 정하는 것을 특징으로 하는 감정 인식 시스템
|
12 |
12
제7항에 있어서,상기 제어장치는,가우시안 혼합 모델을 통해 상기 각 클러스터에 포함된 샘플 확률값 세트의 각 확률값으로부터 확률 분포의 형태를 가지는 대표 모델을 각 클러스터마다 생성하고,상기 측정 확률값 세트와 상기 각 대표 모델의 조합으로부터 계산된 공산값의 크기에 기초하여 유사도를 평가하는 단계인 것을 특징으로 하는 감정 인식 시스템
|