1 |
1
다수의 음성신호에 대하여 무성음 성분이 제거된 가우시안 혼합 모델(GMM; Gaussian Mixture Model)을 생성하는 단계;
화자의 음성신호를 수신하는 단계;
상기 음성신호에 대하여 무성음 성분이 제거된 특징벡터를 추출하는 단계; 및
상기 추출된 특징벡터를 상기 가우시안 혼합 모델과 비교하여 상기 음성신호의 성별을 판단하는 단계를 포함하되,
상기 특징벡터를 추출하는 단계는,
음성신호를 소정 시간 주기의 구간으로 구분하는 단계;
상기 음성신호의 각 구간 별로 미리 설정된 특정 주파수 이상의 고주파 대역의 평균 에너지(EH)와 상기 특정 주파수 이하의 저주파 대역의 평균 에너지(EL)의 비율(Er)을 구하는 단계;
상기 음성신호의 각 구간의 비율(Er)값과 미리 설정된 문턱 값의 크기를 비교하는 단계; 및
상기 비교 결과, 상기 문턱 값을 초과하는 각 구간의 음성신호에 대한 특징벡터를 추출하는 단계를 포함하는 것을 특징으로 하는 음성신호기반의 성별인식 방법
|
2 |
2
삭제
|
3 |
3
제1항에 있어서, 상기 특징벡터는 상기 음성신호의 피치(pitch)인 것을 특징으로 하는 음성신호 기반의 성별인식 방법
|
4 |
4
제1항에 있어서, 상기 특징벡터는 상기 음성신호의 포먼트 스펙트럼 (formant spectrum)인 것을 특징으로 하는 음성신호 기반의 성별인식방법
|
5 |
5
음성신호 기반의 성별인식을 위한 통계적 모델 생성 방법에 있어서,
음성신호를 소정 시간 주기의 구간으로 구분하는 단계;
상기 음성신호의 각 구간 별로 미리 설정한 특정 주파수 이상의 고주파 대역의 평균 에너지(EH)와 상기 특정 주파수 이하의 저주파 대역의 평균 에너지(EL)의 비율(Er)을 구하는 단계;
상기 음성신호의 각 구간의 비율(Er)을 미리 설정된 문턱 값과의 크기를 비교하는 단계;
상기 비교 결과, 상기 문턱 값을 초과하는 각 구간의 음성신호에 대한 특징벡터를 추출하는 단계; 및
상기 추출한 특징벡터들로부터 가우시안혼합 모델을 생성하는 단계를 포함하는 것을 특징으로 하는 통계적 모델 생성 방법
|
6 |
6
제5항에 있어서, 상기 특징벡터는 상기 음성신호의 음높이(pitch)인 것을 특징으로 하는 통계적 모델 생성 방법
|
7 |
7
제5항에 있어서, 상기 특징벡터는 상기 음성신호의 포먼트 스펙트럼 (formant spectrum)인 것을 특징으로 하는 통계적 모델 생성 방법
|
8 |
8
다수의 음성신호에 대한 가우시안 혼합 모델을 저장하는 저장부;
음성신호를 입력받는 입력부;
상기 입력된 음성신호로부터 무성음 성분이 제거된 특징벡터를 추출하되, 상기 입력된 음성신호를 소정 시간 주기의 구간으로 구분하고, 상기 음성신호의 각 구간 별로 미리 설정된 특정 주파수 이상의 고주파 대역의 평균 에너지(EH)와 상기 특정 주파수 이하의 저주파 대역의 평균 에너지(EL)의 비율(Er)을 구하며, 상기 음성신호의 각 구간의 비율(Er)값과 미리 설정된 문턱 값의 크기를 비교하고, 상기 비교 결과에 따라 상기 문턱 값을 초과하는 각 구간의 음성신호에 대한 특징벡터를 추출하는 특징벡터 추출부; 및
상기 추출된 특징벡터를 상기 저장부에 저장된 상기 가우시안 혼합 모델과 비교하여 상기 입력된 음성신호의 성별을 판단하는 성별판단부를 포함하는 것을 특징으로 하는 음성신호 기반의 성별인식 장치
|
9 |
9
제8항에 있어서, 상기 특징벡터 추출부는,
상기 입력된 음성신호를 소정 시간 주기의 구간으로 구분하고, 상기 각 구간별로 무성음 성분이 제거된 음성신호의 피치(pitch)를 검출하는 피치 검출부를 포함하는 것을 특징으로 하는 음성신호 기반의 성별인식장치
|
10 |
10
제8항에 있어서, 상기 특징벡터 추출부는,
상기 입력된 음성신호를 소정 시간 주기의 구간으로 구분하고, 상기 각 구간별로 무성음 성분이 제거된 음성신호의 포먼트 스펙트럼 (formant spectrum)을 검출하는 포먼트 스펙트럼 검출부를 포함하는 것을 특징으로 하는 음성신호 기반의 성별인식 장치
|