1 |
1
표준음성에 대한 속성별 표준음성 특징정보를 저장하는 표준음성 DB 및 평가 기준 레벨값을 저장하는 평가 기준 DB를 포함하는 저장부;발화자가 발성하는 음성을 입력받아 음성 데이터를 출력하는 오디오 처리부; 및상기 음성 데이터를 입력받아 다수의 프레임으로 분할하고, 프레임 단위로 샘플링하여 정규화하며, 정규화된 프레임 단위의 복수의 속성별 특징을 검출하고, 검출된 속성별 특징과 상기 표준음성 DB에 미리 저장되어 있는 발성된 상기 음성에 대한 해당 표준음성의 속성별 특징정보의 특징간의 유클리드 거리(유사도)를 계산하고, 계산된 각 속성별 유클리드 거리를 복합적으로 반영한 평가값을 계산한 후, 계산된 상기 평가값과 상기 평가 기준 DB의 평가 기준 레벨값을 비교하여 상기 발화자의 발성 음성을 평가하는 제어부를 포함하되,상기 제어부는,상기 오디오 처리부를 통해 음성 데이터를 획득하여 출력하는 음성신호 처리부;상기 음성신호 처리부로부터 음성 데이터를 입력받고, 다수의 프레임으로 분할하고, 프레임 단위로 샘플링하여 정규화하며, 정규화된 프레임 단위의 복수의 속성별 특징을 검출하는 음성 특징 추출부;검출된 속성별 특징과 상기 표준음성 DB에 미리 저장되어 있는 표준음성에 대한 속성별 특징간의 거리(유사도)를 계산하는 유클리드 거리 계산부;계산된 각 속성별 거리를 복합적으로 반영한 평가값을 계산하는 평가값 계산부; 및계산된 상기 평가값과 상기 평가 기준 DB의 평가 기준 레벨값을 비교하여 상기 발화자의 발성 음성을 평가하는 음성 평가부를 포함하고,상기 음성 특징 추출부는,다수의 프레임으로 분할하고, 프레임 단위로 샘플링하여 정규화하는 샘플링부;정규화된 프레임에 단기 푸리에 변환(Short Term Fourier Transform)을 수행하여 발성 음성에 대응하는 상기 음성 데이터에 대한 파워 스펙트럼을 구하는 에너지 스펙트럼 획득부;상기 파워 스펙트럼에 대한 각 주파수 구간에서의 각각의 속성별 에너지를 추출하는 속성별 특징 추출부;상기 각 속성의 구간별 에너지에 로그를 취하여 로그값을 계산하는 구간별 로그부; 및각 속성에 대해 구간별 연속되는 로그값에 의해 표현되는 곡선에 대한 이산 코사인 변환을 수행하여 이산 코사인 변환값을 특징값으로 출력하는 이산 코사인 변환 계산부를 포함하며,상기 속성별 특징 추출부는,상기 파워 스펙트럼에 멜 스케일(Mel Scale)필터 뱅크를 적용하여 발성 음성에 대한 청각 기반 속성의 에너지를 계산하고, 계산된 에너지를 합하여 제1 특징을 추출하는 MFCC 특징 추출부;상기 파워 스펙트럼에 선형 스케일(Linear Scale)필터 뱅크를 적용하여 발성 음성에 대한 성도 기반 속성의 에너지를 계산하고, 계산된 에너지를 합하여 제2 특징을 추출하는 LPCC 특징 추출부; 및상기 파워 스펙트럼에 바크 스케일(Bark Scale)필터 뱅크 및 노이즈 필터를 적용하여 배경잡음이 제거된 발성 음성에 대한 에너지를 계산하고, 계산된 에너지를 합하여 제3 특징을 추출하는 RASTA-PLP(Relative Spectral-Perceptual Linear Prediction) 특징 추출부를 포함하고,상기 평가값 계산부는,MFCC, LPCC 및 RASTA-PLP 속성별 가중치(MFCC-003e#w1, LPCC-003e#w2, RASTA-PLP-003e#w3) 및 속성별 유클리드 거리를 하기 수학식 2에 적용하여 평가값을 계산하는 것을 특징으로 하는 언어재활 기반 발성 음성 평가 장치
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
삭제
|
5 |
5
제1항에 있어서,상기 표준음성 DB는,미리 정의된 어휘에 대한 표준음성 특징정보를 저장하고,상기 제어부는,미리 정의된 어휘 중 어느 하나 이상을 오디오 처리부의 스피커를 통해 순차적으로 출력하여 상기 발화자가 출력되는 어휘에 대한 음성을 발성하도록 유도하는 것을 특징으로 하는 언어재활 기반 발성 음성 평가 장치
|
6 |
6
제5항에 있어서,상기 어휘는 유탭(U-TAP) 어휘인 것을 특징으로 하는 언어재활 기반 발성 음성 평가 장치
|
7 |
7
삭제
|
8 |
8
제1항에 있어서,상기 표준음성 DB는,미리 정의된 어휘에 대한 표준 음성 특징정보 및 어휘별 가중치를 저장하고,상기 제어부는,미리 정의된 어휘 중 어느 하나 이상을 오디오 처리부의 스피커를 통해 순차적으로 출력하여 상기 발화자가 출력되는 어휘에 대한 음성을 발성하도록 유도한 후, 발성 유도된 어휘에 따라 입력되는 음성의 어휘에 대응하는 가중치를 적용하는 것을 특징으로 하는 언어재활 기반 발성 음성 평가 장치
|
9 |
9
제어부가 오디오 처리부를 통해 발화자가 발성한 음성에 대한 음성 데이터를 획득하는 음성 획득 과정;상기 제어부가 상기 음성 데이터를 다수의 프레임으로 분할하고, 프레임 단위로 샘플링하여 정규화하며, 정규화된 프레임 단위의 복수의 속성별 특징을 검출하는 속성별 특징 검출 과정;상기 제어부가 검출된 속성별 특징과 표준음성 DB에 미리 저장되어 있는 표준음성에 대한 속성별 특징간의 유클리드 거리(유사도)를 계산하는 유클리드 거리 계산 과정;상기 제어부가 계산된 각 속성별 유클리드 거리를 복합적으로 반영한 평가값을 계산하는 평가값 계산 과정; 및상기 제어부가 계산된 상기 평가값과 상기 평가 기준 DB의 평가 기준 레벨값을 비교하여 상기 발화자의 발성 음성을 평가하는 평가 과정을 포함하되,상기 속성별 특징 검출 과정은,다수의 프레임으로 분할하고, 프레임 단위로 샘플링하여 정규화하는 샘플링 단계;정규화된 프레임에 단기 푸리에 변환(Short Term Fourier Transform)을 수행하여 발성 음성에 대응하는 상기 음성 데이터에 대한 파워 스펙트럼을 구하는 에너지 스펙트럼 획득 단계;상기 파워 스펙트럼에 대한 각 주파수 구간에서의 각각의 속성별 특징(에너지값)을 추출하는 속성별 특징 추출 단계;상기 각 속성의 구간별 특징에 로그를 취하여 로그값을 계산하는 구간별 로그값 계산 단계; 및각 속성의 구간별 로그값에 이산 코사인 변환을 수행하여 이산 코사인 변환값을 계산하는 이산 코사인 변환 계산 단계를 포함하고,상기 속성별 특징 추출 단계는,상기 파워 스펙트럼에 멜 스케일(Mel Scale)필터 뱅크를 적용하여 발성 음성에 대한 청각 기반 속성의 에너지를 계산하고, 계산된 에너지를 합하여 제1 특징을 추출하는 MFCC 특징 추출 단계; 상기 파워 스펙트럼에 선형 스케일(Linear Scale)필터 뱅크를 적용하여 발성 음성에 대한 성도 기반 속성의 에너지를 계산하고, 계산된 에너지를 합하여 제2 특징을 추출하는 LPCC 특징 추출 단계; 및상기 파워 스펙트럼에 바크 스케일(Bark Scale)필터 뱅크를 적용하여 발성 음성에 대한 억양 기반 속성의 에너지를 계산하고, 계산된 에너지를 합하여 제3 특징을 추출하는 RASTA-PLP(Relative Spectral-Packet Level Procedure) 특징 추출 단계를 포함하고
|
10 |
10
삭제
|
11 |
11
삭제
|
12 |
12
제9항에 있어서,상기 제어부가 표준음성 DB에 미리 정의된 어휘 중 어느 하나 이상을 오디오 처리부의 스피커를 통해 순차적으로 출력하여 상기 발화자가 출력되는 어휘에 대한 음성을 발성하도록 유도하는 어휘 발성 유도 과정을 더 포함하는 것을 특징으로 하는 언어재활 기반 발성 음성 평가 방법
|
13 |
13
제12항에 있어서,상기 어휘는 유탭(U-TAP) 어휘인 것을 특징으로 하는 언어재활 기반 발성 음성 평가 방법
|
14 |
14
삭제
|