1 |
1
서비스 로봇 환경의 지능형 로봇 서비스 시스템에서, 무선 마이크로폰을 이용하여 화자들을 각각 등록하는 과정과, 상기 등록된 화자들 중 무선 마이크로폰 송신기를 이용하여 발성을 한 화자로부터 무선 마이크로폰 수신기를 통해 유효 음성 데이터를 수신하는 과정과, 상기 수신된 유효 음성 데이터에서 특징을 추출하는 과정과, 상기 추출된 특징을 이용하여 적어도 하나의 화자 모델을 생성하는 과정과, 상기 추출된 특징과 상기 생성된 화자 모델 간의 유사도를 측정하여 상기 화자를 인식하는 과정을 포함하는 것을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 방법
|
2 |
2
제1항에 있어서, 상기 발성을 한 화자로부터 원하는 시점에만 상기 무선 마이크로폰 송신기를 온(ON)시키는 과정과, 상기 화자 인식을 원하지 않는 시점에 상기 마이크로폰 송신기를 오프(OFF)시켜서 상기 발성한 화자로부터의 음성 입력을 차단하는 과정을 더 포함하며, 상기 마이크로폰 송신기의 ON/OFF에 따라 상기 구축된 화자인식기를 구동시키는 것을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 방법
|
3 |
3
제1항에 있어서, 상기 특징을 추출하는 과정은, 상기 수신된 유효 음성 데이터를 프레임별로 나누는 단계와, 상기 나눠진 각 프레임에 해당하는 멜 캡스트럼 계수를 구하는 단계를 포함하며, 상기 구한 멜 캡스트럼 계수를 추출된 특징으로서 이용함을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 방법
|
4 |
4
제1항에 있어서, 상기 적어도 하나의 화자 모델을 생성하는 과정은, 상기 추출된 특징을 상기 각 화자별로 모으는 단계와, 가우시안 혼합 모델을 통해 상기 각 화자별로 화자 모델을 생성하는 단계와, 상기 생성된 각 화자 모델을 이용하여 화자 인식기를 구축하는 단계를 포함하는 것을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 방법
|
5 |
5
제4항에 있어서, 상기 화자 인식기는 하기 <수학식 5>과 같은 상기 화자에 대한 혼합 밀도를 통해 구축됨을 특징으로 하며, 하기 <수학식 5>에서 Wi는 혼합 가중치를 의미하며, bi는 가우시안 혼합 모델을 통해 얻어진 확률을 의미함을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 방법
|
6 |
6
제1항에 있어서, 상기 화자를 인식하는 과정은, 최대 우도 추정 방법을 이용하여 상기 추출된 특징과 상기 생성된 화자 모델 간의 거리에 따라 유사도를 측정하는 단계와, 상기 측정 결과에 따라 최대 사후 확률을 가진 화자 모델을 찾는 단계와, 상기 최대 사후 확률을 가진 화자 모델을 상기 발성을 한 화자로 인식하는 단계를 포함하는 것을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 방법
|
7 |
7
제6항에 있어서, 상기 최대 사후 확률을 가진 화자 모델은 하기 <수학식 6>에 의해 찾으며, 하기 <수학식 6>에서 λ는 화자모델, x는 입력된 음성, P는 확률을 의미함을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 방법
|
8 |
8
서비스 로봇 환경의 지능형 로봇 서비스 시스템에서, 무선 마이크로폰을 이용하여 화자를 인식하기 위한 장치에 있어서, 발성을 한 화자로부터 무선 마이크로폰 송신기를 통해 유효 음성 데이터를 수신하는 무선 마이크로폰 수신기와, 상기 수신된 유효 음성 데이터에서 특징을 추출하는 특징 추출부와, 상기 추출된 특징을 이용하여 적어도 하나의 화자 모델을 생성하는 화자 모델 생성부와, 상기 추출된 특징과 상기 생성된 화자 모델 간의 유사도를 측정하여 상기 화자를 인식하는 화자 인식부를 포함하는 것을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 장치
|
9 |
9
제8항에 있어서, 상기 무선 마이크로폰 수신기로 수신된 유효 음성 데이터를 입력받아 상기 특징 추출부로 전달하는 음성 입력부와, 상기 화자 인식에 관련한 정보들을 저장하는 저장부를 더 포함하는 것을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 장치
|
10 |
10
제8항에 있어서, 상기 무선 마이크로폰 송신기는 상기 발성을 한 화자측에 형성되고, 상기 화자 인식을 원하는 시점에만 온(ON)되어 상기 발성을 한 화자의 유효 음성을 입력받고, 상기 화자 인식을 원하지 않는 시점에 오프(OFF)되어 상기 발성한 화자로부터의 음성 입력을 차단함을 특징으로 하는 마이크로폰을 이용한 화자 인식 장치
|
11 |
11
제8항에 있어서, 상기 특징 추출부는 상기 수신된 유효 음성 데이터를 프레임별로 나누고, 상기 나눠진 각 프레임에 해당하는 멜 캡스트럼 계수를 구하여 특징을 추출함을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 장치
|
12 |
12
제8항에 있어서, 상기 화자 모델 생성부는 상기 추출된 특징을 상기 각 화자별로 모으고, 가우시안 혼합 모델을 이용하여 상기 각 화자별 화자 모델을 생성하고, 상기 생성된 화자 모델을 이용하여 화자 인식기를 구축함을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 장치
|
13 |
13
제8항에 있어서, 상기 구축된 화자 인식기는 상기 화자 인식부에 포함되어 상기 마이크로폰 송신기의 ON/OFF에 따라 구동됨을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 장치
|
14 |
14
제13항에 있어서, 상기 화자 인식기는 하기 <수학식 7>과 같은 상기 화자에 대한 혼합 밀도를 통해 구축됨을 특징으로 하며, 하기 <수학식 7>에서 Wi는 혼합 가중치를 의미하며, bi는 가우시안 혼합 모델을 통해 얻어진 확률을 의미함을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 장치
|
15 |
15
제8항에 있어서, 상기 화자 인식부는 최대 우도 추정 방법을 이용하여 상기 추출된 특징과 상기 생성된 화자 모델 간의 거리에 따라 유사도를 측정하고, 상기 측정 결과에 따라 최대 사후 확률을 가진 화자 모델을 찾고, 찾은 최대 사후 확률을 가진 화자 모델을 상기 발성을 한 화자로 인식함을 특징으로 포함하는 것을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 장치
|
16 |
16
제15항에 있어서, 상기 최대 사후 확률을 가진 화자 모델은 하기 <수학식 8>에 의해 찾음을 특징으로 하며, 하기 <수학식 8>에서 λ는 화자모델, x는 입력된 음성, P는 확률을 의미함을 특징으로 하는 무선 마이크로폰을 이용한 화자 인식 장치
|