1 |
1
발화 및 녹음된 음성 신호 파일들과 각각의 음성 신호 파일의 발화 내용을 텍스트 형태로 기술한 전사문 및 각각의 음성 신호 파일에 해당하는 화자 정보를 포함하는 데이터베이스;상기 음성 신호 파일, 상기 전사문, 및 각 단어 별로 복수 개의 발음열을 포함하는 다중 발음 사전으로부터 음성 인식기의 정렬 기능을 이용하여 상기 음성 신호 파일에 포함된 단어에 대하여 상기 다중 발음 사전에서 가장 가까운 발음열을 검출하는 음성-발음열 정렬부;상기 가장 가까운 발음열의 검출을 상기 데이터베이스에 저장된 음성 신호 파일들과 상기 전사문에 적용하여 단어와 발음열의 쌍들을 추출하는 단어-발음열 쌍 추출부; 및상기 추출된 단어와 발음열의 쌍들을 바탕으로 상기 다중 발음 사전의 각 단어 별 발음열들에 대한 통계 정보를 산출하여 저장하는 발음열 통계정보 추출부를 포함하는 것을 특징으로 하는 통계 기반의 다중 발음 사전 생성 장치
|
2 |
2
제1항에 있어서,상기 음성 신호 파일에서 오디오 지문을 추출하고 해시키 값으로 변환하여 상기 통계 정보와 함께 저장하는 해시키 값 생성부를 더 포함하는 것을 특징으로 하는 다중 발음 사전 생성 장치
|
3 |
3
제2항에 있어서,임의의 음성 신호 파일에 대하여 생성되는 상기 해시키 값과 이미 저장된 해시키 값을 이용하여 상기 임의의 음성 신호 파일이 상기 통계 정보의 산출에 중복하여 사용되는지 판단하는 중복 사용 검증부를 더 포함하는 것을 특징으로 하는 다중 발음 사전 생성 장치
|
4 |
4
제1항에 있어서, 상기 발음열들에 대한 통계 정보는 각 발음열 별 출현 빈도를 포함하는 것을 특징으로 하는 다중 발음 사전 생성 장치
|
5 |
5
제1항에 있어서,상기 발음열 통계정보 추출부는, 상기 데이터베이스의 화자 정보를 참조하여 상기 다중 발음 사전의 각 단어 별 발음열들에 대하여 해당 음성 신호를 발성한 화자의 출신 지역 정보를 상기 통계 정보와 함께 저장하는 것을 특징으로 하는 다중 발음 사전 생성 장치
|
6 |
6
제2항에 있어서,상기 해시키 값 생성부는 음성 신호 파일을 일정 구간으로 나누고 각 구간을 일정 개수의 주파수 부대역으로 나눈 후 각 부대역의 에너지를 구하고 이를 일정 차원의 벡터열로 표현하여 일정 비트의 바이너리 값을 얻어서 상기 해시키 값을 생성하는 것을 특징으로 하는 다중 발음 사전 생성 장치
|
7 |
7
제6항에 있어서,상기 해시키 값 생성부는 상기 일정 비트의 바이너리 값과 상기 음성-발음열 정렬부의 정렬 결과 얻어지는 해당 단어의 음성 신호 파일에서의 시작점 정보의 바이너리 값을 통합하여 상기 해시키 값을 생성하는 것을 특징으로 하는 다중 발음 사전 생성 장치
|
8 |
8
발화 및 녹음된 음성 신호 파일들과 각각의 음성 신호 파일의 발화 내용을 텍스트 형태로 기술한 전사문 및 각각의 음성 신호 파일에 해당하는 화자 정보를 포함하는 데이터베이스를 마련하는 단계;상기 음성 신호 파일, 상기 전사문, 및 각 단어 별로 복수 개의 발음열을 포함하는 다중 발음 사전으로부터 음성 인식기의 정렬 기능을 이용하여 상기 음성 신호 파일에 포함된 단어에 대하여 상기 다중 발음 사전에서 가장 가까운 발음열을 검출하는 단계;상기 가장 가까운 발음열의 검출을 상기 데이터베이스에 저장된 음성 신호 파일들과 상기 전사문에 적용하여 단어와 발음열의 쌍들을 추출하는 단계; 및상기 추출된 단어와 발음열의 쌍들을 바탕으로 상기 다중 발음 사전의 각 단어 별 발음열들에 대한 통계 정보를 산출하여 저장하는 단계를 포함하는 것을 특징으로 하는 통계 기반의 다중 발음 사전 생성 방법
|
9 |
9
제8항에 있어서,상기 음성 신호 파일에서 오디오 지문을 추출하고 해시키 값으로 변환하여 상기 통계 정보와 함께 저장하는 단계를 더 포함하는 것을 특징으로 하는 다중 발음 사전 생성 방법
|
10 |
10
제9항에 있어서,임의의 음성 신호 파일에 대하여 생성되는 상기 해시키 값과 이미 저장된 해시키 값을 이용하여 상기 임의의 음성 신호 파일이 상기 통계 정보의 산출에 중복하여 사용되는지 판단하는 단계를 더 포함하는 것을 특징으로 하는 다중 발음 사전 생성 방법
|