1 |
1
복수의 대용량 음성 데이터들 각각에 대해 시작점과 끝점 및 음성의 특징을 추출하는 추출부;상기 추출부에서 추출된 상기 음성의 특징과, 문맥 종속 적응 모델 및 문맥 독립 적응 반음소 모델을 이용하여 음성 데이터의 음소 수준 우도비값과 단어 수준 로그 우도비값을 산출하고, 상기 음소 수준 우도비값과 단어 수준 로그 우도비값을 근거로 문장 수준 로그 우도비값을 산출하는 발화 검증부; 및상기 발화 검증부에서 산출한 문장 수준 로그 우도비값 및 문장 문턱치값을 근거로 음성 데이터를 정상 인식 데이터, 비정상 인식 데이터 및 판단불가 데이터 중에 하나로 분류하고, 상기 판단불가 데이터로 분류된 음성 데이터를 근거로 음향 모델을 생성하는 음향모델링부를 포함하고,상기 음향모델링부는 상기 문장 수준 로그 우도비값이 최소 문턱치값 이상이고 최대 문턱치값 이하이면 판단불가 데이터로 분류하는 것을 특징으로 하는 발화검증 기반 대용량 음성 데이터 자동 처리 장치
|
2 |
2
청구항 1에 있어서,상기 추출부는,상기 복수의 대용량 음성 데이터들 각각에 대해 시작점과 끝점을 추출하는 끝점 추출 모듈; 및상기 복수의 대용량 음성 데이터들 각각에 대해 음성의 특징을 추출하는 특징 추출 모듈을 포함하는 것을 특징으로 하는 발화검증 기반 대용량 음성 데이터 자동 처리 장치
|
3 |
3
청구항 1에 있어서,상기 발화 검증부는,문맥 독립 적응 반음소 모델의 로그 우도값 및 문맥 종속 음소별 로그 우도값 중에 어느 하나를 근거로 상기 복수의 대용량 음성 데이터들 각각에 대해 단어 수준 로그 우도비값 및 문장 수준 로그 우도비값을 산출하는 것을 특징으로 하는 발화검증 기반 대용량 음성 데이터 자동 처리 장치
|
4 |
4
청구항 1에 있어서,상기 음향모델링부는,상기 발화 검증부에 의해 산출되는 문장 수준 로그 우도비값을 문장 문턱치값과 비교하여 정상 인식 데이터 및 판단불가 데이터를 검출하고, 상기 발화 검증부에 의해 산출되는 단어 수준 로그 우도비값을 단어 평균 우도비값과 비교하여 비정상 인식 가능성이 있는 단어 및 정상 인식 가능성이 있는 단어로 분류하여 출력하는 것을 특징으로 하는 발화검증 기반 대용량 음성 데이터 자동 처리 장치
|
5 |
5
청구항 1에 있어서,음성인식시스템을 통해 수집된 음성 데이터 파일, 엔베스트 음성인식 결과, 문맥 종속 적응 모델, 문맥 독립 적응 반음소 모델, 문맥 종속 음향 모델 중에 적어도 하나를 포함하는 정보를 저장하는 저장부를 더 포함하는 것을 특징으로 하는 발화검증 기반 대용량 음성 데이터 자동 처리 장치
|
6 |
6
추출부에 의해, 복수의 대용량 음성 데이터들 각각에 대해 시작점과 끝점 및 음성의 특징을 추출하는 단계;발화 검증부에 의해, 상기 시작점과 끝점 및 음성의 특징을 추출하는 단계에서 추출된 상기 음성의 특징과, 문맥 종속 적응 모델 및 문맥 독립 적응 반음소 모델을 이용하여 음성 데이터의 음소 수준 우도비값과 단어 수준 로그 우도비값을 산출하는 단계;상기 발화 검증부에 의해, 상기 음소 수준 우도비값과 단어 수준 로그 우도비값을 근거로 문장 수준 로그 우도비값을 산출하는 단계;음향모델링부에 의해, 상기 문장 수준 로그 우도비값 및 문장 문턱치값을 근거로 음성 데이터를 정상 인식 데이터, 비정상 인식 데이터 및 판단불가 데이터 중에 하나로 분류하는 단계; 및상기 음향모델링부에 의해, 상기 분류하는 단계에서 판단불가 데이터로 분류된 음성 데이터를 근거로 음향 모델을 생성하는 단계를 포함하고, 상기 분류하는 단계에서는,상기 음향모델링부에 의해, 상기 문장 수준 로그 우도비값이 최소 문턱치값 이상이고 최대 문턱치값 이하이면 판단불가 데이터로 분류하는 단계를 포함하는 것을 특징으로 하는 발화검증 기반 대용량 음성 데이터 자동 처리 방법
|
7 |
7
청구항 6에 있어서,상기 시작점과 끝점 및 음성의 특징을 추출하는 단계는,상기 추출부에 의해, 상기 복수의 대용량 음성 데이터들 각각에 대해 시작점과 끝점을 추출하는 단계; 및상기 추출부에 의해, 상기 복수의 대용량 음성 데이터들 각각에 대해 음성의 특징을 추출하는 단계를 포함하는 것을 특징으로 하는 발화검증 기반 대용량 음성 데이터 자동 처리 방법
|
8 |
8
청구항 6에 있어서,상기 음성 데이터의 음소 수준 우도비값과 단어 수준 로그 우도비값을 산출하는 단계는,상기 발화 검증부에 의해, 문맥 종속 음소별 로그 우도값과 문맥 독립 적응 반음소 모델의 로그 우도값을 근거로 음소 수준 우도비값을 산출하는 단계; 및상기 발화 검증부에 의해, 기산출한 음소 수준 로그 우도값과, 문맥 종속 음소별 로그 우도값을 근거로 단어 수준 로그 우도비값을 산출하는 단계를 포함하고,상기 문장 수준 로그 우도비값을 산출하는 단계는,상기 발화 검증부에 의해, 기산출한 문장 수준 로그 우도값과 문맥 종속 음소별 로그 우도값을 근거로 문장 수준 로그 우도비값을 산출하는 단계를 포함하는 것을 특징으로 하는 발화검증 기반 대용량 음성 데이터 자동 처리 방법
|
9 |
9
청구항 6에 있어서,상기 분류하는 단계는,상기 음향모델링부에 의해, 문장 수준 로그 우도비값과 문장 문턱치값을 비교하는 단계; 및상기 비교하는 단계의 비교 결과를 근거로 판단불가 데이터, 정상 인식 데이터, 비정상 인식 데이터 중에 어느 하나로 대용량 음성 데이터를 분류하는 단계를 포함하는 것을 특징으로 하는 발화검증 기반 대용량 음성 데이터 자동 처리 방법
|
10 |
10
청구항 9에 있어서,상기 분류하는 단계는,상기 문장 수준 로그 우도비값이 최소 문턱치값을 미만이면 비정상 인식 데이터로 분류하는 단계; 및상기 문장 수준 로그 우도비값이 최대 문턱치값을 초과하면 정상 인식 데이터로 분류하는 단계를 더 포함하는 것을 특징으로 하는 발화검증 기반 대용량 음성 데이터 자동 처리 방법
|