맞춤기술찾기

이전대상기술

화자적응 음성인식 시스템의 단말 및 서버와 그 운용 방법(TERMINAL AND SERVER OF SPEAKER-ADAPTATION SPEECH-RECOGNITION SYSTEM AND METHOD FOR OPERATING THE SYSTEM)

  • 기술번호 : KST2015231011
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 화자적응 음성인식 시스템의 단말 및 서버와 그 운용 방법을 제공한다. 상기 화자적응 음성인식 시스템의 단말은 화자의 음성데이터를 음성인식서버로 송신하는 음성녹음부, 상기 송신된 음성데이터를 인식한 상기 음성인식서버로부터 상기 화자의 발화에 대한 음향학적 통계정보가 포함된 통계변수를 수신하고 상기 수신된 통계변수를 누적하는 통계변수누적부, 상기 누적된 통계변수를 이용하여 상기 화자의 발화에 대한 변환매개변수를 생성하고 상기 생성된 변환매개변수를 상기 음성인식서버로 송신하는 변환매개변수생성부 및 상기 음성인식서버가 상기 송신된 변환매개변수를 이용하여 상기 화자의 음성데이터를 인식하고 상기 인식한 결과데이터를 송신하면, 상기 결과데이터를 수신하여 표시하는 결과표시UI부를 포함한다.
Int. CL G10L 15/28 (2006.01.01) G10L 15/07 (2013.01.01) G10L 15/02 (2006.01.01)
CPC
출원번호/일자 1020140074238 (2014.06.18)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2015-0145024 (2015.12.29) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 취하
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 20

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김동현 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인지명 대한민국 서울특별시 강남구 남부순환로**** 차우빌딩*층

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2014.06.18 수리 (Accepted) 1-1-2014-0568629-49
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
화자의 음성데이터를 음성인식서버로 송신하는 음성녹음부;상기 송신된 음성데이터를 인식한 상기 음성인식서버로부터 상기 화자의 발화에 대한 음향학적 통계정보가 포함된 통계변수를 수신하고 상기 수신된 통계변수를 누적하는 통계변수누적부;상기 누적된 통계변수를 이용하여 상기 화자의 발화에 대한 변환매개변수를 생성하고 상기 생성된 변환매개변수를 상기 음성인식서버로 송신하는 변환매개변수생성부; 및상기 음성인식서버가 상기 송신된 변환매개변수를 이용하여 상기 화자의 음성데이터를 인식하고 상기 인식한 결과데이터를 송신하면, 상기 결과데이터를 수신하여 표시하는 결과표시UI부를 포함하는 화자적응 음성인식 시스템의 단말
2 2
제1항에 있어서,상기 음성데이터로부터 특징벡터를 추출하는 전처리부; 및상기 추출된 특징벡터를 상기 변환매개변수를 이용하여 상기 화자의 발화 특징에 맞게 변환하는 특징벡터변환부를 더 포함하는 화자적응 음성인식 시스템의 단말
3 3
제2항에 있어서, 상기 전처리부는상기 음성데이터를 잡음처리, 스펙트럼 정규화(Spectral Normalization) 및 끝점검출처리 중 적어도 하나의 방법으로 전처리하고, 상기 전처리된 음성데이터로부터 특징벡터를 추출하는 것인 화자적응 음성인식 시스템의 단말
4 4
제2항에 있어서, 상기 특징벡터변환부는상기 전처리부가 상기 특징벡터를 추출하면, 상기 추출된 특징벡터를 상기 변환매개변수생성부가 생성한 상기 변환매개변수를 이용하여 상기 화자의 발화 특징에 맞게 변환하는 것인 화자적응 음성인식 시스템의 단말
5 5
제1항에 있어서,상기 음성인식서버로부터 상기 음성데이터를 인식한 결과데이터를 수신하고, 상기 결과데이터에 포함된 단어열의 신뢰도를 평가하는 신뢰도평가부; 및상기 결과데이터 및 상기 평가된 신뢰도를 이용하여 상기 통계변수를 생성하는 통계변수생성부를 더 포함하는 화자적응 음성인식 시스템의 단말
6 6
제5항에 있어서, 상기 신뢰도평가부는상기 평가된 신뢰도가 기설정된 기준 이상이면 해당 단어열에 가중치를 할당하고, 상기 평가된 신뢰도가 기설정된 기준 이하이면 해당 단어열을 삭제하는 것인 화자적응 음성인식 시스템의 단말
7 7
제5항에 있어서, 상기 통계변수생성부는상기 결과데이터에 포함된 단어열에 대응하는 음향모델 및 언어모델 중 적어도 하나의 방법을 이용하여 상기 통계변수를 생성하는 것인 화자적응 음성인식 시스템의 단말
8 8
화자의 음성데이터를 음성인식서버로 송신하는 단계;상기 송신된 음성데이터를 인식한 상기 음성인식서버로부터 상기 화자의 발화에 대한 음향학적 통계정보가 포함된 통계변수를 수신하면 상기 수신된 통계변수를 누적하는 단계;상기 누적된 통계변수를 이용하여 상기 화자의 발화에 대한 변환매개변수를 생성하고, 상기 생성된 변환매개변수를 상기 음성인식서버로 송신하는 단계; 및상기 음성인식서버가 상기 송신된 변환매개변수를 이용하여 상기 화자의 음성데이터를 인식하고 상기 인식한 결과데이터를 송신하면, 상기 결과데이터를 수신하여 표시하는 단계를 포함하는 화자적응 음성인식 시스템의 단말 운용 방법
9 9
제8항에 있어서,상기 음성데이터로부터 특징벡터를 추출하는 단계;상기 추출된 특징벡터를 상기 변환매개변수를 이용하여 상기 화자의 발화 특징에 맞게 변환하는 단계; 및상기 화자의 발화 특징에 맞게 변환된 특징벡터 및 상기 음성데이터를 상기 음성인식서버로 송신하는 단계를 더 포함하는 화자적응 음성인식 시스템의 단말 운용 방법
10 10
제9항에 있어서, 상기 음성데이터로부터 특징벡터를 추출하는 단계는상기 화자의 음성데이터를 잡음처리, 스펙트럼 정규화 및 끝점검출처리 중 적어도 하나의 방법으로 전처리하고, 상기 전처리된 화자의 음성데이터로부터 특징벡터를 추출하는 것인 화자적응 음성인식 시스템의 단말 운용 방법
11 11
제8항에 있어서, 상기 생성된 변환매개변수를 상기 음성인식서버로 송신하는 단계는상기 음성데이터를 상기 음성인식서버로 송신할 때, 상기 변환매개변수를 상기 음성인식서버로 송신하는 것인 화자적응 음성인식 시스템의 단말 운용 방법
12 12
제8항에 있어서, 상기 수신된 통계변수를 누적하는 단계는상기 통계변수에 가중치를 할당하여 기저장된 통계변수와 합산하여 저장하는 것인 화자적응 음성인식 시스템의 단말 운용 방법
13 13
단말로부터 화자의 음성데이터를 수신하여 음성인식을 수행하고, 상기 수행된 음성인식의 결과데이터를 출력하는 음성인식부;상기 출력된 결과데이터를 이용하여 상기 화자의 발화에 대한 음향학적 통계정보가 포함된 통계변수를 생성하는 통계변수생성부; 및상기 생성된 통계변수를 상기 단말에 누적시키는 통계변수전송부를 포함하되,상기 음성인식부는,상기 단말이 상기 누적된 통계변수를 이용하여 상기 화자의 발화에 대한 변환매개변수를 생성하면, 상기 생성된 변환매개변수를 상기 단말로부터 수신하여 상기 화자로부터 발화된 음성데이터를 인식하는 것인 화자적응 음성인식 시스템의 서버
14 14
제13항에 있어서,상기 음성데이터를 잡음처리, 스펙트럼 정규화 및 끝점검출처리 중 적어도 하나의 방법으로 전처리하고, 상기 전처리된 화자의 음성데이터로부터 특징벡터를 추출하는 전처리부; 및상기 추출된 특징벡터를 상기 변환매개변수를 이용하여 상기 화자의 발화 특징에 맞게 변환하는 특징벡터변환부를 더 포함하는 화자적응 음성인식 시스템의 서버
15 15
제13항에 있어서, 상기 음성인식부는상기 단말로부터 상기 음성데이터를 수신할 때, 상기 변환매개변수를 상기 단말로부터 수신하는 것인 화자적응 음성인식 시스템의 서버
16 16
제13항에 있어서, 상기 음성인식부는상기 단말로부터 수신한 상기 변환매개변수가 없으면, 상기 특징벡터를 이용하여 상기 음성데이터를 음성인식하고, 상기 음성인식한 결과데이터를 상기 단말로 송신하는 것인 화자적응 음성인식 시스템의 서버
17 17
제13항에 있어서,상기 결과데이터에 포함된 단어열의 신뢰도를 평가하고, 상기 평가된 신뢰도에 따라 상기 단어열에 가중치를 부여하여 상기 통계변수생성부로 전달하는 신뢰도평가부를 더 포함하는 화자적응 음성인식 시스템의 서버
18 18
제17항에 있어서, 상기 신뢰도평가부는상기 평가된 신뢰도가 기설정된 기준 이상이면 해당 단어열에 가중치를 할당하고, 상기 평가된 신뢰도가 기설정된 기준 이하이면 해당 단어열을 삭제하는 것인 화자적응 음성인식 시스템의 서버
19 19
제13항에 있어서, 상기 통계변수생성부는상기 결과데이터에 포함된 단어열에 대응하는 음향모델 및 언어모델 중 적어도 하나의 방법을 이용하여 상기 통계변수를 생성하는 것인 화자적응 음성인식 시스템의 서버
20 20
제13항에 있어서, 상기 통계변수생성부는상기 결과데이터에 포함된 단어열을 이용하여 상기 단어열의 스테이트 점유확률을 계산하고, 상기 계산된 스테이트 점유확률과 기저장된 음향모델의 통계치를 이용하여 통계변수를 측정하는 것인 화자적응 음성인식 시스템의 서버
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US09530403 US 미국 FAMILY
2 US20150371634 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2015371634 US 미국 DOCDBFAMILY
2 US9530403 US 미국 DOCDBFAMILY
국가 R&D 정보가 없습니다.