맞춤기술찾기

이전대상기술

발화검증을 위한 임계치값 자동 갱신을 이용한 음성인식장치 및 방법

  • 기술번호 : KST2015081695
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 음성인식 시스템에 있어서 발화검증의 판단기준인 신뢰도 값이 환경요인(채널특성, 화자특성 등)과의 상관 관계가 존재하여 영향을 받기 때문에 상수값으로 설정된 임계치값을 자동으로 갱신함으로써 고신뢰도의 발화검증을 제공하기 위한 것으로, 입력되는 음성의 잡음 처리 및 음성구간 검출을 수행하여 음성데이터를 출력하는 전처리부와, 상기 음성데이터를 기 학습된 문맥종속 음소모델에 적용하여 음성인식을 수행하고 음성정보를 출력하는 음성인식부와, 상기 음성정보를 이용하여 환경요인 파라미터 및 스코어를 추출하는 환경요인 파라미터 계산부와, 학습된 문맥독립 반음소 모델, 음소 지속 모델(phone duration model), 기타 정보(우도, Nbest 정보 등)를 적용하여 단어별 신뢰도 측정을 위한 입력 파라미터를 추출하는 입력 파라미터 추출부와, 상기 입력 파라미터를 기반으로 신뢰도 측정값을 계산하는 신뢰도 측정부와, 상기 스코어의 평균값을 통해 산출된 환경요인 값을 적용하여 새로운 임계치값을 계산하고 갱신하는 임계치값 결정부와, 상기 갱신된 임계치값을 사용하여 인식결과의 수락 및 거절을 판단하는 판단부를 포함하는데 있다.음성인식, 발화검증, 임계치
Int. CL G10L 15/28 (2013.01) G10L 15/01 (2013.01)
CPC G10L 15/01(2013.01)G10L 15/01(2013.01)G10L 15/01(2013.01)
출원번호/일자 1020060077948 (2006.08.18)
출원인 한국전자통신연구원
등록번호/일자 10-0819848-0000 (2008.03.31)
공개번호/일자 10-2007-0061266 (2007.06.13) 문서열기
공고번호/일자 (20080408) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020050119940   |   2005.12.08
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2006.08.18)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 강점자 대한민국 대전 서구
2 전형배 대한민국 대전 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 신영무 대한민국 서울특별시 강남구 영동대로 ***(대치동) KT&G타워 *층(에스앤엘파트너스)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 (주)유미테크 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2006.08.18 수리 (Accepted) 1-1-2006-0586674-39
2 선행기술조사의뢰서
Request for Prior Art Search
2007.05.10 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2007.06.12 수리 (Accepted) 9-1-2007-0035625-22
4 의견제출통지서
Notification of reason for refusal
2007.09.21 발송처리완료 (Completion of Transmission) 9-5-2007-0517009-83
5 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2007.11.20 수리 (Accepted) 1-1-2007-0834686-17
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2007.12.21 수리 (Accepted) 1-1-2007-0921134-56
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2007.12.21 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2007-0921088-43
8 등록결정서
Decision to grant
2008.03.27 발송처리완료 (Completion of Transmission) 9-5-2008-0170081-01
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
입력되는 음성의 잡음 처리 및 음성구간 검출을 수행하여 음성데이터를 출력하는 전처리부와, 상기 음성데이터를 기 학습된 문맥종속 음소모델에 적용하여 음성인식을 수행하고 음성정보를 출력하는 음성인식부와,상기 음성정보를 이용하여 환경요인 파라미터 및 스코어를 추출하는 환경요인 파라미터 추출부와, 기 학습된 문맥독립 반음소 모델, 음소 지속 모델(phone duration model), 우도, Nbest 정보 중 적어도 하나 이상에 적용하여 단어별 신뢰도 측정을 위한 입력 파라미터를 추출하는 입력 파라미터 추출부와,상기 추출되는 입력 파라미터가 여러개인 경우는 기 정의된 분류기의 훈련 모델을 사용하여 신뢰도 측정값을 계산하고, 단일 입력 파라미터인 경우는 추출된 신뢰도 측정값을 그대로 사용하는 신뢰도 측정부와,상기 스코어의 평균값을 통해 산출된 환경요인 값을 적용하여 새로운 임계치값을 계산하고 갱신하는 임계치값 결정부와, 상기 갱신된 임계치값을 사용하여 인식결과의 수락 및 거절을 판단하는 판단부를 포함하고, 상기 환경요인 값은 채널특성인 신호대 잡음 비(SNR: Signal to Noise Ratio)와, 화자특성인 음성 에너지 및 F0 포만트 크기 중 적어도 하나 이상이며,상기 문맥독립 반음소 모델은 모든 믹스처를 사용한 반모델(Allmixture antimodel), 적응 반모델(adapted antimodel), 변별학습을 수행하는 반모델(discriminative antimodel), VQ(Vector Quantization)기반 반모델(VQ based antimodel) 중 적어도 하나 이상인 것을 특징으로 하는 음성인식 장치
2 2
삭제
3 3
삭제
4 4
(a) 입력된 음성의 잡음 처리 및 음성구간을 검출하는 단계와,(b) 상기 검출된 음성데이터를 기 설정되어 학습된 문맥종속 음소모델에 적용하여 비터비 탐색을 통해 음성인식을 수행하는 단계와,(c) 상기 인식된 음성정보를 기 설정되어 학습된 문맥독립 반음소 모델, 음소 지속 모델(phone duration model), 우도, Nbest 정보 중 적어도 하나 이상에 적용하여 입력 파라미터값과 환경 요인 파라미터를 산출하는 단계와,(d) 상기 산출된 입력 파라미터값을 기반으로 신뢰도 측정값을 계산하고, 정규화하는 단계와,(e) 상기 산출된 환경요인 파라미터에 기반하여 계산된 환경요인 값을 적용하여 새로운 임계치값을 계산하고 갱신하는 단계와,(f) 상기 갱신된 임계치값을 상기 산출된 신뢰도 측정값과 비교하여 음성 인식결과에 따른 수락 또는 거절을 결정하는 단계를 포함하고,상기 환경요인 값은 채널특성인 신호대 잡음 비(SNR: Signal to Noise Ratio)와, 화자특성인 음성 에너지 및 F0 포만트 크기 중 적어도 하나 이상이며,상기 문맥독립 반음소 모델은 모든 믹스처를 사용한 반모델(Allmixture antimodel), 적응 반모델(adapted antimodel), 변별학습을 수행하는 반모델(discriminative antimodel), VQ(Vector Quantization)기반 반모델(VQ based antimodel) 중 적어도 하나 이상인 것을 특징으로 하는 음성인식 방법
5 5
삭제
6 6
제 4 항에 있어서, 상기 (d) 단계는 산출된 입력 파라미터가 여러개의 입력 파라미터를 기반하는 경우, 분류기에 필요한 분류기 모델 생성을 위하여 훈련하는 단계와, 상기 훈련 단계에서 산출된 훈련모델을 이용하여 훈련 데이터에 대한 신뢰도 측정값, 평균 및 표준편차를 계산하는 단계와, 상기 계산된 신뢰도 측정값을 정규화하는 단계를 포함하는 것을 특징으로 하는 음성인식 방법
7 7
제 4 항에 있어서, 상기 (d) 단계는 산출된 입력 파라미터가 단일의 입력 파라미터를 기반으로 하는 경우, 훈련 데이터로부터 직접 신뢰도 측정값, 평균 및 표준편차를 계산하여 정규화하는 단계를 포함하는 것을 특징으로 하는 음성인식 방법
8 8
제 4 항에 있어서, 상기 (e) 단계에서 사용할 사전 파라미터 데이터를 구하는 방법은 산출된 입력 파라미터값을 기반으로 분류기 모델을 사용하여 훈련 데이터를 결정하는 단계와, 상기 결정된 훈련 데이터를 사용하여 환경요인 파라미터 값과 입력 데이터로 사용할 파라미터를 산출하는 단계와, 기 정의된 분류기 모델을 이용하여 상기 산출된 입력 파라미터의 신뢰도 측정값, 평균 및 표준편차를 계산하는 단계와, 상기 계산된 신뢰도 측정값을 정규화하는 단계와,상기 계산된 정규화된 신뢰도 측정값과 신호대 잡음비와의 상관계수, 정규화된 신뢰도 측정값과 음성에너지와의 상관계수, 정규회된 F0포만트 크기와의 상관계수를 계산하는 단계를 포함하는 음성인식 방법
9 9
제 4 항에 있어서, 상기 (e) 단계는 (e1) 훈련 데이터를 사용하여 산출된 환경요인 파라미터를 기반하여 환경요인 특성의 초기값을 계산하고 설정하는 단계와,(e2) 실시간으로 현재 환경요인을 기반한 환경요인 특성에 대한 각각의 현재 스코어를 계산하고 정규화하는 단계와,(e3) 상기 초기화된 환경요인 파라미터 각각의 상관계수를 상기 실시간으로 구해진 환경요인 파라미터 각각의 현재 스코어와 서로 곱하여 새로운 스코어를 산출하는 단계와, (e4) 상기 산출된 새로운 스코어를 모두 합하고 전체 평균값을 계산하여 환경요인 값을 산출하는 단계와, (e5) 상기 산출된 환경요인 값에 특정 적응계수를 곱하고 기존의 임계치값에 더하거나 빼서 새로운 임계치값을 계산하는 단계와,(e6) 상기 계산된 새로운 임계치값으로 기존의 임계치값을 갱신하는 단계를 포함하는 음성인식 방법
10 10
제 9 항에 있어서, 상기 (e1)의 환경요인 특성의 초기값은 신호대 잡음비와의 초기값, 음성 에너지와의 초기값 및 FO 포만트 크기에 대한 초기값 중 적어도 하나 이상인 것을 특징으로 하는 음성인식 방법
11 11
제 10 항에 있어서,상기 초기값은 신뢰도 측정값과의 상관계수, 평균, 표준편차 값 중 적어도 하나 이상인 것을 특징으로 하는 음성인식 방법
12 12
제 9 항에 있어서, 상기 (e3) 단계는 상기 정규화하여 계산된 신호대 잡음비의 현재 스코어와 상기 신호대 잡음비 상관계수를 곱하여 제 1 스코어를 산출하는 단계와,상기 정규화하여 계산된 음성 에너지의 현재 스코어와 상기 음성 에너지 상관계수를 곱하여 제 2 스코어를 산출하는 단계와,상기 정규화하여 계산된 FO 포만트 크기의 현재 스코어와 상기 FO 포만트 크기 상관계수를 곱하여 제 3 스코어를 산출하는 단계를 포함하는 것을 특징으로 하는 음성인식 방법
13 13
제 4 항에 있어서, 상기 (f) 단계는 상기 비교결과 계산된 신뢰도 측정값보다 임계치값이 크면 인식결과를 수락하는 단계와, 상기 비교결과 계산된 신뢰도 측정값이 임계치값보다 작으면 인식 결과를 거절하는 단계와,상기 인식 결과가 수락되면 음성인식 시스템을 동작시키고, 상기 인식 결과가 거절되면 사용자에게 메시지 또는 음성을 통해 음성인식을 위한 재발성을 유도하는 단계를 포함하는 음성인식 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.