맞춤기술찾기

이전대상기술

은닉 마르코프 모델에 기초하는 음향 모델 구축 장치 및 그방법

  • 기술번호 : KST2015117908
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은, 음성 인식 시스템에 이용되는, 은닉 마르코프 모델에 기초하는 음성 모델을 구축하는 장치에 있어서, 미리 설정된 알고리즘을 기초로, 복수의 훈련 음성의 각각에 대하여 당해 음성을 다른 음성으로부터 식별할 수 있도록 하는 음성의 특징을 추출하는 음성 특징 추출부; 상기 음성 특징 추출부에 의해 추출된 음성의 특징을 기초로, 최대 우도 기법을 통해 상기 음향 모델의 파라미터의 초기값을 결정하는 음향 모델 초기 설정부; 상기 훈련 음성의 각각에 대하여, 상기 음향 모델을 이용하여 상기 훈련 음성을 인식시킨 경우 상기 음향 모델에 속하는 모델 중 당해 음성에 대응되는 것으로 판단되는 모델인 인식 모델을 산출하는 인식 모델 산출부; 상기 음향 모델의 파라미터를 기초로 상기 훈련 음성의 상기 정답 모델에 대한 로그 우도를 연산하는 정답 모델 로그 우도 연산부; 상기 음향 모델의 파라미터를 기초로 상기 훈련 음성의 상기 인식 모델에 대한 로그 우도를 연산하는 인식 모델 로그 우도 연산부; 및 상기 훈련 음성의 상기 정답 모델에 대한 로그 우도가 최대가 되고, 상기 음향 모델에 속하는 모델 중 상기 훈련 음성에 대한 상기 정답 모델이 아닌 모델에 대한 로그 우도는 최소가 되는 동시에, 상기 훈련 음성의 상기 정답 모델에 대한 로그 우도로부터 상기 인식 모델에 대한 로그 우도를 감산한 값이 미리 설정된 값 이상이 되도록 상기 음향 모델의 파라미터를 연산하는 음향 모델 설정부를 포함하는 음향 모델 구축 장치를 제공한다. 음성 인식, 은닉 마르코프 모델, 최대 우도, 최대 상호 정보, 오인식 제한.
Int. CL G10L 15/06 (2013.01) G10L 15/02 (2013.01) G10L 15/14 (2013.01)
CPC G10L 15/144(2013.01) G10L 15/144(2013.01) G10L 15/144(2013.01) G10L 15/144(2013.01)
출원번호/일자 1020070083282 (2007.08.20)
출원인 한국과학기술원
등록번호/일자 10-0933774-0000 (2009.12.16)
공개번호/일자 10-2009-0019104 (2009.02.25) 문서열기
공고번호/일자 (20091224) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2007.08.20)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 유창동 대한민국 대전 유성구
2 윤성락 대한민국 대전 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 오병석 대한민국 경기도 성남시 분당구 판교역로***번길 **-*, ***-C**호 (삼평동, 골드타워)(지현특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2007.08.20 수리 (Accepted) 1-1-2007-0598393-75
2 선행기술조사의뢰서
Request for Prior Art Search
2008.04.08 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2008.05.15 수리 (Accepted) 9-1-2008-0031859-40
4 의견제출통지서
Notification of reason for refusal
2009.03.11 발송처리완료 (Completion of Transmission) 9-5-2009-0107484-65
5 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2009.05.11 수리 (Accepted) 1-1-2009-0281323-13
6 보정요구서
Request for Amendment
2009.05.21 발송처리완료 (Completion of Transmission) 1-5-2009-0033898-31
7 [출원서등 보정]보정서(납부자번호)
[Amendment to Patent Application, etc.] Amendment(Payer number)
2009.05.22 수리 (Accepted) 1-1-2009-0305636-51
8 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2009.05.28 수리 (Accepted) 1-1-2009-0322652-25
9 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2009.05.28 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2009-0322625-03
10 등록결정서
Decision to grant
2009.09.18 발송처리완료 (Completion of Transmission) 9-5-2009-0387881-77
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.02.01 수리 (Accepted) 4-1-2013-5019983-17
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.12.24 수리 (Accepted) 4-1-2014-5157968-69
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.12.24 수리 (Accepted) 4-1-2014-5157993-01
14 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.12.24 수리 (Accepted) 4-1-2014-5158129-58
15 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.04.24 수리 (Accepted) 4-1-2019-5081392-49
16 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.05.15 수리 (Accepted) 4-1-2020-5108396-12
17 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.12 수리 (Accepted) 4-1-2020-5131486-63
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
음성 인식 시스템에 이용되는, 은닉 마르코프 모델에 기초하는 음향 모델을 구축하는 장치에 있어서, 미리 설정된 알고리즘을 기초로, 복수의 훈련 음성의 각각에 대하여 당해 음성을 다른 음성으로부터 식별할 수 있도록 하는 음성의 특징을 추출하는 음성 특징 추출부; 상기 음성 특징 추출부에 의해 추출된 음성의 특징을 기초로, 상기 음향 모델에 속하는 모델 중 상기 훈련 음성의 각각에 대응하여 미리 설정된 정답 모델에 대한 당해 훈련 음성의 로그 우도(log likelihood)가 최대가 되도록 상기 음향 모델의 파라미터의 초기값을 결정하는 음향 모델 초기 설정부; 상기 훈련 음성의 각각에 대하여, 상기 음향 모델을 이용하여 상기 훈련 음성을 인식시킨 경우 상기 음향 모델에 속하는 모델 중 당해 음성에 대응되는 것으로 판단되는 모델인 인식 모델을 산출하는 인식 모델 산출부; 상기 음향 모델의 파라미터를 기초로 상기 훈련 음성의 상기 정답 모델에 대한 로그 우도를 연산하는 정답 모델 로그 우도 연산부; 상기 음향 모델의 파라미터를 기초로 상기 훈련 음성의 상기 인식 모델에 대한 로그 우도를 연산하는 인식 모델 로그 우도 연산부; 상기 음향 모델의 파라미터를 기초로, 아래의 수학식 (여기서, P는 우도, Ou는 상기 음성 특징 추출부에 의하여 추출된 훈련 음성의 특징, u는 훈련 음성 인덱스, θ는 상기 음향 모델의 파라미터, wu는 Ou에 대하여 미리 설정된 정답 모델, vu는 인식 모델 중 가장 높은 확률을 갖는 인식 모델, logPθ(Ou|wu)는 정답 모델의 로그 우도, logPθ(Ou|vu)는 vu의 로그 우도, εu는 소정의 양수값, αu는 라그랑지 곱수, C는 조정 파라미터임)을 최대화하는 라그랑지 곱수를 연산하는 라그랑지 곱수 연산부; 상기 라그랑지 곱수 연산부에 의해 연산된 상기 라그랑지 곱수를 기초로 상기 수학식을 최소화하는 상기 음향 모델의 파라미터를 연산하는 파라미터 연산부; 및 상기 수학식이 상기 라그랑지 곱수에 의해 최대화되는 동시에 상기 파라미터에 의해 최소화되도록, 상기 라그랑지 곱수 연산부에 의한 상기 라그랑지 곱수의 연산과 상기 파라미터 연산부에 의한 상기 파라미터의 연산이 번갈아 실시되도록 제어하는 연산 제어부를 포함하는 음향 모델 구축 장치
2 2
제1항에 있어서, 상기 라그랑지 곱수 연산부는, 그레디언트 디슨트 방법(Gradient decent method)를 기초로 상기 라그랑지 곱수를 연산하는 음향 모델 구축 장치
3 3
제1항 또는 제2항에 있어서, 상기 파라미터 연산부는, 바움 웰치(Baum-Welch) 알고리즘을 기초로 상기 음향 모델의 파라미터를 연산하는 음향 모델 구축 장치
4 4
음성 인식 시스템에 이용되는, 은닉 마르코프 모델에 기초하는 음향 모델을 구축하는 방법에 있어서, 미리 설정된 알고리즘을 기초로, 복수의 훈련 음성의 각각에 대하여 당해 음성을 다른 음성으로부터 식별할 수 있도록 하는 음성의 특징을 추출하는 음성 특징 추출 단계; 상기 음성 특징 추출 단계에서 추출된 음성의 특징을 기초로, 상기 음향 모델에 속하는 모델 중 상기 훈련 음성의 각각에 대응하여 미리 설정된 정답 모델에 대한 당해 훈련 음성의 로그 우도(log likelihood)가 최대가 되도록 상기 음향 모델의 파라미터의 초기값을 결정하는 음향 모델 초기 설정 단계; 상기 훈련 음성의 각각에 대하여, 상기 음향 모델을 이용하여 상기 훈련 음성을 인식시킨 경우 상기 음향 모델에 속하는 모델 중 당해 음성에 대응되는 것으로 판단되는 모델인 인식 모델을 산출하는 인식 모델 산출 단계; 상기 음향 모델의 파라미터를 기초로, 상기 훈련 음성의 상기 정답 모델에 대한 로그 우도 및 상기 훈련 음성의 상기 인식 모델에 대한 로그 우도를 연산하는 로그 우도 연산 단계; 상기 음향 모델의 파라미터를 기초로 아래의 수학식 (여기서, P는 우도, Ou는 상기 음성 특징 추출부에 의하여 추출된 훈련 음성의 특징, u는 훈련 음성 인덱스, θ는 상기 음향 모델의 파라미터, wu는 Ou에 대하여 미리 설정된 정답 모델, vu는 인식 모델 중 가장 높은 확률을 갖는 인식 모델, logPθ(Ou|wu)는 정답 모델의 로그 우도, logPθ(Ou|vu)는 vu의 로그 우도, εu는 소정의 양수값, αu는 라그랑지 곱수, C는 조정 파라미터임)을 최대화하는 라그랑지 곱수를 연산하는 라그랑지 곱수 연산 단계; 및 상기 라그랑지 곱수 연산 단계에서 연산된 상기 라그랑지 곱수를 기초로 상기 수학식을 최소화하는 상기 음향 모델의 파라미터를 연산하는 파라미터 연산 단계를 포함하되, 상기 라그랑지 곱수 연산 단계에서의 상기 라그랑지 곱수의 연산과 상기 파라미터 연산 단계에서의 상기 파라미터의 연산은, 상기 수학식이 상기 라그랑지 곱수에 의해 최대화되는 동시에 상기 파라미터에 의해 최소화되도록 번갈아 실시되는 음향 모델 구축 방법
5 5
제4항에 있어서, 상기 라그랑지 곱수 연산 단계에서, 상기 라그랑지 곱수는 그레디언트 디슨트 방법(Gradient decent method)를 기초로 연산되는 음향 모델 구축 방법
6 6
제4항 또는 제5항에 있어서, 상기 파라미터 연산 단계에서, 상기 음향 모델의 파라미터는 바움 웰치(Baum-Welch) 알고리즘을 기초로 연산되는 음향 모델 구축 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.