맞춤기술찾기

이전대상기술

부대역의 불확실성 정보를 이용한 잡음환경에서의 음성인식 방법 및 장치

  • 기술번호 : KST2015095744
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법 및 장치에 관한 것으로, 잡음 신호 모델링을 통해 얻어진 추정 음성에서 각 부대역별로 추정 음성의 불확실성 정보를 추출하여 이를 각 부대역에 대한 가중치로 이용하여 잡음에 강한 음성 특징을 추출하고, 상기 각 부대역 가중치에 따라 음향 모델을 변환하여 변환된 음향 모델과 상기 추출된 음성 특징을 기반으로 음성 인식을 수행함으로써, 시간에 따른 잡음 모델링이 정확하지 않더라도 부대역의 불확실성 정보에 따라 불확실성이 높은 부대역의 영향을 줄여 잡음환경에서도 음성 인식 성능을 향상시킬 수 있는 것을 특징으로 한다. 음성인식, 잡음처리, 불확실성(Uncertainty), 부대역(sub-band), 특징 추출
Int. CL G10L 15/02 (2006.01) G10L 15/20 (2006.01) G10L 15/14 (2006.01)
CPC
출원번호/일자 1020070095401 (2007.09.19)
출원인 한국전자통신연구원
등록번호/일자 10-0919223-0000 (2009.09.21)
공개번호/일자 10-2009-0030077 (2009.03.24) 문서열기
공고번호/일자 (20090928) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2007.09.19)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 정호영 대한민국 대전 서구
2 강병옥 대한민국 대전 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 신영무 대한민국 서울특별시 강남구 영동대로 ***(대치동) KT&G타워 *층(에스앤엘파트너스)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2007.09.19 수리 (Accepted) 1-1-2007-0679784-46
2 선행기술조사의뢰서
Request for Prior Art Search
2008.06.11 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2008.07.15 수리 (Accepted) 9-1-2008-0045169-27
4 의견제출통지서
Notification of reason for refusal
2009.03.30 발송처리완료 (Completion of Transmission) 9-5-2009-0134990-89
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2009.05.29 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2009-0324413-77
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2009.05.29 수리 (Accepted) 1-1-2009-0324404-66
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
8 등록결정서
Decision to grant
2009.09.18 발송처리완료 (Completion of Transmission) 9-5-2009-0387882-12
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
입력된 음성 신호로부터 잡음이 제거된 음성을 추정하여 상기 추정 음성에서 각 부대역별로 추정 음성의 불확실성 정보를 추출하고, 상기 추출된 불확실성 정보를 부대역 가중치로 이용하여 음성 특징을 추출하는 특징 추출 단계; 및 상기 부대역 가중치에 따라 음향 모델을 변환하여 상기 변환된 음향 모델과 상기 추출된 음성 특징을 기반으로 음성 인식을 수행하는 음성 인식 단계를 포함하는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
2 2
제 1항에 있어서, 상기 특징 추출 단계는, 상기 입력된 음성 신호의 각 음성 프레임에 대하여 로그 필터뱅크 에너지를 검출하는 단계; 상기 각 음성 프레임에 대한 로그 필터뱅크 에너지를 이용하여 잡음 모델을 생성하고, IMM(Interactive Multiple Model)을 기반으로 상기 생성된 잡음 모델을 갱신하는 단계; 상기 갱신된 잡음 모델을 이용하여 MMSE(Minimum Mean Squared error) 방식으로 잡음이 제거된 음성을 추정하고, 상기 추정 음성의 로그 필터뱅크 에너지를 이용하여 부대역별 불확실성 정보를 추출하는 단계; 상기 추출된 부대역별 불확실성 정보를 이용하여 부대역별 가중치를 계산하고, 상기 부대역별 가중치를 이용하여 최종 부대역 음성 특징을 추출하는 단계를 더 포함하는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
3 3
제 2항에 있어서, 상기 각 음성 프레임에 대한 로그 필터뱅크 에너지를 이용하여 잡음 모델을 생성하는 단계에서, 상기 각 음성 프레임에 대한 로그 필터뱅크 에너지(y)는, (여기에서, x, y, n은 각각 원음성, 잡음 음성, 잡음에서 추출된 로그 스펙트럼을 나타내며, A, B, C는 선형화 계수를 나타냄) 인 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
4 4
제 2항에 있어서, 상기 추정 음성의 로그 필터뱅크 에너지를 이용하여 부대역별 불확실성 정보를 추출하는 단계에서, 상기 추정 음성의 로그 필터뱅크 에너지(x)는, (여기에서, x, y, n은 각각 원음성, 잡음 음성, 잡음에서 추출된 로그스펙트럼을 나타내고, M은 음성모델인 GMM에서의 mixture 개수를 나타내며, 는 각 mixture마다 구한 선형화 계수 및 추정된 잡음성분에 대한 함수를 나타냄) 인 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
5 5
제 2항에 있어서, 상기 추정 음성의 로그 필터뱅크 에너지를 이용하여 부대역별 불확실성 정보를 추출하는 단계에서, 상기 부대역별 불확실성 정보(U)는, (여기에서, x, y, n은 각각 원음성, 잡음 음성, 잡음에서 추출된 로그스펙트럼을 나타내고, M은 음성모델인 GMM에서의 mixture 개수를 나타내며, 는 각 mixture마다 구한 선형화 계수 및 추정된 잡음성분에 대한 함수를 나타냄) 에 의해 추출되는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
6 6
제 2항에 있어서, 상기 추출된 부대역별 불확실성 정보를 이용하여 부대역별 가중치를 계산하는 단계에서, 상기 부대역별 가중치(nws)는, (여기에서, nws는 s번째 부대역의 최종 가중치를 의미하고, bs와 es 는 s번째 부대역이 포함하는 로그 필터뱅크 에너지에서의 시작과 끝을 나타냄) 에 의해 계산되는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
7 7
제 2항에 있어서, 상기 부대역별 가중치를 이용하여 최종 부대역 음성 특징을 추출하는 단계에서, 상기 최종 부대역 음성 특징(SBMFCC)은, (여기에서, MFCCs는 부대역 s에 해당하는 필터뱅크 에너지(Ek)에 부대역 가중치(nws)를 곱해서 구해진 부대역 음성 특징 MFCC를 나타내고, SBMFCC는 상기 부대역마다 구해진 부대역 음성 특징 MFCCs를 더한 최종 부대역 음성 특징 MFCC를 나타냄) 에 의해 추출되는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
8 8
제 1항에 있어서, 상기 음성 인식 단계는, 상기 음향 모델의 가우시안 평균값을 로그 필터뱅크 에너지 형태로 바꾼 후 상기 부대역 가중치를 이용하여 상기 음향 모델을 변환하는 단계; 상기 변환된 음향 모델과 상기 추출된 음성 특징을 기반으로 음성 인식을 수행하는 단계를 더 포함하는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
9 9
입력된 음성 신호로부터 잡음이 제거된 음성을 추정하여 상기 추정 음성에서 각 부대역별로 추정 음성의 불확실성 정보를 추출하고, 상기 추출된 불확실성 정보를 부대역 가중치로 이용하여 음성 특징을 추출하는 특징 추출 모듈; 및 상기 부대역 가중치에 따라 음향 모델을 변환하여 상기 변환된 음향 모델과 상기 추출된 음성 특징을 기반으로 음성 인식을 수행하는 음성 인식 모듈을 포함하는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 장치
10 10
제 9항에 있어서, 상기 특징 추출 모듈은, 상기 입력된 음성 신호를 분리하여 음성 프레임을 생성하는 프레임 생성부; 상기 각 음성 프레임에 대한 로그 필터뱅크 에너지를 검출하는 로그 필터뱅크 에너지 검출부; 상기 각 음성 프레임에 대한 로그 필터뱅크 에너지를 이용하여 잡음 모델을 생성하는 잡음 모델링부; IMM(Interactive Multiple Model)을 기반으로 상기 생성된 잡음 모델을 갱신하는 IMM 기반 잡음 모델 갱신부; 상기 갱신된 잡음 모델을 이용하여 MMSE(Minimum Mean Squared error) 방식으로 음성을 추정하는 MMSE 추정부; 상기 추정 음성의 로그 필터뱅크 에너지를 이용하여 부대역별 불확실성 정보를 추출하는 불확실성 추출부; 상기 추출된 부대역별 불확실성 정보를 이용하여 부대역별 가중치를 계산하는 부대역 가중치 계산부; 및 상기 부대역별 가중치를 이용하여 최종 부대역 음성 특징을 추출하는 부대역 특징 추출부를 더 포함하는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 장치
11 11
제 9항에 있어서, 상기 음성 인식 모듈은, 상기 음향 모델의 가우시안 평균값을 로그 필터뱅크 에너지 형태로 바꾸어 상기 부대역 가중치를 이용하여 상기 음향 모델을 변환하는 모델 변환부; 및 상기 변환된 음향 모델과 상기 추출된 음성 특징을 기반으로 음성 인식을 수행하는 음성 인식부를 더 포함하는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 장치
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US20090076813 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2009076813 US 미국 DOCDBFAMILY
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 정보통신부 한국전자통신연구원 IT신성장동력핵심기술개발사업 신성장동력산업용 대용량 대화형 분산 처리 음성인터페이스기술개발