기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

부대역의 불확실성 정보를 이용한 잡음환경에서의 음성인식 방법 및 장치

기술번호 : KST2015095744
담당센터 : 대전기술혁신센터
전화번호 : 042-610-2279

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명은 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법 및 장치에 관한 것으로, 잡음 신호 모델링을 통해 얻어진 추정 음성에서 각 부대역별로 추정 음성의 불확실성 정보를 추출하여 이를 각 부대역에 대한 가중치로 이용하여 잡음에 강한 음성 특징을 추출하고, 상기 각 부대역 가중치에 따라 음향 모델을 변환하여 변환된 음향 모델과 상기 추출된 음성 특징을 기반으로 음성 인식을 수행함으로써, 시간에 따른 잡음 모델링이 정확하지 않더라도 부대역의 불확실성 정보에 따라 불확실성이 높은 부대역의 영향을 줄여 잡음환경에서도 음성 인식 성능을 향상시킬 수 있는 것을 특징으로 한다. 음성인식, 잡음처리, 불확실성(Uncertainty), 부대역(sub-band), 특징 추출
Int. CL	G10L 15/02 (2006.01) G10L 15/20 (2006.01) G10L 15/14 (2006.01)
CPC
출원번호/일자	1020070095401 (2007.09.19)
출원인	한국전자통신연구원
등록번호/일자	10-0919223-0000 (2009.09.21)
공개번호/일자	10-2009-0030077 (2009.03.24) 문서열기
공고번호/일자	(20090928) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	소멸
심사진행상태	수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2007.09.19)
심사청구항수	11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	한국전자통신연구원	대한민국	대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	정호영	대한민국	대전 서구
2	강병옥	대한민국	대전 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	신영무	대한민국	서울특별시 강남구 영동대로 **(대치동) KT&G타워 층(에스앤엘파트너스)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
1	한국전자통신연구원	대한민국	대전광역시 유성구

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2007.09.19	수리 (Accepted)	1-1-2007-0679784-46
2	선행기술조사의뢰서 Request for Prior Art Search	2008.06.11	수리 (Accepted)	9-1-9999-9999999-89
3	선행기술조사보고서 Report of Prior Art Search	2008.07.15	수리 (Accepted)	9-1-2008-0045169-27
4	의견제출통지서 Notification of reason for refusal	2009.03.30	발송처리완료 (Completion of Transmission)	9-5-2009-0134990-89
5	[명세서등 보정]보정서 [Amendment to Description, etc.] Amendment	2009.05.29	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2009-0324413-77
6	[거절이유 등 통지에 따른 의견]의견(답변, 소명)서 [Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)	2009.05.29	수리 (Accepted)	1-1-2009-0324404-66
7	출원인정보변경(경정)신고서 Notification of change of applicant's information	2009.08.04	수리 (Accepted)	4-1-2009-5150899-36
8	등록결정서 Decision to grant	2009.09.18	발송처리완료 (Completion of Transmission)	9-5-2009-0387882-12
9	출원인정보변경(경정)신고서 Notification of change of applicant's information	2015.02.02	수리 (Accepted)	4-1-2015-0006137-44

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 입력된 음성 신호로부터 잡음이 제거된 음성을 추정하여 상기 추정 음성에서 각 부대역별로 추정 음성의 불확실성 정보를 추출하고, 상기 추출된 불확실성 정보를 부대역 가중치로 이용하여 음성 특징을 추출하는 특징 추출 단계; 및 상기 부대역 가중치에 따라 음향 모델을 변환하여 상기 변환된 음향 모델과 상기 추출된 음성 특징을 기반으로 음성 인식을 수행하는 음성 인식 단계를 포함하는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
2	2 제 1항에 있어서, 상기 특징 추출 단계는, 상기 입력된 음성 신호의 각 음성 프레임에 대하여 로그 필터뱅크 에너지를 검출하는 단계; 상기 각 음성 프레임에 대한 로그 필터뱅크 에너지를 이용하여 잡음 모델을 생성하고, IMM(Interactive Multiple Model)을 기반으로 상기 생성된 잡음 모델을 갱신하는 단계; 상기 갱신된 잡음 모델을 이용하여 MMSE(Minimum Mean Squared error) 방식으로 잡음이 제거된 음성을 추정하고, 상기 추정 음성의 로그 필터뱅크 에너지를 이용하여 부대역별 불확실성 정보를 추출하는 단계; 상기 추출된 부대역별 불확실성 정보를 이용하여 부대역별 가중치를 계산하고, 상기 부대역별 가중치를 이용하여 최종 부대역 음성 특징을 추출하는 단계를 더 포함하는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
3	3 제 2항에 있어서, 상기 각 음성 프레임에 대한 로그 필터뱅크 에너지를 이용하여 잡음 모델을 생성하는 단계에서, 상기 각 음성 프레임에 대한 로그 필터뱅크 에너지(y)는, (여기에서, x, y, n은 각각 원음성, 잡음 음성, 잡음에서 추출된 로그 스펙트럼을 나타내며, A, B, C는 선형화 계수를 나타냄) 인 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
4	4 제 2항에 있어서, 상기 추정 음성의 로그 필터뱅크 에너지를 이용하여 부대역별 불확실성 정보를 추출하는 단계에서, 상기 추정 음성의 로그 필터뱅크 에너지(x)는, (여기에서, x, y, n은 각각 원음성, 잡음 음성, 잡음에서 추출된 로그스펙트럼을 나타내고, M은 음성모델인 GMM에서의 mixture 개수를 나타내며, 는 각 mixture마다 구한 선형화 계수 및 추정된 잡음성분에 대한 함수를 나타냄) 인 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
5	5 제 2항에 있어서, 상기 추정 음성의 로그 필터뱅크 에너지를 이용하여 부대역별 불확실성 정보를 추출하는 단계에서, 상기 부대역별 불확실성 정보(U)는, (여기에서, x, y, n은 각각 원음성, 잡음 음성, 잡음에서 추출된 로그스펙트럼을 나타내고, M은 음성모델인 GMM에서의 mixture 개수를 나타내며, 는 각 mixture마다 구한 선형화 계수 및 추정된 잡음성분에 대한 함수를 나타냄) 에 의해 추출되는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
6	6 제 2항에 있어서, 상기 추출된 부대역별 불확실성 정보를 이용하여 부대역별 가중치를 계산하는 단계에서, 상기 부대역별 가중치(nws)는, (여기에서, nws는 s번째 부대역의 최종 가중치를 의미하고, bs와 es 는 s번째 부대역이 포함하는 로그 필터뱅크 에너지에서의 시작과 끝을 나타냄) 에 의해 계산되는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
7	7 제 2항에 있어서, 상기 부대역별 가중치를 이용하여 최종 부대역 음성 특징을 추출하는 단계에서, 상기 최종 부대역 음성 특징(SBMFCC)은, (여기에서, MFCCs는 부대역 s에 해당하는 필터뱅크 에너지(Ek)에 부대역 가중치(nws)를 곱해서 구해진 부대역 음성 특징 MFCC를 나타내고, SBMFCC는 상기 부대역마다 구해진 부대역 음성 특징 MFCCs를 더한 최종 부대역 음성 특징 MFCC를 나타냄) 에 의해 추출되는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
8	8 제 1항에 있어서, 상기 음성 인식 단계는, 상기 음향 모델의 가우시안 평균값을 로그 필터뱅크 에너지 형태로 바꾼 후 상기 부대역 가중치를 이용하여 상기 음향 모델을 변환하는 단계; 상기 변환된 음향 모델과 상기 추출된 음성 특징을 기반으로 음성 인식을 수행하는 단계를 더 포함하는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 방법
9	9 입력된 음성 신호로부터 잡음이 제거된 음성을 추정하여 상기 추정 음성에서 각 부대역별로 추정 음성의 불확실성 정보를 추출하고, 상기 추출된 불확실성 정보를 부대역 가중치로 이용하여 음성 특징을 추출하는 특징 추출 모듈; 및 상기 부대역 가중치에 따라 음향 모델을 변환하여 상기 변환된 음향 모델과 상기 추출된 음성 특징을 기반으로 음성 인식을 수행하는 음성 인식 모듈을 포함하는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 장치
10	10 제 9항에 있어서, 상기 특징 추출 모듈은, 상기 입력된 음성 신호를 분리하여 음성 프레임을 생성하는 프레임 생성부; 상기 각 음성 프레임에 대한 로그 필터뱅크 에너지를 검출하는 로그 필터뱅크 에너지 검출부; 상기 각 음성 프레임에 대한 로그 필터뱅크 에너지를 이용하여 잡음 모델을 생성하는 잡음 모델링부; IMM(Interactive Multiple Model)을 기반으로 상기 생성된 잡음 모델을 갱신하는 IMM 기반 잡음 모델 갱신부; 상기 갱신된 잡음 모델을 이용하여 MMSE(Minimum Mean Squared error) 방식으로 음성을 추정하는 MMSE 추정부; 상기 추정 음성의 로그 필터뱅크 에너지를 이용하여 부대역별 불확실성 정보를 추출하는 불확실성 추출부; 상기 추출된 부대역별 불확실성 정보를 이용하여 부대역별 가중치를 계산하는 부대역 가중치 계산부; 및 상기 부대역별 가중치를 이용하여 최종 부대역 음성 특징을 추출하는 부대역 특징 추출부를 더 포함하는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 장치
11	11 제 9항에 있어서, 상기 음성 인식 모듈은, 상기 음향 모델의 가우시안 평균값을 로그 필터뱅크 에너지 형태로 바꾸어 상기 부대역 가중치를 이용하여 상기 음향 모델을 변환하는 모델 변환부; 및 상기 변환된 음향 모델과 상기 추출된 음성 특징을 기반으로 음성 인식을 수행하는 음성 인식부를 더 포함하는 것을 특징으로 하는 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성 인식 장치

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번	패밀리번호	국가코드	국가명	종류
1	US20090076813	US	미국	FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번	패밀리번호	국가코드	국가명	종류
1	US2009076813	US	미국	DOCDBFAMILY

순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번	연구부처	주관기관	연구사업	연구과제
1	정보통신부	한국전자통신연구원	IT신성장동력핵심기술개발사업	신성장동력산업용 대용량 대화형 분산 처리 음성인터페이스기술개발

본 등록정보는 참고용으로 법적증빙자료로 사용할 수 없습니다.
데이터 이관에 따른 소요기간(1일)으로 인하여 등록원부와 일부 차이가 발생할 수 있으며, 일부 정보(부기, 상세 주소 등)를 제공하지 않고 있습니다.
법적증빙자료로 활용하시거나 더 자세한 정보를 보시려면 등록원부를 발급받아 사용하시기 바랍니다.

이전대상기술 뷰 페이지 등록사항 > 특허 등록번호 표입니다.
특허 등록번호	10-0919223-0000

권리란

표시번호, 사항의 정보를 제공하는 이전대상기술 뷰 페이지 등록사항 > 권리란 표입니다.
표시번호	사항
1	출원 연월일 : 20070919 출원 번호 : 1020070095401 공고 연월일 : 20090928 공고 번호 : 특허결정(심결)연월일 : 20090918 청구범위의 항수 : 4 유별 : G10L 15/20 발명의 명칭 : 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성인식 방법 및 장치 존속기간(예정)만료일 : 20140922

특허권자란

순위번호, 사항의 정보를 제공하는 이전대상기술 뷰 페이지 등록사항 > 특허권자란 표입니다.
순위번호	사항
1	(권리자) 한국전자통신연구원 대전광역시 유성구...

등록료란

순위번호, 사항의 정보를 제공하는 이전대상기술 뷰 페이지 등록사항 > 등록료란 표입니다.
제 1 - 3 년분	금 액	237,000 원	2009년 09월 22일	납입
제 4 년분	금 액	282,000 원	2012년 09월 10일	납입
제 5 년분	금 액	128,000 원	2013년 08월 29일	납입

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2007.09.19	수리 (Accepted)	1-1-2007-0679784-46
2	선행기술조사의뢰서	2008.06.11	수리 (Accepted)	9-1-9999-9999999-89
3	선행기술조사보고서	2008.07.15	수리 (Accepted)	9-1-2008-0045169-27
4	의견제출통지서	2009.03.30	발송처리완료 (Completion of Transmission)	9-5-2009-0134990-89
5	[명세서등 보정]보정서	2009.05.29	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2009-0324413-77
6	[거절이유 등 통지에 따른 의견]의견(답변, 소명)서	2009.05.29	수리 (Accepted)	1-1-2009-0324404-66
7	출원인정보변경(경정)신고서	2009.08.04	수리 (Accepted)	4-1-2009-5150899-36
8	등록결정서	2009.09.18	발송처리완료 (Completion of Transmission)	9-5-2009-0387882-12
9	출원인정보변경(경정)신고서	2015.02.02	수리 (Accepted)	4-1-2015-0006137-44


과제고유번호	1445006409
세부과제번호	2006-S-036-02
연구과제명	신성장동력산업용대용량/대화형분산처리음성인터페이스기술개발
성과구분	출원
부처명	지식경제부
연구관리전문기관명	정보통신연구진흥원
연구주관기관명	한국전자통신연구원
성과제출연도	2007
연구기간	200703~200802
기여율	1
연구개발단계명	개발연구
6T분류명	IT(정보기술)

특허성과

[1020070133391]	입술움직임 영상 판별 방법 및 그 장치	새창보기
[1020070133217]	음성 인식기의 성능 평가 장치 및 그 방법	새창보기
[1020070132546]	어휘 디코딩 방법 및 장치	새창보기
[1020070131816]	리모트 컨트롤러 장치 및 이를 이용한 동작 제어 방법	새창보기
[1020070130950]	음성인식 장치 및 방법	새창보기
[1020070128929]	음성 합성 방법 및 장치	새창보기
[1020070128926]	음성 데이터베이스 제공 방법 및 장치	새창보기
[1020070128550]	ＥＰＧ 검색 서비스에서의 방송 프로그램명 및 인명 관리방법	새창보기
[1020070127877]	음성 송신 기능을 가지는 리모컨, 이를 이용한 ＥＰＧ 정보검색 시스템 및 방법	새창보기
[1020070122185]	혼동 행렬 기반 발화 검증 방법 및 장치	새창보기
[1020070107705]	음성 인식 방법	새창보기
[1020070103555]	내비게이션용 ＰＯＩ의 이형태 생성방법 및 그 시스템	새창보기
[1020070103554]	온톨로지 인스턴스 자동 생성 장치 및 방법	새창보기
[1020070100368]	음성 인식 시스템 및 방법	새창보기
[1020070095457]	음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법	새창보기
[1020070095401]	부대역의 불확실성 정보를 이용한 잡음환경에서의 음성인식 방법 및 장치	새창보기
[1020070095375]	인간 음성의 유성음 특징을 이용한 음성 판별 방법 및 장치	새창보기
[1020070094047]	음성 대화 분석 시스템 및 그 방법	새창보기
[1020070084301]	환경 이동을 위한 잡음 적응형 음향 모델 생성 방법 및 장치	새창보기

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2016000934][한국전자통신연구원]	켑스트럼 특징벡터에 기반한 음성인식 장치 및 방법	새창보기
[KST2015080405][한국전자통신연구원]	적응 반음소 모델을 이용한 음성인식 서비스 방법	새창보기
[KST2015082510][한국전자통신연구원]	핵심어 인식 기반의 탐색 네트워크 제한을 이용한연속음성인식 장치 및 방법	새창보기
[KST2015089192][한국전자통신연구원]	음성 인식 방법 및 장치	새창보기
[KST2014067340][한국전자통신연구원]	대화형 차량정보서비스를 위한 대화처리 기술	새창보기
[KST2015096552][한국전자통신연구원]	음성 특징의 적응에 의한 음성 인식기의 성능 개선 방법	새창보기
[KST2015093746][한국전자통신연구원]	음성부호화기에서 양자화 오차의 상관관계 특성을 이용한피치 검색 방법	새창보기
[KST2015093857][한국전자통신연구원]	대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법	새창보기
[KST2015091199][한국전자통신연구원]	음성 기반 캡차 방법 및 장치	새창보기
[KST2019005090][한국전자통신연구원]	강연 자동 동시 통역을 위한 피드백 장치 및 방법	새창보기
[KST2015091455][한국전자통신연구원]	자동 번역 및 통역 장치 및 그 방법	새창보기
[KST2022000933][한국전자통신연구원]	자기 지도 학습을 이용한 VAE-GAN 기반 발성 스타일 변환 방법 및 장치	새창보기
[KST2015076461][한국전자통신연구원]	텍스트/음성변환기에서의최적합성단위열선정방법	새창보기
[KST2015079601][한국전자통신연구원]	복수 단계 디코딩을 이용한 연속 숫자음 인식 시스템	새창보기
[KST2015101339][한국전자통신연구원]	오디오/영상물의 음향적 장면분할방법	새창보기
[KST2015091805][한국전자통신연구원]	ＷＦＳＴ를 이용한 음성 끝점 검출 장치 및 방법	새창보기
[KST2015099340][한국전자통신연구원]	고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치	새창보기
[KST2015074589][한국전자통신연구원]	대어휘음성인식을위한후보단어추출장치및추출방법	새창보기
[KST2015077055][한국전자통신연구원]	대표특징열을이용한프레임압축방법및그를이용한음성인식방법	새창보기
[KST2015089723][한국전자통신연구원]	구구조를 고려한 음성 인식 방법 및 기록 매체.	새창보기
[KST2015091818][한국전자통신연구원]	음성 인식 장치	새창보기
[KST2015085642][한국전자통신연구원]	연령 및 성별을 이용한 사용자 인식 장치 및 방법	새창보기
[KST2022006002][한국전자통신연구원]	음성인식을 위한 사전훈련 모델 기반 문장단위 발화검증 장치 및 그 방법	새창보기
[KST2016001072][한국전자통신연구원]	음성 인식을 통한 전자책 제어 방법 및 그 장치	새창보기
[KST2015094907][한국전자통신연구원]	키워드 기반 Ｎ-ｇｒａｍ 언어모델 구축 방법	새창보기
[KST2015077370][한국전자통신연구원]	피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법	새창보기
[KST2015076875][한국전자통신연구원]	화행 정보를 이용한 음성 인식 방법	새창보기
[KST2015101338][한국전자통신연구원]	네트워크를 이용한 음성 언어 번역 시스템 및 그 방법	새창보기
[KST2015089156][한국전자통신연구원]	멀티미디어 컨텐츠 검색 방법 및 장치	새창보기
[KST2015080186][한국전자통신연구원]	자동음성인식시스템의 음성 2단 끝점검출 장치 및 그 방법	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택

기술이전 상담신청 드립니다.
기업명
신청자 성명		직책
연락처	- -
이메일	@
상담희망전담센터	※ 사업장(본점) 소재지가 속한 지역의 기술혁신센터를 지정해주세요.