요약 | 본 발명은 캡스트럼 평균 차감 방법 및 그 장치에 관한 것으로, 온라인 음성인식 서비스에서 묵음 구간의 캡스트럼 평균값을 사용하여 실제 음성 구간 전체의 캡스트럼 평균값을 추정함으로써, 채널 특성을 보다 정확하게 정규화할 수 있다. 또한, 본 발명은 주변 환경 변화가 발생하는 경우에 대해서도 정확한 캡스트럼 평균값을 추정할 수 있어 채널 정규화 성능이 우수하다. 또한, 본 발명은 온라인 음성인식 상황에서 추정하는 묵음 구간의 캡스트럼 평균값과 실제 음성 구간 전체의 캡스트럼 평균값과의 차이로 인한 음성인식 성능저하를 극복할 수 있다. 음성 신호, 특징 추출, 예측, CMS |
---|---|
Int. CL | G10L 15/20 (2013.01) G10L 25/24 (2013.01) G10L 25/78 (2013.01) G10L 15/14 (2013.01) |
CPC | G10L 25/87(2013.01) G10L 25/87(2013.01) G10L 25/87(2013.01) G10L 25/87(2013.01) |
출원번호/일자 | 1020080127707 (2008.12.16) |
출원인 | 한국전자통신연구원 |
등록번호/일자 | 10-1072886-0000 (2011.10.06) |
공개번호/일자 | 10-2010-0069117 (2010.06.24) 문서열기 |
공고번호/일자 | (20111017) 문서열기 |
국제출원번호/일자 | |
국제공개번호/일자 | |
우선권정보 | |
법적상태 | 소멸 |
심사진행상태 | 수리 |
심판사항 | |
구분 | 신규 |
원출원번호/일자 | |
관련 출원번호 | |
심사청구여부/일자 | Y (2008.12.16) |
심사청구항수 | 6 |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 한국전자통신연구원 | 대한민국 | 대전광역시 유성구 |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 전형배 | 대한민국 | 대전광역시 서구 |
2 | 정호영 | 대한민국 | 대전광역시 서구 |
3 | 박전규 | 대한민국 | 서울특별시 금천구 |
4 | 정훈 | 대한민국 | 강원도 홍천군 |
5 | 이윤근 | 대한민국 | 대전 서구 |
6 | 강점자 | 대한민국 | 대전광역시 서구 |
7 | 정의석 | 대한민국 | 대전광역시 유성구 |
8 | 강병옥 | 대한민국 | 대전광역시 유성구 |
9 | 김종진 | 대한민국 | 대전광역시 서구 |
10 | 왕지현 | 대한민국 | 대전광역시 유성구 |
11 | 이성주 | 대한민국 | 충청남도 계룡시 |
12 | 박기영 | 대한민국 | 대전광역시 유성구 |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 제일특허법인(유) | 대한민국 | 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩) |
2 | 김원준 | 대한민국 | 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)(제일특허법인(유)) |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 한국전자통신연구원 | 대한민국 | 대전광역시 유성구 |
번호 | 서류명 | 접수/발송일자 | 처리상태 | 접수/발송번호 |
---|---|---|---|---|
1 | [특허출원]특허출원서 [Patent Application] Patent Application |
2008.12.16 | 수리 (Accepted) | 1-1-2008-0863210-13 |
2 | 출원인정보변경(경정)신고서 Notification of change of applicant's information |
2009.08.04 | 수리 (Accepted) | 4-1-2009-5150899-36 |
3 | 의견제출통지서 Notification of reason for refusal |
2011.02.09 | 발송처리완료 (Completion of Transmission) | 9-5-2011-0071535-76 |
4 | [명세서등 보정]보정서 [Amendment to Description, etc.] Amendment |
2011.04.11 | 보정승인간주 (Regarded as an acceptance of amendment) | 1-1-2011-0260905-08 |
5 | [거절이유 등 통지에 따른 의견]의견(답변, 소명)서 [Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation) |
2011.04.11 | 수리 (Accepted) | 1-1-2011-0260904-52 |
6 | 등록결정서 Decision to grant |
2011.09.19 | 발송처리완료 (Completion of Transmission) | 9-5-2011-0529931-18 |
7 | 출원인정보변경(경정)신고서 Notification of change of applicant's information |
2015.02.02 | 수리 (Accepted) | 4-1-2015-0006137-44 |
번호 | 청구항 |
---|---|
1 |
1 삭제 |
2 |
2 삭제 |
3 |
3 삭제 |
4 |
4 음성 구간의 시작점을 검출하는 단계와, 상기 시작점 이전의 묵음 구간과 상기 음성 구간에 대해 특징 추출을 수행하는 단계와, 상기 묵음 구간의 특징 추출을 기반으로 상기 음성 구간 전체의 캡스트럼 평균값을 예측하는 단계와, 상기 예측된 평균값을 음성 구간의 MFCC(mell frequency cepstrum coefficient) 특징 벡터에 CMS(cepstrum mean subtraction)방식으로 채널 정규화하는 단계와, 상기 채널 정규화된 MFCC 특징 벡터를 디코딩하여 인식결과로 출력하는 단계를 포함하되, 상기 캡스트럼 평균값을 예측하는 단계는, 상기 시작점 이전의 묵음 구간의 캡스트럼 평균값을 계산하는 단계와, CMS DB를 검색하여 상기 계산된 평균값과 가까운 묵음 구간의 캡스트럼 평균값을 찾아내는 단계와, 이전 발화 묵음 구간의 캡스트럼 평균값을 기반으로 상기 계산된 평균값의 변화량을 계산하는 단계와, 상기 찾아낸 묵음 구간의 캡스트럼 평균값과 상기 평균값의 변화량을 기반으로 최종 추정된 음성 구간 전체의 캡스트럼 평균값을 예측하는 단계를 포함하는 캡스트럼 평균 차감 방법 |
5 |
5 제 4 항에 있어서, 상기 묵음 구간의 캡스트럼 평균값을 찾아내는 단계는, 수학식 (여기서, disk(k)는 Local CMS간의 평균 거리이고, LocalCMSi(now)는 현재 발화의 묵음 구간 i번째 차수의 캡스트럼 평균값이며, LocalCMSi(k)는 k번째 묵음 구간의 캡스트럼 평균값의 I번째 차수의 캡스트럼 평균값이며, 는 CMS DB에서 k개의 묵음 구간 캡스트럼 평균값 중에서 가장 가까운 평균값의 인덱스를 의미하며, M은 캡스트럼의 차수를 의미하며, k는 CMS DB에 저장된 데이터 인덱스를 의미한다 |
6 |
6 제 4 항에 있어서, 상기 계산된 평균값의 변화량을 계산하는 단계는, 수학식 (여기서, δ는 변화량이고, LocalCMSi(now)는 현재 발화의 묵음 구간 i번째 차수의 캡스트럼 평균값이며, LocalCMSi(prev)는 이전 발화의 묵음 구간 i번째 차수의 캡스트럼 평균값이며, M은 캡스트럼 차수를 의미한다 |
7 |
7 제 4 항에 있어서, 상기 최종 추정된 음성 구간 전체의 캡스트럼 평균값을 예측하는 단계는, 수학식 (여기서, λ는 비례상수로서 주어진 샘플 데이터로부터 최적의 값을 추정하고 고정하여 사용하고, δ는 이전 발화와 현재발화의 묵음 구간 캡스트럼 평균값의 변화량이며, α와 β는 가중치 값이며, GlobalCMSi(k)는 CMS DB를 통해 검색하여 얻은 가장 가까운 k번째 음성 구간 전체의 캡스트럼 평균값의 i번째 차수의 캡스트럼 평균값이며, GlobalCMSi(prev)는 이전 발화의 음성 구간 전체의 캡스트럼 평균값의 i번째 차수의 캡스트럼 평균값을 의미하며, k는 CMS DB에 저장된 데이터 인덱스를 의미한다 |
8 |
8 삭제 |
9 |
9 음성 구간의 시작점과 끝점을 검출하는 검출부와, 상기 시작점 이전의 묵음 구간과 상기 음성 구간과 상기 끝점 이후의 묵음 구간에 대해 특징 추출을 수행하는 특징 추출부와, 상기 음성 구간 전체에 대한 실제 발화 단위 캡스트럼 평균값을 계산하는 발화단위 CMS값 계산부와, 상기 묵음 구간의 특징 추출을 기반으로 상기 음성 구간 전체의 캡스트럼 평균값을 예측하는 캡스트럼 평균값 예측부와, 상기 예측된 평균값을 MFCC 특징 벡터에 CMS방식으로 채널 정규화하는 특징벡터 CMS 적용부와, 상기 채널 정규화된 MFCC 특징 벡터를 인식결과로 출력하기 위해 디코딩하는 디코딩부를 포함하되, 상기 캡스트럼 평균값 예측부는, 상기 시작점 이전의 묵음 구간의 캡스트럼 평균값을 계산하는 평균값 계산부와, CMS DB를 검색하여 상기 계산된 평균값과 가까운 묵음 구간의 캡스트럼 평균값을 찾아내는 검색부와, 이전 발화 묵음 구간의 캡스트럼 평균값을 기반으로 상기 계산된 평균값의 변화량을 계산하는 변화량 계산부와, 상기 찾아낸 묵음 구간의 캡스트럼 평균값과 상기 평균값의 변화량을 기반으로 최종 추정된 음성 구간 전체의 캡스트럼 평균값을 예측하는 예측부를 포함하는 캡스트럼 평균 차감 장치 |
10 |
10 제 9 항에 있어서, 상기 CMS DB는, 음성 데이터를 수집하고, 상기 수집된 음성 데이터에 대해 묵음 구간 캡스트럼 평균값과 음성 전체 구간 캡스트럼 평균 값을 쌍으로 추출하여 저장하는 것을 특징으로 하는 캡스트럼 평균 차감 장치 |
11 |
11 삭제 |
지정국 정보가 없습니다 |
---|
패밀리정보가 없습니다 |
---|
순번 | 연구부처 | 주관기관 | 연구사업 | 연구과제 |
---|---|---|---|---|
1 | 지식경제부 및 정보통신연구진흥원 | 한국전자통신연구원 | IT성장동력기술개발사업 | 신성장동력산업용 대용량 대화형 분산 처리 음성인터페이스기술개발 |
특허 등록번호 | 10-1072886-0000 |
---|
표시번호 | 사항 |
---|---|
1 |
출원 연월일 : 20081216 출원 번호 : 1020080127707 공고 연월일 : 20111017 공고 번호 : 특허결정(심결)연월일 : 20110919 청구범위의 항수 : 6 유별 : G10L 11/02 발명의 명칭 : 캡스트럼 평균 차감 방법 및 그 장치 존속기간(예정)만료일 : 20151007 |
순위번호 | 사항 |
---|---|
1 |
(권리자) 한국전자통신연구원 대전광역시 유성구... |
제 1 - 3 년분 | 금 액 | 139,500 원 | 2011년 10월 07일 | 납입 |
제 4 년분 | 금 액 | 120,400 원 | 2014년 09월 26일 | 납입 |
번호 | 서류명 | 접수/발송일자 | 처리상태 | 접수/발송번호 |
---|---|---|---|---|
1 | [특허출원]특허출원서 | 2008.12.16 | 수리 (Accepted) | 1-1-2008-0863210-13 |
2 | 출원인정보변경(경정)신고서 | 2009.08.04 | 수리 (Accepted) | 4-1-2009-5150899-36 |
3 | 의견제출통지서 | 2011.02.09 | 발송처리완료 (Completion of Transmission) | 9-5-2011-0071535-76 |
4 | [명세서등 보정]보정서 | 2011.04.11 | 보정승인간주 (Regarded as an acceptance of amendment) | 1-1-2011-0260905-08 |
5 | [거절이유 등 통지에 따른 의견]의견(답변, 소명)서 | 2011.04.11 | 수리 (Accepted) | 1-1-2011-0260904-52 |
6 | 등록결정서 | 2011.09.19 | 발송처리완료 (Completion of Transmission) | 9-5-2011-0529931-18 |
7 | 출원인정보변경(경정)신고서 | 2015.02.02 | 수리 (Accepted) | 4-1-2015-0006137-44 |
기술정보가 없습니다 |
---|
과제고유번호 | 1415086673 |
---|---|
세부과제번호 | A1100-0802-0008 |
연구과제명 | 신성장동력산업용대용량/대화형분산처리음성인터페이스기술개발 |
성과구분 | 출원 |
부처명 | 지식경제부 |
연구관리전문기관명 | 정보통신연구진흥원 |
연구주관기관명 | 한국전자통신연구원 |
성과제출연도 | 2008 |
연구기간 | 200603~201002 |
기여율 | 1 |
연구개발단계명 | 개발연구 |
6T분류명 | IT(정보기술) |
과제고유번호 | 1415100370 |
---|---|
세부과제번호 | KI001509 |
연구과제명 | 신성장동력산업용대용량/대화형분산처리음성인터페이스기술개발 |
성과구분 | 등록 |
부처명 | 지식경제부 |
연구관리전문기관명 | 한국산업기술평가관리원 |
연구주관기관명 | 한국전자통신연구원 |
성과제출연도 | 2009 |
연구기간 | 200603~201002 |
기여율 | 1 |
연구개발단계명 | 응용연구 |
6T분류명 | IT(정보기술) |
[1020100104197] | 암묵신호 분리방법 및 이를 수행하는 장치 | 새창보기 |
---|---|---|
[1020090128386] | 단어별 신뢰도 문턱값에 기반한 발화 검증 장치 및 그 방법 | 새창보기 |
[1020090128382] | 음성인식기능을 이용한 물류검색 장치 및 그 방법 | 새창보기 |
[1020090127336] | 전자책 시스템에서 인터랙티브 컨텐츠 제공 장치 및 방법 | 새창보기 |
[1020090123772] | 이형태 자동 구축 방법 및 장치 | 새창보기 |
[1020090123354] | 음성인식 기반 국제회의 통역 장치 및 방법 | 새창보기 |
[1020090118290] | 실시간 잡음 추정에 기반하여 잡음을 제거하는 음성 처리 장치 및 방법 | 새창보기 |
[1020090113966] | 음원 분리 방법 및 장치 | 새창보기 |
[1020090095740] | 통계적 모델을 이용한 목표 신호 검출 장치 및 그 방법 | 새창보기 |
[1020090092779] | 음성인식을 위한 모델기반 왜곡 보상형 잡음 제거 장치 및 방법 | 새창보기 |
[1020090091867] | 사용자 음성을 이용한 위치 추적 장치 및 그 방법 | 새창보기 |
[1020090088629] | IPTV 방송 시스템, 서버 및 발성목록 생성 장치 | 새창보기 |
[1020090085423] | 음성 인터페이스를 이용한 IPTV 시스템 및 서비스 방법 | 새창보기 |
[1020090083167] | 음성신호에서 통계적 모델을 이용한 잡음 제거 장치 및 방법 | 새창보기 |
[1020090027532] | 연속 숫자의 음성 인식에 있어서 혼동행렬과 신뢰도치 기반의 다중 인식후보 생성 장치 및 방법 | 새창보기 |
[1020090026297] | 발화 검증 장치 및 그 방법 | 새창보기 |
[1020080131772] | 음성 인식을 위한 화자 적응 장치 및 그 방법 | 새창보기 |
[1020080131766] | IPTV 방송 서비스 방법 및 서버와 IPTV 셋탑장치 | 새창보기 |
[1020080131759] | 음성/음악 판별장치 및 방법 | 새창보기 |
[1020080131755] | 고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치 | 새창보기 |
[1020080131754] | 음성인식 시스템의 발화검증 방법 및 장치 | 새창보기 |
[1020080131365] | 비터비 디코더와 이를 이용한 음성 인식 방법 | 새창보기 |
[1020080131243] | 잡음 제거 장치 및 방법 | 새창보기 |
[1020080131242] | 맞춤 광고 제공 방법 | 새창보기 |
[1020080131239] | 채널추정 기반 변별학습을 이용한 환경적응 방법 | 새창보기 |
[1020080131238] | 다채널 잡음처리 장치 및 방법 | 새창보기 |
[1020080131236] | 리모트 컨트롤러, 입력 인터페이스 제어 장치 및 방법 | 새창보기 |
[1020080131221] | 네비게이션 기기에서 음성인식 대상 키워드의 생성장치 및 방법 | 새창보기 |
[1020080127707] | 캡스트럼 평균 차감 방법 및 그 장치 | 새창보기 |
[1020080125621] | 음성 인식을 이용한 메타데이터 검색기, 검색 방법, IPTV 수신 장치 | 새창보기 |
[1020080125435] | [HRI]유비쿼터스 지능형 로봇을 이용한 홈 네트워크 서비스 방법 | 새창보기 |
[1020080125434] | 차량용 네비게이션 단말기의 음성인식 방법 | 새창보기 |
[1020080125433] | 음성과 잡음 신호 분리 방법 및 그 장치 | 새창보기 |
[1020080088318] | 마이크배열 기반 음성인식 시스템 및 그 시스템에서의 목표음성 추출 방법 | 새창보기 |
[1020080085095] | 음성 인식 정보 생성 장치 및 음성 인식 정보 생성 방법, 이를 이용한 방송 서비스 방법 | 새창보기 |
[1020080075653] | 잡음 제거 장치 및 방법 | 새창보기 |
[1020080009088] | 잡음 제거 장치 및 방법 | 새창보기 |
[1020070103555] | 내비게이션용 POI의 이형태 생성방법 및 그 시스템 | 새창보기 |
[1020070096013] | 온톨로지의 도메인 정보를 이용한 문서 요약 방법 및 장치 | 새창보기 |
[1020070064985] | 세부분류 개체명 인식 장치 및 방법 | 새창보기 |
[1020060124450] | 잡음 모델을 이용한 순수 음성 추정 방법 | 새창보기 |
[1020060124449] | 네비게이션 서버를 이용하여 길 안내하는 방법 및 장치 | 새창보기 |
[1020060122649] | 적응형 발성 화면 분석 방법 및 장치 | 새창보기 |
[1020060119872] | 마스킹 확률을 이용한 음성 인식 전처리 방법 및 전처리장치 | 새창보기 |
[1020060114504] | 정적 특성과 동적 특성이 반영된 끊어읽기 예측 방법 및이를 기반으로 하는 음성합성 방법 및 시스템 | 새창보기 |
[1020060095820] | 통계적 모델에 기반한 선험적 음성 부재 확률 추정 방법 | 새창보기 |
[1020060094231] | 말뭉치 기반의 확장 가능한 CFG 형태의 음성 인식 문법생성 방법 및 장치 | 새창보기 |
[1020060081027] | 휴대용 단말기의 음성 인식 시스템 | 새창보기 |
[1020060072502] | 문말 억양 예측 방법 및 이를 기반으로 하는 음성합성 방법및 시스템 | 새창보기 |
[1020060064484] | 대화형 음성 인터페이스 시스템 및 그 응답 방법 | 새창보기 |
[KST2016000934][한국전자통신연구원] | 켑스트럼 특징벡터에 기반한 음성인식 장치 및 방법 | 새창보기 |
---|---|---|
[KST2015097793][한국전자통신연구원] | 음향 모델 생성 장치 및 방법 | 새창보기 |
[KST2015082510][한국전자통신연구원] | 핵심어 인식 기반의 탐색 네트워크 제한을 이용한연속음성인식 장치 및 방법 | 새창보기 |
[KST2015089192][한국전자통신연구원] | 음성 인식 방법 및 장치 | 새창보기 |
[KST2020011573][한국전자통신연구원] | 단어임베딩을 이용한 음성 인식 시스템 및 그 방법 | 새창보기 |
[KST2015092156][한국전자통신연구원] | 디바이스 구분 음향모델 누적 적응을 이용한 음성인식 시스템 및 방법 | 새창보기 |
[KST2014067340][한국전자통신연구원] | 대화형 차량정보서비스를 위한 대화처리 기술 | 새창보기 |
[KST2015089037][한국전자통신연구원] | 언어 모델 가중치 추정 방법 및 이를 위한 장치 | 새창보기 |
[KST2015078253][한국전자통신연구원] | 음성언어 식별 장치 및 방법 | 새창보기 |
[KST2015079744][한국전자통신연구원] | 수정된 비터비 알고리즘과 빔폭 및 지속시간을 이용한핵심어 검출기 | 새창보기 |
[KST2015093200][한국전자통신연구원] | 복소수 라플라시안 통계모델을 이용한 음성 검출기 및 음성 검출 방법 | 새창보기 |
[KST2015091132][한국전자통신연구원] | 음성인식 성능향상 방법 | 새창보기 |
[KST2015090241][한국전자통신연구원] | 음성인식 오류 혼돈 행렬을 이용한 클러스터링 장치 및 그 방법 | 새창보기 |
[KST2016001003][한국전자통신연구원] | 엔그램을 이용한 단어 의미 인식 장치 | 새창보기 |
[KST2015087495][한국전자통신연구원] | 음성인식을 위한 학습과 인식 방법 및 시스템 | 새창보기 |
[KST2015099340][한국전자통신연구원] | 고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치 | 새창보기 |
[KST2016001002][한국전자통신연구원] | 온라인 비지도 특징 벡터 적응 기법을 이용한 음성 인식 시스템 및 방법 | 새창보기 |
[KST2016001063][한국전자통신연구원] | 음성 인식 장치 및 방법 | 새창보기 |
[KST2015086190][한국전자통신연구원] | 음성 인식 시스템 | 새창보기 |
[KST2015093868][한국전자통신연구원] | 음성 인식 장치 및 방법 | 새창보기 |
[KST2015089922][한국전자통신연구원] | 최대 로그 우도법 기반의 최적 음향모델 생성 장치 및 방법 | 새창보기 |
[KST2015101612][한국전자통신연구원] | 다중 음향 모델을 이용하여 음성을 인식하기 위한 장치 및 그 방법 | 새창보기 |
[KST2015095744][한국전자통신연구원] | 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성인식 방법 및 장치 | 새창보기 |
[KST2015090178][한국전자통신연구원] | 음향 모델 훈련 장치 및 그 방법 | 새창보기 |
[KST2015085642][한국전자통신연구원] | 연령 및 성별을 이용한 사용자 인식 장치 및 방법 | 새창보기 |
[KST2015080186][한국전자통신연구원] | 자동음성인식시스템의 음성 2단 끝점검출 장치 및 그 방법 | 새창보기 |
[KST2015086845][한국전자통신연구원] | 음성인식 시스템의 발화검증 방법 및 장치 | 새창보기 |
[KST2015097287][한국전자통신연구원] | 연속어 음성인식 방법 및 연속어 음성인식 장치 | 새창보기 |
[KST2015095196][한국전자통신연구원] | 주제어 인식이 가능한 음성인식시스템 및 방법 | 새창보기 |
[KST2015091335][한국전자통신연구원] | 다국어 공통 음소셋를 이용한 음향모델 재학습방법 및 장치 | 새창보기 |
심판사항 정보가 없습니다 |
---|