맞춤기술찾기

이전대상기술

캡스트럼 평균 차감 방법 및 그 장치

  • 기술번호 : KST2015084396
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 캡스트럼 평균 차감 방법 및 그 장치에 관한 것으로, 온라인 음성인식 서비스에서 묵음 구간의 캡스트럼 평균값을 사용하여 실제 음성 구간 전체의 캡스트럼 평균값을 추정함으로써, 채널 특성을 보다 정확하게 정규화할 수 있다. 또한, 본 발명은 주변 환경 변화가 발생하는 경우에 대해서도 정확한 캡스트럼 평균값을 추정할 수 있어 채널 정규화 성능이 우수하다. 또한, 본 발명은 온라인 음성인식 상황에서 추정하는 묵음 구간의 캡스트럼 평균값과 실제 음성 구간 전체의 캡스트럼 평균값과의 차이로 인한 음성인식 성능저하를 극복할 수 있다. 음성 신호, 특징 추출, 예측, CMS
Int. CL G10L 15/20 (2013.01) G10L 25/24 (2013.01) G10L 25/78 (2013.01) G10L 15/14 (2013.01)
CPC G10L 25/87(2013.01) G10L 25/87(2013.01) G10L 25/87(2013.01) G10L 25/87(2013.01)
출원번호/일자 1020080127707 (2008.12.16)
출원인 한국전자통신연구원
등록번호/일자 10-1072886-0000 (2011.10.06)
공개번호/일자 10-2010-0069117 (2010.06.24) 문서열기
공고번호/일자 (20111017) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2008.12.16)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 전형배 대한민국 대전광역시 서구
2 정호영 대한민국 대전광역시 서구
3 박전규 대한민국 서울특별시 금천구
4 정훈 대한민국 강원도 홍천군
5 이윤근 대한민국 대전 서구
6 강점자 대한민국 대전광역시 서구
7 정의석 대한민국 대전광역시 유성구
8 강병옥 대한민국 대전광역시 유성구
9 김종진 대한민국 대전광역시 서구
10 왕지현 대한민국 대전광역시 유성구
11 이성주 대한민국 충청남도 계룡시
12 박기영 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)
2 김원준 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)(제일특허법인(유))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2008.12.16 수리 (Accepted) 1-1-2008-0863210-13
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
3 의견제출통지서
Notification of reason for refusal
2011.02.09 발송처리완료 (Completion of Transmission) 9-5-2011-0071535-76
4 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.04.11 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2011-0260905-08
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.04.11 수리 (Accepted) 1-1-2011-0260904-52
6 등록결정서
Decision to grant
2011.09.19 발송처리완료 (Completion of Transmission) 9-5-2011-0529931-18
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
삭제
2 2
삭제
3 3
삭제
4 4
음성 구간의 시작점을 검출하는 단계와, 상기 시작점 이전의 묵음 구간과 상기 음성 구간에 대해 특징 추출을 수행하는 단계와, 상기 묵음 구간의 특징 추출을 기반으로 상기 음성 구간 전체의 캡스트럼 평균값을 예측하는 단계와, 상기 예측된 평균값을 음성 구간의 MFCC(mell frequency cepstrum coefficient) 특징 벡터에 CMS(cepstrum mean subtraction)방식으로 채널 정규화하는 단계와, 상기 채널 정규화된 MFCC 특징 벡터를 디코딩하여 인식결과로 출력하는 단계를 포함하되, 상기 캡스트럼 평균값을 예측하는 단계는, 상기 시작점 이전의 묵음 구간의 캡스트럼 평균값을 계산하는 단계와, CMS DB를 검색하여 상기 계산된 평균값과 가까운 묵음 구간의 캡스트럼 평균값을 찾아내는 단계와, 이전 발화 묵음 구간의 캡스트럼 평균값을 기반으로 상기 계산된 평균값의 변화량을 계산하는 단계와, 상기 찾아낸 묵음 구간의 캡스트럼 평균값과 상기 평균값의 변화량을 기반으로 최종 추정된 음성 구간 전체의 캡스트럼 평균값을 예측하는 단계를 포함하는 캡스트럼 평균 차감 방법
5 5
제 4 항에 있어서, 상기 묵음 구간의 캡스트럼 평균값을 찾아내는 단계는, 수학식 (여기서, disk(k)는 Local CMS간의 평균 거리이고, LocalCMSi(now)는 현재 발화의 묵음 구간 i번째 차수의 캡스트럼 평균값이며, LocalCMSi(k)는 k번째 묵음 구간의 캡스트럼 평균값의 I번째 차수의 캡스트럼 평균값이며, 는 CMS DB에서 k개의 묵음 구간 캡스트럼 평균값 중에서 가장 가까운 평균값의 인덱스를 의미하며, M은 캡스트럼의 차수를 의미하며, k는 CMS DB에 저장된 데이터 인덱스를 의미한다
6 6
제 4 항에 있어서, 상기 계산된 평균값의 변화량을 계산하는 단계는, 수학식 (여기서, δ는 변화량이고, LocalCMSi(now)는 현재 발화의 묵음 구간 i번째 차수의 캡스트럼 평균값이며, LocalCMSi(prev)는 이전 발화의 묵음 구간 i번째 차수의 캡스트럼 평균값이며, M은 캡스트럼 차수를 의미한다
7 7
제 4 항에 있어서, 상기 최종 추정된 음성 구간 전체의 캡스트럼 평균값을 예측하는 단계는, 수학식 (여기서, λ는 비례상수로서 주어진 샘플 데이터로부터 최적의 값을 추정하고 고정하여 사용하고, δ는 이전 발화와 현재발화의 묵음 구간 캡스트럼 평균값의 변화량이며, α와 β는 가중치 값이며, GlobalCMSi(k)는 CMS DB를 통해 검색하여 얻은 가장 가까운 k번째 음성 구간 전체의 캡스트럼 평균값의 i번째 차수의 캡스트럼 평균값이며, GlobalCMSi(prev)는 이전 발화의 음성 구간 전체의 캡스트럼 평균값의 i번째 차수의 캡스트럼 평균값을 의미하며, k는 CMS DB에 저장된 데이터 인덱스를 의미한다
8 8
삭제
9 9
음성 구간의 시작점과 끝점을 검출하는 검출부와, 상기 시작점 이전의 묵음 구간과 상기 음성 구간과 상기 끝점 이후의 묵음 구간에 대해 특징 추출을 수행하는 특징 추출부와, 상기 음성 구간 전체에 대한 실제 발화 단위 캡스트럼 평균값을 계산하는 발화단위 CMS값 계산부와, 상기 묵음 구간의 특징 추출을 기반으로 상기 음성 구간 전체의 캡스트럼 평균값을 예측하는 캡스트럼 평균값 예측부와, 상기 예측된 평균값을 MFCC 특징 벡터에 CMS방식으로 채널 정규화하는 특징벡터 CMS 적용부와, 상기 채널 정규화된 MFCC 특징 벡터를 인식결과로 출력하기 위해 디코딩하는 디코딩부를 포함하되, 상기 캡스트럼 평균값 예측부는, 상기 시작점 이전의 묵음 구간의 캡스트럼 평균값을 계산하는 평균값 계산부와, CMS DB를 검색하여 상기 계산된 평균값과 가까운 묵음 구간의 캡스트럼 평균값을 찾아내는 검색부와, 이전 발화 묵음 구간의 캡스트럼 평균값을 기반으로 상기 계산된 평균값의 변화량을 계산하는 변화량 계산부와, 상기 찾아낸 묵음 구간의 캡스트럼 평균값과 상기 평균값의 변화량을 기반으로 최종 추정된 음성 구간 전체의 캡스트럼 평균값을 예측하는 예측부를 포함하는 캡스트럼 평균 차감 장치
10 10
제 9 항에 있어서, 상기 CMS DB는, 음성 데이터를 수집하고, 상기 수집된 음성 데이터에 대해 묵음 구간 캡스트럼 평균값과 음성 전체 구간 캡스트럼 평균 값을 쌍으로 추출하여 저장하는 것을 특징으로 하는 캡스트럼 평균 차감 장치
11 11
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 지식경제부 및 정보통신연구진흥원 한국전자통신연구원 IT성장동력기술개발사업 신성장동력산업용 대용량 대화형 분산 처리 음성인터페이스기술개발