맞춤기술찾기

이전대상기술

은닉 마코프 모델을 이용한 잡음 마스크 추정 방법 및 이를수행하는 장치

  • 기술번호 : KST2015174096
  • 담당센터 : 광주기술혁신센터
  • 전화번호 : 062-360-4654
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 잡음 마스크 정보의 추정 정확도를 향상시킬 수 있는 은닉 마코프 모델을 이용한 잡음 마스크 추정 방법 및 이를 수행하는 장치가 개시된다. 먼저, 잡음이 포함된 음성신호를 청각 주파수 신호 및 포락선 정보로 변환하고, 변환된 청각 주파수 신호 및 포락선 정보에 기초하여 상호크기차이 및 상호시간차이로 구성된 방향파라미터를 획득한 후 상호크기차이 및 상호시간차이를 음성 신호의 시간 변화를 고려하는 은닉 마코프 모델 기반 잡음 마스크 모델로 구성하고 이에 기초하여 잡음 마스크 정보를 추정한다. 따라서, 잡음 마스크 정보의 추정 정확도를 향상시킬 수 있고, 향상된 추정 정확도를 가지는 잡음 마스크 정보를 이용하여 잡음을 제거함으로써 음성 인식의 성능을 향상시킬 수 있다. 음성인식, 전처리기, 잡음 마스크 추정, 은닉마코프모델
Int. CL G10L 15/20 (2006.01)
CPC G10L 21/0216(2013.01) G10L 21/0216(2013.01) G10L 21/0216(2013.01) G10L 21/0216(2013.01)
출원번호/일자 1020080041738 (2008.05.06)
출원인 광주과학기술원
등록번호/일자 10-0969138-0000 (2010.07.01)
공개번호/일자 10-2009-0116055 (2009.11.11) 문서열기
공고번호/일자 (20100708) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2008.05.06)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 광주과학기술원 대한민국 광주광역시 북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김홍국 대한민국 광주광역시 북구
2 박지훈 대한민국 광주광역시 북구
3 윤재삼 대한민국 광주광역시 북구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인이상 대한민국 서울특별시 서초구 바우뫼로 ***(양재동, 우도빌딩 *층)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 광주과학기술원 대한민국 광주광역시 북구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2008.05.06 수리 (Accepted) 1-1-2008-0320945-16
2 [공지예외적용대상(신규성, 출원시의 특례)증명서류]서류제출서
[Document Verifying Exclusion from Being Publically Known (Novelty, Special Provisions for Application)] Submission of Document
2008.05.23 수리 (Accepted) 1-1-2008-0365698-21
3 선행기술조사의뢰서
Request for Prior Art Search
2008.12.11 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2009.01.16 수리 (Accepted) 9-1-2009-0005455-99
5 의견제출통지서
Notification of reason for refusal
2009.12.17 발송처리완료 (Completion of Transmission) 9-5-2009-0521179-44
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2010.01.25 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2010-0046598-74
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2010.01.25 수리 (Accepted) 1-1-2010-0046588-17
8 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2010.01.25 수리 (Accepted) 1-1-2010-0046545-65
9 등록결정서
Decision to grant
2010.06.25 발송처리완료 (Completion of Transmission) 9-5-2010-0269704-94
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.09.15 수리 (Accepted) 4-1-2011-5187089-85
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
잡음이 포함된 이중 채널의 음성신호를 청각 주파수 신호 및 포락선 정보로 변환하는 청각특성 모델링 단계; 상기 변환된 청각 주파수 신호 및 상기 포락선 정보에 기초하여 상호크기차이 및 상호시간차이로 구성된 방향파라미터를 획득하는 방향파라미터 획득 단계; 및 상기 상호크기차이 및 상호시간차이를 특징벡터로 이용하여 학습된 은닉 마코프 모델 기반의 잡음 마스크 모델에 기초하여 잡음 마스크 정보를 추정하는 잡음 마스크 정보 추정 단계를 포함하되, 상기 방향파라미터 획득 단계는 상기 포락선 정보에 기초하여 각 주파수 밴드 및 시간 프레임 별로 각 채널의 에너지 비를 이용하여 상기 이중 채널의 좌우 채널에 대한 상기 상호크기차이를 획득하는 단계; 상기 청각 주파수 신호에 기초하여 각 주파수 밴드 및 각 시간 프레임 별로 상기 이중 채널의 좌우 채널에 대한 청각 주파수 신호의 상호상관함수를 구하는 단계; 및 상기 상호상관함수가 최고값을 가질때의 지연값을 통해 상기 상호시간차이를 획득하는 단계를 포함하는 것을 특징으로 하는 잡음 마스크 추정 방법
2 2
제1항에 있어서, 상기 청각특성 모델링 단계는 상기 잡음이 포함된 이중 채널의 음성신호를 소정 개수의 감마톤 필터로 구성된 감마톤 필터뱅크를 이용하여 상기 청각 주파수 신호로 변환하는 단계; 및 상기 변환된 청각 주파수 신호에 기초하여 상기 이중 채널의 각 주파수 밴드 및 시간 프레임별로 상기 포락선 정보를 획득하는 단계를 포함하는 것을 특징으로 하는 잡음 마스크 추정 방법
3 3
삭제
4 4
제1항에 있어서, 상기 잡음 마스크 정보 추정 단계는 상기 상호크기차이 및 상호시간차이를 특징벡터로 이용하여 은닉 마코프 모델 기반의 잡음 마스크 모델을 학습하는 단계; 상기 학습된 잡음 마스크 모델 및 상기 상호크기차이 및 상호시간차이에 기초하여 잡음 마스크 정보를 추정하는 단계; 및 상기 추정된 잡음 마스크 정보를 평활화하는 단계를 포함하는 잡음 마스크 추정 방법
5 5
제4항에 있어서, 상기 학습된 잡음 마스크 모델 및 상기 상호크기차이 및 상호시간차이에 기초하여 잡음 마스크 정보를 추정하는 단계는 상기 상호크기차이 및 상기 상호시간차이를 이용하여 각 주파수 밴드 및 시간 프레임별로 음성에 대한 확률과 잡음에 대한 확률을 추정하여 상기 음성에 대한 확률 및 상기 잡음에 대한 확률의 확률비를 구하는 것을 특징으로 하는 잡음 마스크 추정 방법
6 6
제5항에 있어서, 상기 추정된 잡음 마스크 정보를 평활화하는 단계는 상기 확률비를 시그모이드(sigmoid) 함수에 적용하여 각 주파수 밴드 및 시간 프레임별로 평활화된 잡음 마스크 정보를 추정하는 것을 특징으로 하는 잡음 마스크 추정 방법
7 7
잡음이 포함된 이중 채널의 음성신호로부터 상호크기차이 및 상호시간차이를 획득하고, 상기 상호크기차이 및 상호시간차이를 이용하여 학습된 은닉 마코프 모델 기반의 잡음 마스크 모델에 기초하여 잡음 마스크 정보를 추정하고 상기 추정된 잡음 마스크 정보에 기초하여 상기 잡음이 포함된 음성신호로부터 잡음을 제거한 후 상기 잡음이 제거된 음성 신호에 대한 특징 벡터를 획득하는 음성 인식 전처리기; 및 상기 음성 신호 전처리기로부터 제공된 상기 음성 신호에 대한 특징 벡터를 이용하여 음성 인식을 수행하는 음성 인식기를 포함하되, 상기 음성 인식 전처리기는 상기 잡음이 포함된 이중 채널의 음성신호를 청각 주파수 신호 및 포락선 정보로 변환하고 상기 포락선 정보에 기초하여 각 주파수 밴드 및 시간 프레임 별로 각 채널의 에너지 비를 이용하여 상기 이중 채널의 좌우 채널에 대한 상호크기차이를 획득하고, 상기 청각 주파수 신호에 기초하여 각 주파수 밴드 및 각 시간 프레임 별로 상기 이중 채널의 좌우 채널에 대한 청각 주파수 신호의 상호상관함수를 구한 후, 상기 상호상관함수가 최고값을 가질때의 지연값을 통해 상기 상호시간차이를 획득하는 것을 특징으로 하는 음성 인식 장치
8 8
제7항에 있어서, 상기 음성 인식 전처리기는 상기 잡음이 포함된 이중 채널의 음성신호를 상기 청각 주파수 신호 및 상기 포락선 정보로 변환하는 청각 특성 모델링부; 상기 변환된 청각 주파수 신호 및 상기 포락선 정보에 기초하여 상기 상호크기차이 및 상기 상호시간차이를 획득하는 방향 파라미터 추출부; 상기 상호크기차이 및 상기 상호시간차이에 기초하여 잡음 마스크 정보를 추정하는 잡음 마스크 추정부; 및 상기 추정된 잡음 마스크 정보에 기초하여 상기 잡음이 포함된 음성 신호에서 상기 잡음을 제거하고 상기 잡음이 제거된 음성 신호로부터 음성 인식을 위한 상기 특징 벡터를 추출하는 음성 인식 특징 벡터 추출부를 포함하는 것을 특징으로 하는 음성 인식 장치
9 9
제8항에 있어서, 상기 음성 인식 특징 벡터 추출부는 상기 청각 특성 모델링부로부터 제공된 포락선 정보와, 상기 잡음 마스크 추정부로부터 제공된 잡음 마스크 정보 및 잡음원의 위치를 나타내는 지연값에 기초하여 잡음이 제거된 포락선 정보를 획득하고, 상기 잡음이 제거된 포락선 정보를 이용하여 상기 특징 벡터를 추출하는 것을 특징으로 하는 음성 인식 장치
10 10
제8항에 있어서, 상기 청각 특성 모델링부는 입력된 이중채널의 상기 잡음이 포함된 음성신호를 청각 주파수 신호로 변환하는 감마톤 필터뱅크; 및 상기 청각 주파수 신호에 기초하여 상기 이중채널의 각 주파수 밴드 및 시간 프레임별로 상기 포락선 정보를 획득하는 포락선 추출 모듈을 포함하는 것을 특징으로 하는 음성 인식 장치
11 11
삭제
12 12
제8항에 있어서, 상기 잡음 마스크 추정부는 상기 상호크기차이 및 상호시간차이를 이용하여 상기 은닉 마코프 모델 기반의 잡음 마스크 모델을 학습하고, 상기 학습된 잡음 마스크 모델 및 상기 상호크기차이 및 상호시간차이에 기초하여 잡음 마스크 정보를 추정한 후 상기 추정된 잡음 마스크 정보를 평활화하는 것을 특징으로 하는 음성 인식 장치
13 13
제12항에 있어서, 상기 잡음 마스크 추정부는 상기 상호크기차이 및 상기 상호시간차이를 이용하여 각 주파수 밴드 및 시간 프레임별로 음성에 대한 확률과 잡음에 대한 확률을 추정하여 상기 음성에 대한 확률 및 상기 잡음에 대한 확률의 확률비를 구한 후 상기 확률비를 시그모이드 함수에 적용하여 각 주파수 밴드 및 시간 프레임별로 평활화된 잡음 마스크 정보를 추정하는 것을 특징으로 하는 음성 인식 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.