맞춤기술찾기

이전대상기술

음원분리 및 음원식별을 이용한 음성인식 장치 및 방법

  • 기술번호 : KST2016000928
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 음원분리 및 음원식별을 이용한 음성인식 기술에 관한 것으로, 음성인식기 사용자의 음성과 잡음 음원들이 혼재하는 환경에서 다수의 마이크와 독립요소분석 기법을 이용하여 각각의 원음을 분리하고, 이를 바탕으로 고성능의 음성인식을 수행하는 것이다. 독립요소분석에 의해 분리된 음원들 가운데 음성인식기 사용자가 음성인식기 구동을 목적으로 발성한 음성을 음성인식기가 자동으로 구분해내기 위해, 본 발명에서는 분리된 음원들의 음성인식 신뢰도 및 방향정보를 계산하고, 잡음 음원의 경우 움직이지 않는다고 가정한다. 이 방식에 의하면 음성인식기 사용자의 주변에 복수 개의 잡음원이 존재하는 경우에도 사용자는 마이크 배열과의 상대적인 위치에 무관하게 자유로운 위치에서 발성할 수 있으며, 높은 음성인식 성능을 얻을 수 있다.마이크배열, 음성인식, 잡음처리, 음원분리, 음원식별, 독립요소분석(ICA)
Int. CL G10L 15/20 (2013.01) G10L 15/28 (2013.01) G10L 21/0272 (2013.01) G10L 15/10 (2013.01)
CPC G10L 21/0272(2013.01) G10L 21/0272(2013.01) G10L 21/0272(2013.01)
출원번호/일자 1020080124371 (2008.12.09)
출원인 한국전자통신연구원
등록번호/일자 10-1178801-0000 (2012.08.27)
공개번호/일자 10-2010-0065811 (2010.06.17) 문서열기
공고번호/일자 (20120831) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2008.12.09)
심사청구항수 18

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 조훈영 대한민국 대전광역시 유성구
2 박상규 대한민국 대전광역시 유성구
3 박준 대한민국 대전광역시 유성구
4 김승희 대한민국 대전광역시 유성구
5 이일빈 대한민국 대전광역시 중구
6 황규웅 대한민국 대전광역시 서구
7 전형배 대한민국 대전광역시 서구
8 이윤근 대한민국 대전광역시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)
2 김원준 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)(제일특허법인(유))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 주식회사 윈시스 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2008.12.09 수리 (Accepted) 1-1-2008-0845485-39
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
3 의견제출통지서
Notification of reason for refusal
2012.01.27 발송처리완료 (Completion of Transmission) 9-5-2012-0052140-90
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2012.02.08 수리 (Accepted) 1-1-2012-0101551-33
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2012.02.08 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2012-0101552-89
6 등록결정서
Decision to grant
2012.08.22 발송처리완료 (Completion of Transmission) 9-5-2012-0488153-31
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
적어도 두개의 마이크를 통해 각각 입력된 혼합신호들을 독립요소분석(ICA)을 통해 음원 신호들로 분리하고, 상기 분리된 음원 신호들의 방향정보(DOA)를 추출하는 음원분리기와, 상기 음원분리기를 통해 분리된 음원 신호들을 각각의 정규화된 대수 우도 확률 값으로 산출하는 음성인식기와, 상기 음원분리기로부터 분리된 각 음원에 대해 추정된 방향정보와 상기 음성인식기를 통해 산출된 각 음원의 정규화된 대수 우도 확률값에 기반한 음성 신호 식별의 신뢰도를 이용하여 사용자의 음성 신호에 해당하는 음원을 식별하는 사용자 음성신호 식별기 를 포함하는 음원분리 및 음원식별을 이용한 음성인식 장치
2 2
제 1항에 있어서, 상기 사용자 음성 신호 식별기는, 상기 방향 정보와, 각 음원의 정규화된 대수 우도 확률값에 기반한 음성 신호 식별의 신뢰도와, 잡음 음원의 위치를 고정된 위치로 정의하여 상기 잡음 음원의 레퍼런스 방향정보를 추정하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 장치
3 3
제 1항에 있어서, 상기 사용자 음성 신호 식별기를 통해 출력된 잡음원에 대한 방향 정보 값을 전달받아 기존 잡음 음원의 레퍼런스 방향 정보에 업데이트 시키는 레퍼런스 DOA 갱신부를 포함하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 장치
4 4
제1항에 있어서, 상기 음원 분리기는, 음원에서 마이크까지 음향 전달 경로 상의 임펄스 응답 값의 역함수 값에 고속 푸리에 변환(FFT)을 통하여 주파수 영역으로 변환하고, 마이크 입력 신호들을 주파수 영역으로 변환한 뒤 분리행렬을 독립요소분석(ICA) 알고리즘의 기 설정된 규칙에 대한 반복 수행을 통하여 값을 산출하여, 상기 산출된 값에 역푸리에 변환에 의해 시간영역의 분리된 음원 신호를 산출하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 장치
5 5
삭제
6 6
제1항에 있어서, 상기 음성인식기는, 상기 음원 분리기로부터 출력된 각 음원들에 대해 기설정된 구간 단위마다의 특징벡터를 계산하고, 상기 계산된 특징벡터들과 은닉 마르코프 모델(HMM)로 구성된 탐색 네트워크를 토대로 정규화 대수 우도 값을 산출하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 장치
7 7
제6항에 있어서, 상기 음성인식기는, 상기 정규화 대수 우도값 중에서 최대 우도 확률값이 인 경우, k 번째 분리 음원을 사용자 음성 신호로 결정하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 장치
8 8
제6항에 있어서, 상기 사용자 음성신호 식별기는, 상기 정규화 대수 우도값에 해당하는 음원을 사용자의 음성이라 판단할 수 있는 신뢰도 정보로서, 상기 정규화 대수 우도값 중에서 최대치와 두 번째 최대치 값들 간의 차의 절대값으로서 신뢰도를 산출하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 장치
9 9
제8항에 있어서, 상기 사용자 음성신호 식별기는, 상기 산출된 신뢰도와 기 설정된 임계치와 비교하여, 상기 신뢰도가 임계치보다 큰 경우, 해당 신뢰도 음원의 음성인식결과에 해당하는 단어 또는 단어열을 사용자 음원으로 출력하고, 상기 신뢰도가 임계치보다 작을 경우에는, 최대 정규화 최대 우도 확률을 갖는 음원과 두 번째로 큰 우도 확률을 갖는 음원에 대해서 각각의 방향정보를 이용하여 음성 또는 잡음 여부를 판단하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 장치
10 10
제9항에 있어서, 상기 사용자 음성신호 식별기는, 상기 신뢰도가 임계치보다 작은 경우, 각 음원을 상기 잡음 음원들에 대한 레퍼런스 방향정보들과 차례로 비교하여 가장 가까운 잡음 음원 방향정보 값과의 차이를 계산한 후, 더 작은 값을 갖는 음원을 잡음 음원으로 판단하고, 나머지를 사용자의 음성으로 판단하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 장치
11 11
제9항에 있어서, 상기 사용자 음성신호 식별기는, 상기 신뢰도가 임계치보다 높은 경우, 상기 신뢰도에 해당하는 음원을 제외한 나머지 분리된 잡음 음원들에 대한 방향 정보를 레퍼런스 DOA 갱신부에 전달하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 장치
12 12
제 11항에 있어서, 상기 레퍼런스 DOA 갱신부는, 상기 잡음 음원들에 대한 방향 정보와 기 저장된 레퍼런스 방향 정보와의 값을 비교하여 서로 가장 가까운 값들과의 업데이트를 수행하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 장치
13 13
적어도 두개의 마이크를 통해 각각 입력된 혼합신호들을 독립요소분석(ICA)을 통해 음원 신호들로 분리 및 상기 분리된 음원 신호들의 방향정보(DOA)를 추출하는 음원 분리 과정과, 상기 분리된 음원 신호들을 각각의 정규화된 대수 우도 확률 값으로 산출하는 음성인식 과정과, 상기 분리된 음원 신호들의 방향정보와 각 음원의 정규화된 최대 우도 확률 값에 기반한 음성 신호의 신뢰도를 이용하여 사용자의 음성 신호에 해당하는 음원을 식별하는 과정 을 포함하는 음원분리 및 음원식별을 이용한 음성인식 방법
14 14
제 13항에 있어서, 상기 음원을 식별하는 과정은, 상기 방향 정보와, 각 음원의 정규화된 최대 우도 확률값에 기반한 음성 신호 식별의 신뢰도와, 잡음 음원의 위치를 고정된 위치로 정의하여 상기 잡음 음원의 레퍼런스 방향정보를 추정하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 방법
15 15
삭제
16 16
제13항에 있어서, 상기 음성 인식 과정은,상기 분리된 음원 신호들에 대해 기설정된 구간 단위마다의 특징벡터를 계산하는 과정과, 상기 계산된 특징벡터들과 은닉 마르코프 모델(HMM)로 구성된 탐색 네트워크를 토대로 정규화 대수 우도 값을 산출하는 과정 을 포함하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 방법
17 17
제16항에 있어서, 상기 음성 인식 과정은, 상기 정규화 대수 우도값 중에서 최대 우도 확률값이 인 경우, k 번째 분리 음원을 사용자 음성 신호로 결정하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 방법
18 18
제13항에 있어서, 상기 음원을 식별하는 과정은, 상기 정규화 대수 우도값 에 해당하는 음원을 사용자의 음성이라 판단할 수 있는 신뢰도 정보로서, 상기 정규화 대수 우도값 중에서 최대치와 두 번째 최대치 값들 간의 차의 절대값을 통하여 신뢰도를 산출하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 방법
19 19
제18항에 있어서, 상기 음원을 식별하는 과정은, 상기 산출된 신뢰도와 기 설정된 임계치와 비교하여, 상기 신뢰도가 임계치보다 큰 경우, 해당 신뢰도 음원의 음성인식결과에 해당하는 단어 또는 단어열을 사용자 음원으로 출력하는 과정과, 상기 신뢰도가 임계치보다 작을 경우에는, 최대 정규화 최대 우도 확률을 갖는 음원과 두 번째로 큰 우도 확률을 갖는 음원에 대해서 각각의 방향정보를 이용하여 음성 또는 잡음 여부를 판단하는 과정 을 더 포함하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 방법
20 20
제19항에 있어서, 상기 음원을 식별하는 과정은, 상기 신뢰도가 임계치보다 작은 경우, 각 음원을 상기 잡음 음원들에 대한 레퍼런스 방향정보들과 차례로 비교하여 가장 가까운 잡음 음원 방향정보 값과의 차이를 계산한 후, 더 작은 값을 갖는 음원을 잡음 음원으로 판단하고, 나머지를 사용자의 음성으로 판단하는 것을 특징으로 하는 음원분리 및 음원식별을 이용한 음성인식 방법
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
패밀리 정보가 없습니다

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2010070274 US 미국 DOCDBFAMILY
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 지식경제부 및 한국정보통신연구진흥원 한국전자통신연구원 IT성장동력기술개발사업 휴대형 한/영 자동통역 기술개발