맞춤기술찾기

이전대상기술

가우시안 혼합모델을 이용한 화자 인식 시스템 및 추가 학습 발화 선택 방법

  • 기술번호 : KST2022013899
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 본 발명은 화자 인식 시스템 및 화자 인식 시스템에서 화자 모델을 보완하기 위한 추가 학습 발화 선택 방법에 관한 것으로서, 화자로부터 수신한 음성신호를 이용하여 상기 화자가 기등록된 사용자인지 여부를 판단하는 화자인식장치는 상기 화자로부터 음성신호를 수신하는 음성수신부, 수신한 상기 음성신호에서 주파수 특징을 추출하는 전처리부, 추출된 상기 주파수 특징을 이용하여 상기 화자가 기등록된 사용자인지 여부를 판단하는 화자인식부 및 상기 음성수신부, 상기 전처리부 및 상기 화자인식부의 동작을 제어하는 제어부를 포함하되, 상기 제어부는, 기등록된 사용자 여부 판단을 위해 상기 기등록된 사용자의 제 1 음성신호에서 추출한 제 1 주파수 특징을 포함하는 제 1 사용자 모델을 생성하고, 생성된 상기 제 1 사용자 모델을 데이터베이스에 저장하도록 제어하며, 상기 음성수신부가 상기 화자로부터 제 2 음성신호를 수신하도록 제어하고, 상기 전처리부가 수신된 상기 제 2 음성신호에서 제 2 주파수 특징을 추출하도록 제어하며, 상기 화자인식부가, 저장된 상기 제 1 사용자 모델에 포함된 상기 제 1 주파수 특징과 상기 제 2 주파수 특징의 일치 여부에 따라 상기 화자가 상기 기등록된 사용자인지 여부를 판단하도록 제어하고, 상기 음성수신부가 상기 기등록된 사용자로부터 제 3 음성신호를 수신한 경우, 수신된 상기 제 3 음성신호를 이용하여 상기 제 1 사용자 모델을 갱신하는 것을 특징으로 한다.
Int. CL G10L 17/02 (2013.01.01) G10L 17/04 (2013.01.01) G10L 17/14 (2013.01.01)
CPC G10L 17/02(2013.01) G10L 17/04(2013.01) G10L 17/14(2013.01)
출원번호/일자 1020150063190 (2015.05.06)
출원인 서울시립대학교 산학협력단
등록번호/일자 10-1618512-0000 (2016.04.28)
공개번호/일자
공고번호/일자 (20160509) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2015.05.06)
심사청구항수 18

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울시립대학교 산학협력단 대한민국 서울특별시 동대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 양일호 대한민국 서울특별시 강동구
2 김명재 대한민국 서울특별시 성동구
3 허희수 대한민국 경기도 의정부시
4 유하진 대한민국 서울특별시 동대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 아이퍼스 대한민국 서울특별시 강남구 삼성로**길*, *층(대치동 삼성빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서울시립대학교 산학협력단 대한민국 서울특별시 동대문구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2015.05.06 수리 (Accepted) 1-1-2015-0435032-52
2 의견제출통지서
Notification of reason for refusal
2016.03.22 발송처리완료 (Completion of Transmission) 9-5-2016-0210947-28
3 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2016.03.29 수리 (Accepted) 1-1-2016-0299876-46
4 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2016.03.29 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2016-0299869-26
5 등록결정서
Decision to grant
2016.04.22 발송처리완료 (Completion of Transmission) 9-5-2016-0296063-76
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2017.01.17 수리 (Accepted) 4-1-2017-5009116-18
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.09.10 수리 (Accepted) 4-1-2019-5191631-69
8 특허고객번호 정보변경(경정)신고서·정정신고서
2022.01.25 수리 (Accepted) 4-1-2022-5020718-60
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
화자로부터 수신한 음성신호를 이용하여 상기 화자가 기등록된 사용자인지 여부를 판단하는 화자인식장치에 있어서,상기 화자인식장치는,상기 화자로부터 음성신호를 수신하는 음성수신부;수신한 상기 음성신호에서 주파수 특징을 추출하는 전처리부;추출된 상기 주파수 특징을 이용하여 상기 화자가 기등록된 사용자인지 여부를 판단하는 화자인식부; 및 상기 음성수신부, 상기 전처리부 및 상기 화자인식부의 동작을 제어하는 제어부;를 포함하되,상기 제어부는, 기등록된 사용자 여부 판단을 위해 상기 기등록된 사용자의 제 1 음성신호에서 추출한 제 1 주파수 특징을 포함하는 제 1 사용자 모델을 생성하고, 생성된 상기 제 1 사용자 모델을 데이터베이스에 저장하도록 제어하며,상기 음성수신부가 상기 화자로부터 제 2 음성신호를 수신하도록 제어하고,상기 전처리부가 수신된 상기 제 2 음성신호에서 제 2 주파수 특징을 추출하도록 제어하며,상기 화자인식부가, 저장된 상기 제 1 사용자 모델에 포함된 상기 제 1 주파수 특징과 상기 제 2 주파수 특징의 일치 여부에 따라 상기 화자가 상기 기등록된 사용자인지 여부를 판단하도록 제어하고,상기 음성수신부가 상기 기등록된 사용자로부터 제 3 음성신호를 수신한 경우,수신된 상기 제 3 음성신호를 이용하여 상기 제 1 사용자 모델을 갱신하는 것을 특징으로 하는, 화자인식장치
2 2
제 1 항에 있어서,상기 제어부는 상기 데이터베이스에 저장된 배경 화자 모델(Universal background model)를 상기 제 1 음성신호를 이용한 적응학습을 통해 상기 제 1 사용자 모델을 생성하는 것을 특징으로 하는, 화자인식장치
3 3
제 2 항에 있어서,상기 제어부는 상기 데이터베이스에 저장된 상기 제 1 사용자 모델을, 상기 제 3 음성신호를 이용한 적응학습을 통해 갱신하는 것을 특징으로 하는, 화자인식장치
4 4
제 3 항에 있어서,상기 제 1 사용자 모델의 갱신을 위해, 상기 제 1 사용자 모델의 보완을 위한 제 1 음소를 탐색하는 부족음소탐색부;를 더 포함하고,상기 부족음소탐색부는 상기 제 1 사용자 모델을 상기 배경 화자 모델과 비교하여 상기 제 1 음소를 탐색하며,상기 음성수신부는 탐색된 상기 제 1 음소를 포함하는 제 3 음성신호를 상기 기등록된 사용자로부터 수신하고,상기 제어부는 수신한 제 3 음성신호를 이용하여 상기 제 1 사용자 모델을 갱신하는 것을 특징으로 하는, 화자인식장치
5 5
제 4 항에 있어서,상기 부족음소탐색부는,상기 제 1 음소를 탐색하기 위해, 상기 제 1 사용자 모델에, 상기 배경 화자 모델에 포함된 제 1 가우시안 컴퍼넌트에 대응되는 제 2 가우시안 컴퍼넌트가 포함되었는지 여부를 판단하고,상기 제 2 가우시안 컴퍼넌트가 상기 제 1 사용자 모델에 불포함시,상기 제 1 가우시안 컴퍼넌트에 해당하는 음소를 상기 제 1 음소로 결정하는 것을 특징으로 하는, 화자인식장치
6 6
제 4 항에 있어서,상기 부족음소탐색부는,상기 배경 화자 모델에 포함된 제 1 가우시안 컴퍼넌트와 상기 제 1 가우시안에 대응되고, 상기 제 1 사용자 모델에 포함된 제 2 가우시안 컴퍼넌트를 비교하고,상기 제 2 가우시안 컴퍼넌트의 분산비율이 상기 제 1 가우시안 컴퍼넌트의 분산비율보다 작은 경우,상기 제 1 가우시안 컴퍼넌트에 해당하는 음소를 상기 제 1 음소로 결정하는 것을 특징으로 하는, 화자인식장치
7 7
제 4 항에 있어서,상기 제어부는,갱신 전의 제 1 사용자 모델의 보완을 위해 상기 부족음소탐색부가 상기 제 1 음소를 탐색하도록 제어하고,탐색된 상기 제 1 음소를 포함하는 상기 제 3 음성신호를 상기 음성수신부가 상기 기등록된 사용자로부터 수신하도록 제어하며,갱신전의 제 1 사용자 모델을 수신된 상기 제 3 음성신호를 이용한 적응학습을 통해 갱신하는 것을 특징으로 하는, 화자 인식 장치
8 8
제 4 항에 있어서,상기 제어부는,갱신 전의 제 1 사용자 모델의 보완을 위해 상기 부족음소탐색부가 상기 제 1 음소를 탐색하도록 제어하고,탐색된 상기 제 1 음소를 포함하는 상기 제 3 음성신호를 상기 음성수신부가 상기 기등록된 사용자로부터 수신하도록 제어하며,상기 제 1 음성신호와 상기 제 3 음성신호를 결합하여 제 5 음성신호를 생성하고,상기 데이터베이스에 저장된 배경 화자 모델을 상기 제 5 음성신호를 이용한 적응학습을 통해 갱신하는 것을 특징으로 하는, 화자 인식 장치
9 9
제 3 항에 있어서,상기 제어부는,상기 제 3 음성신호를 상기 기등록된 사용자에게 발화 요구를 하여 상기 음성수신부를 통해 수신하도록 제어하는 것을 특징으로 하는, 화자인식장치
10 10
제 3 항에 있어서,상기 제어부는,상기 음성수신부를 통해 상기 기등록된 사용자의 일상생활 중의 제 4 음성신호를 수신하도록 제어하고,상기 수신된 제 4 음성신호를 상기 데이터베이스에 저장하며,상기 저장된 제 4 음성신호를 상기 제 3 음성신호로 이용하여 상기 제 1 사용자 모델을 갱신하는 것을 특징으로 하는, 화자인식장치
11 11
제어부가 데이터베이스에 배경 화자 모델(Universal background model)를 저장하는 제 1 단계;음성수신부가 제 1 음성신호를 수신하는 제 2 단계;상기 제어부가 수신된 제 1 음성신호를 이용하여 사용자를 등록하는 제 3 단계;상기 제어부가, 수신된 상기 제 1 음성신호를 상기 배경 화자 모델에 적응하여 등록된 사용자에 관한 제 1 사용자 모델을 생성하는 제 4 단계;상기 제어부가, 생성된 상기 제 1 사용자 모델의 보완을 위한 제 1 음소를 탐색하는 제 5 단계;상기 음성수신부가 상기 제 1 음소를 포함하는 제 2 음성신호를 상기 사용자로부터 수신하는 제 6 단계; 및상기 제어부가, 수신된 상기 제 2 음성신호를 이용한 적응학습을 통해 상기 제 1 사용자 모델을 갱신하는 제 7 단계;를 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
12 12
제 11 항에 있어서,상기 제 4 단계는,상기 제어부가 수신한 상기 제 1 음성신호를 분할하는 단계;상기 제어부가 분할된 상기 제 1 음성신호에서 특징 벡터를 추출하는 단계; 및상기 제어부가 상기 배경 화자 모델을 추출된 상기 특징 벡터에 맞게 변형 적응하는 단계;를 더 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
13 13
제 11 항에 있어서,상기 제 5 단계는,부족음소탐색부가 상기 제 1 사용자 모델에, 상기 배경 화자 모델에 포함된 제 1 가우시안 컴퍼넌트에 대응되는 제 2 가우시안 컴퍼넌트가 포함되었는지 여부를 판단하는 단계; 및상기 제 2 가우시안 컴퍼넌트가 상기 제 1 사용자 모델에 불포함시, 상기 제 1 가우시안 컴퍼넌트에 해당하는 음소를 상기 제 1 음소로 결정하는 단계;를 더 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
14 14
제 11 항에 있어서,부족음소탐색부가 상기 배경 화자 모델에 포함된 제 1 가우시안 컴퍼넌트와 상기 제 1 가우시안에 대응되고, 상기 제 1 사용자 모델에 포함된 제 2 가우시안 컴퍼넌트를 비교하는 단계;상기 제 2 가우시안 컴퍼넌트의 분산비율이 상기 제 1 가우시안 컴퍼넌트의 분산비율보다 작은 경우,상기 제 1 가우시안 컴퍼넌트에 해당하는 음소를 상기 제 1 음소로 결정하는 단계;를 더 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
15 15
제 11 항에 있어서,상기 제 6 단계는,상기 제어부가 상기 제 2 음성신호를 상기 사용자에게 발화 요구를 하는 단계;를 더 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
16 16
제 11 항에 있어서,상기 제 6 단계는,상기 음성수신부가 상기 사용자의 일상생활에서 제 3 음성신호를 수신하는 단계;상기 제어부가 수신된 상기 제 3 음성신호를 상기 데이터베이스에 저장하는 단계; 및상기 제어부가 저장된 상기 제 3 음성신호를 가공하여 상기 제 2 음성신호로 변환하는 단계;를 더 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
17 17
제 11 항에 있어서,상기 제 7 단계는,상기 제어부가 상기 제 1 음성신호와 상기 제 2 음성신호를 결합하여 제 4 음성신호를 생성하는 단계;상기 제어부가 상기 배경 화자 모델에 상기 제 4 음성신호를 적응하여 제 2 사용자 모델을 생성하는 단계; 및상기 제어부가 상기 제 1 사용자 모델을 상기 제 2 사용자 모델로 대체 시키는 단계;를 더 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
18 18
화자인식을 위해 사용자 모델을 보완하는 방법을 수행하기 위하여 디지털 처리 장치에 의해 실행될 수 있는 명령어들의 프로그램이 유형적으로 구현되어 있고, 상기 디지털 처리 장치에 의해 판독될 수 있는 기록매체에 있어서,제어부가 데이터베이스에 배경 화자 모델(Universal background model)를 저장하는 기능;음성수신부가 제 1 음성신호를 수신하는 기능;상기 제어부가 수신된 제 1 음성신호를 이용하여 사용자를 등록하는 기능;상기 제어부가 수신된 상기 제 1 음성신호를 상기 배경 화자 모델에 적응하여 등록된 사용자에 관한 제 1 사용자 모델을 생성하는 기능;상기 제어부가 생성된 상기 제 1 사용자 모델의 보완을 위한 제 1 음소를 탐색하는 기능;상기 음성수신부가 상기 제 1 음소를 포함하는 제 2 음성신호를 상기 사용자로부터 수신하는 기능; 및상기 제어부가 상기 수신된 제 2 음성신호를 이용한 적응학습을 통해 상기 제 1 사용자 모델을 갱신하는 기능;을 포함하되,상기 제어부가 생성된 상기 제 1 사용자 모델의 보완을 위한 제 1 음소를 탐색하는 기능은,부족음소탐색부가 상기 제 1 사용자 모델에, 상기 배경 화자 모델에 포함된 제 1 가우시안 컴퍼넌트에 대응되는 제 2 가우시안 컴퍼넌트가 포함되었는지 여부를 판단하는 기능;상기 제 2 가우시안 컴퍼넌트가 상기 제 1 사용자 모델에 불포함시, 상기 제 1 가우시안 컴퍼넌트에 해당하는 음소를 상기 제 1 음소로 결정하는 기능;상기 제 2 가우시안 컴퍼넌트가 상기 제 1 사용자 모델에 포함시, 상기 제 1 가우시안 컴퍼넌트와 상기 제 2 가우시안 컴퍼넌트를 비교하는 기능; 및상기 제 2 가우시안 컴퍼넌트의 분산비율이 상기 제 1 가우시안 컴퍼넌트의 분산비율보다 작은 경우, 상기 제 1 가우시안 컴퍼넌트에 해당하는 음소를 상기 제 1 음소로 결정하는 기능;을 실행시키도록 하는 기록매체
19 19
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 산업통상자원부 한국전자통신연구원 산업융합원천기술개발사업(신산업) 실환경하에서 인지센서네트워크(PSN)기반 지능형 로봇의 사용자 정보(신원, 행동, 위치)자동 추출 및 인식 기술