맞춤기술찾기

이전대상기술

온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치

  • 기술번호 : KST2015096006
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치에 관한 것으로서, 가정용 서비스 로봇에 있어서 화자의 음성에 관한 데이터를 미리 설정할 필요가 없고, 시간이나 환경변화에 따라 등록되어 있는 화자에 대한 음성 데이터를 적응해 나갈 수 있으며, 일반적인 잡음에 강인한 특성을 갖추도록 하기 위하여 화자가 음성을 이용하여 지속적으로 반응하도록 연속적으로 요구하는 컨텐츠를 이용하여 화자의 기본데이터 및 화자의 음성 데이터를 입력받는 단계; 음성 데이터에서 화자의 음성만을 추출하는 단계; 화자의 음성으로부터 인식에 필요한 특징 벡터를 추출하는 단계; 상기 추출한 특징 벡터로부터 화자 모델을 만드는 단계; 및, 입력된 음성으로부터 파악된 정보에 기초하여 화자 모델에 저장된 화자를 인식하는 단계를 포함하는 화자 인식 방법을 제공한다. 가정용 서비스 로봇, 화자 인식, 음성 인식, 컨텐츠
Int. CL G10L 17/22 (2013.01) G10L 15/02 (2013.01) G10L 17/02 (2013.01) G10L 17/04 (2013.01)
CPC G10L 17/04(2013.01) G10L 17/04(2013.01) G10L 17/04(2013.01) G10L 17/04(2013.01)
출원번호/일자 1020060087004 (2006.09.08)
출원인 한국전자통신연구원
등록번호/일자 10-0826875-0000 (2008.04.25)
공개번호/일자 10-2008-0023030 (2008.03.12) 문서열기
공고번호/일자 (20080506) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2006.09.08)
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 곽근창 대한민국 대전 서구
2 배경숙 대한민국 경기 안양시 만안구
3 윤호섭 대한민국 대전 유성구
4 김혜진 대한민국 인천 서구
5 지수영 대한민국 대전 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인씨엔에스 대한민국 서울 강남구 언주로 **길 **, 대림아크로텔 *층(도곡동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2006.09.08 수리 (Accepted) 1-1-2006-0651820-13
2 명세서등보정서
Amendment to Description, etc.
2007.02.28 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2007-0175722-49
3 선행기술조사의뢰서
Request for Prior Art Search
2007.06.07 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2007.07.11 수리 (Accepted) 9-1-2007-0038984-12
5 의견제출통지서
Notification of reason for refusal
2007.09.28 발송처리완료 (Completion of Transmission) 9-5-2007-0527945-72
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2007.11.12 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2007-0810791-52
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2007.11.12 수리 (Accepted) 1-1-2007-0810790-17
8 등록결정서
Decision to grant
2008.03.26 발송처리완료 (Completion of Transmission) 9-5-2008-0165872-81
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
화자가 음성을 이용하여 지속적으로 반응하도록 연속적으로 요구하는 컨텐츠를 이용하여 화자의 기본데이터 및 화자의 음성 데이터를 입력받는 단계;음성 데이터에서 화자의 음성만을 추출하는 단계;화자의 음성으로부터 인식에 필요한 특징 벡터를 추출하는 단계; 상기 추출한 특징 벡터로부터 화자 모델을 만드는 단계; 및, 입력된 음성으로부터 파악된 정보에 기초하여 화자 모델에 저장된 화자를 인식하는 단계를 포함하는 화자 인식 방법
2 2
제 1항에 있어서, 화자의 음성 데이터를 입력받는 단계 이전에 인식할 대상이 되는 화자의 기본 데이터를 등록받는 단계를 더 포함하는 것을 특징으로 하는 화자 인식 방법
3 3
제 2항에 있어서, 상기 화자의 기본 데이터는 화자의 호칭인 것을 특징으로 하는 화자 인식 방법
4 4
제 1항에 있어서, 상기 컨텐츠는 음악 컨텐츠, 오락 컨텐츠 또는 교육 컨텐츠 중에서 선택되는 어느 하나인 것을 특징으로 하는 화자 인식 방법
5 5
제 1항에 있어서, 상기 음성 데이터에서 화자의 음성만을 추출하는 단계는, 상기 음성 데이터에서 잡음을 제거하는 과정 및 상기 음성 데이터에서 컨텐츠에 해당되는 소리를 제거하는 과정을 포함하는 것을 특징으로 하는 화자 인식 방법
6 6
제 1항에 있어서, 화자의 음성으로부터 인식에 필요한 특징 벡터를 추출하는 단계는 멜 캠스트럽(MFCC)을 이용하는 추출법을 사용하는 것을 특징으로 하는 화자 인식 방법
7 7
제 1항에 있어서, 상기 추출한 특징 벡터로부터 화자 모델을 만드는 단계는 가우시안 혼합모델을 이용하여 화자 모델을 생성하는 것을 특징으로 하는 화자 인식 방법
8 8
제 1항에 있어서, 화자를 인식하는 단계에서 사용되는 입력된 음성으로부터 파악된 정보는 하기 수학식 2를 통하여 얻은 우도값이고, [수학식 2](여기서 화자 모델의 파라미터는 가중치, 평균, 공분산으로 구성된, i=1,2,
9 9
제 1항에 있어서,화자의 음성으로부터 추출된 인식에 필요한 특징 벡터를 이용하여 이미 생성된 화자 모델을 적응시켜 나가는 단계를 더 포함하는 것을 특징으로 하는 화자 인식 방법
10 10
제 9항에 있어서,이미 생성된 화자 모델을 적응시켜 나가는 단계는 임의의 등록된 화자의 j번째 가우시안 혼합모델은 다음 수학식 4에 의해 계산한 다음,[수학식 4]통계적인 계산에 의해 다음 수학식 5와 같이 각각 가중치, 평균, 분산 파라미터를 계산하여, 이들 파라미터들을 근거로 해서 적응계수와의 결합으로부터 j번째 혼합모델의 적응된 파라미터를 얻으므로써, 새로운 화자 모델을 생성하는 것을 특징으로 하는 화자 인식 방법
11 11
컴퓨터 프로그램이 적절히 프로그램된 시스템 상에서 실행될 때, 화자가 음성을 이용하여 지속적으로 반응하도록 연속적으로 요구하는 컨텐츠를 이용하여 화자의 기본데이터 및 화자의 음성 데이터를 입력받는 단계;음성 데이터에서 화자의 음성만을 추출하는 단계;화자의 음성으로부터 인식에 필요한 특징 벡터를 추출하는 단계;상기 추출한 특징 벡터로부터 화자 모델을 만드는 단계; 및,화자를 인식하는 단계를 실행함으로써, 상기 적절하게 프로그램된 시스템이 화자를 인식하도록 구현되는 컴퓨터 프로그램을 갖는 컴퓨터 판독가능한 저장매체
12 12
화자가 음성을 이용하여 지속적으로 반응할 수 잇도록 요구하는 컨텐츠를 포함하고 있는 컨텐츠 저장부;상기 컨텐츠를 외부로 출력하기 위한 출력수단; 컨텐츠 저장부에 저장되어 있는 컨텐츠가 상기 출력수단을 통하여 출력되는 과정을 제어하기 위한 컨텐츠 관리부;상기 컨텐츠에 대응하여 생성되는 화자의 음성 정보를 입력받기 위한 입력수단;상기 음성 신호로부터 상기 컨텐츠에 해당하는 소리를 제거하여 화자의 음성만을 추출하는 음성 추출부;상기 추출된 화자의 음성으로부터 특징 벡터를 생성하는 특징 벡터 추출부; 상기 추출된 벡터에 기초하여 화자의 화자모델을 작성하는 화자모델 작성부;상기 추출된 벡터에 기초하여 화자의 화자모델을 적응시키는 화자모델 훈련부;화자모델에 관한 정보를 저장하는 메모리부; 및상기 추출된 벡터에 기초하여 상기 메모리부에 저장되어 있는 화자 모델을 검색하여 화자를 인식하는 화자 인식부를 포함하여 구성되는 화자 인식 장치
13 13
제 12항에 있어서, 상기 음성 입력장치로 음성을 입력받은 화자 각자의 호칭을 식별표지로서 입력받기 위한 입력장치를 더 포함하는 것을 특징으로 하는 화자 인식 장치
14 14
제 12항에 있어서, 상기 콘텐츠 저장 장치에 저장된 컨텐츠는 음악 컨텐츠, 오락 컨텐츠 또는 교육 컨텐츠 중에서 선택되는 어느 하나인 것을 특징으로 하는 화자 인식 장치
15 15
제 12항 내지 제 14항 중 어느 한 항의 화자 인식 장치를 포함하여 구성되는 가정용 서비스 로봇
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US20080065380 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2008065380 US 미국 DOCDBFAMILY
국가 R&D 정보가 없습니다.