요약 | 본 발명은 온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치에 관한 것으로서, 가정용 서비스 로봇에 있어서 화자의 음성에 관한 데이터를 미리 설정할 필요가 없고, 시간이나 환경변화에 따라 등록되어 있는 화자에 대한 음성 데이터를 적응해 나갈 수 있으며, 일반적인 잡음에 강인한 특성을 갖추도록 하기 위하여 화자가 음성을 이용하여 지속적으로 반응하도록 연속적으로 요구하는 컨텐츠를 이용하여 화자의 기본데이터 및 화자의 음성 데이터를 입력받는 단계; 음성 데이터에서 화자의 음성만을 추출하는 단계; 화자의 음성으로부터 인식에 필요한 특징 벡터를 추출하는 단계; 상기 추출한 특징 벡터로부터 화자 모델을 만드는 단계; 및, 입력된 음성으로부터 파악된 정보에 기초하여 화자 모델에 저장된 화자를 인식하는 단계를 포함하는 화자 인식 방법을 제공한다. 가정용 서비스 로봇, 화자 인식, 음성 인식, 컨텐츠 |
---|---|
Int. CL | G10L 17/22 (2013.01) G10L 15/02 (2013.01) G10L 17/02 (2013.01) G10L 17/04 (2013.01) |
CPC | G10L 17/04(2013.01) G10L 17/04(2013.01) G10L 17/04(2013.01) G10L 17/04(2013.01) |
출원번호/일자 | 1020060087004 (2006.09.08) |
출원인 | 한국전자통신연구원 |
등록번호/일자 | 10-0826875-0000 (2008.04.25) |
공개번호/일자 | 10-2008-0023030 (2008.03.12) 문서열기 |
공고번호/일자 | (20080506) 문서열기 |
국제출원번호/일자 | |
국제공개번호/일자 | |
우선권정보 | |
법적상태 | 소멸 |
심사진행상태 | 수리 |
심판사항 | |
구분 | |
원출원번호/일자 | |
관련 출원번호 | |
심사청구여부/일자 | Y (2006.09.08) |
심사청구항수 | 15 |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 한국전자통신연구원 | 대한민국 | 대전광역시 유성구 |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 곽근창 | 대한민국 | 대전 서구 |
2 | 배경숙 | 대한민국 | 경기 안양시 만안구 |
3 | 윤호섭 | 대한민국 | 대전 유성구 |
4 | 김혜진 | 대한민국 | 인천 서구 |
5 | 지수영 | 대한민국 | 대전 유성구 |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 특허법인씨엔에스 | 대한민국 | 서울 강남구 언주로 **길 **, 대림아크로텔 *층(도곡동) |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 한국전자통신연구원 | 대한민국 | 대전광역시 유성구 |
번호 | 서류명 | 접수/발송일자 | 처리상태 | 접수/발송번호 |
---|---|---|---|---|
1 | 특허출원서 Patent Application |
2006.09.08 | 수리 (Accepted) | 1-1-2006-0651820-13 |
2 | 명세서등보정서 Amendment to Description, etc. |
2007.02.28 | 보정승인간주 (Regarded as an acceptance of amendment) | 1-1-2007-0175722-49 |
3 | 선행기술조사의뢰서 Request for Prior Art Search |
2007.06.07 | 수리 (Accepted) | 9-1-9999-9999999-89 |
4 | 선행기술조사보고서 Report of Prior Art Search |
2007.07.11 | 수리 (Accepted) | 9-1-2007-0038984-12 |
5 | 의견제출통지서 Notification of reason for refusal |
2007.09.28 | 발송처리완료 (Completion of Transmission) | 9-5-2007-0527945-72 |
6 | [명세서등 보정]보정서 [Amendment to Description, etc.] Amendment |
2007.11.12 | 보정승인간주 (Regarded as an acceptance of amendment) | 1-1-2007-0810791-52 |
7 | [거절이유 등 통지에 따른 의견]의견(답변, 소명)서 [Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation) |
2007.11.12 | 수리 (Accepted) | 1-1-2007-0810790-17 |
8 | 등록결정서 Decision to grant |
2008.03.26 | 발송처리완료 (Completion of Transmission) | 9-5-2008-0165872-81 |
9 | 출원인정보변경(경정)신고서 Notification of change of applicant's information |
2009.08.04 | 수리 (Accepted) | 4-1-2009-5150899-36 |
10 | 출원인정보변경(경정)신고서 Notification of change of applicant's information |
2015.02.02 | 수리 (Accepted) | 4-1-2015-0006137-44 |
번호 | 청구항 |
---|---|
1 |
1 화자가 음성을 이용하여 지속적으로 반응하도록 연속적으로 요구하는 컨텐츠를 이용하여 화자의 기본데이터 및 화자의 음성 데이터를 입력받는 단계;음성 데이터에서 화자의 음성만을 추출하는 단계;화자의 음성으로부터 인식에 필요한 특징 벡터를 추출하는 단계; 상기 추출한 특징 벡터로부터 화자 모델을 만드는 단계; 및, 입력된 음성으로부터 파악된 정보에 기초하여 화자 모델에 저장된 화자를 인식하는 단계를 포함하는 화자 인식 방법 |
2 |
2 제 1항에 있어서, 화자의 음성 데이터를 입력받는 단계 이전에 인식할 대상이 되는 화자의 기본 데이터를 등록받는 단계를 더 포함하는 것을 특징으로 하는 화자 인식 방법 |
3 |
3 제 2항에 있어서, 상기 화자의 기본 데이터는 화자의 호칭인 것을 특징으로 하는 화자 인식 방법 |
4 |
4 제 1항에 있어서, 상기 컨텐츠는 음악 컨텐츠, 오락 컨텐츠 또는 교육 컨텐츠 중에서 선택되는 어느 하나인 것을 특징으로 하는 화자 인식 방법 |
5 |
5 제 1항에 있어서, 상기 음성 데이터에서 화자의 음성만을 추출하는 단계는, 상기 음성 데이터에서 잡음을 제거하는 과정 및 상기 음성 데이터에서 컨텐츠에 해당되는 소리를 제거하는 과정을 포함하는 것을 특징으로 하는 화자 인식 방법 |
6 |
6 제 1항에 있어서, 화자의 음성으로부터 인식에 필요한 특징 벡터를 추출하는 단계는 멜 캠스트럽(MFCC)을 이용하는 추출법을 사용하는 것을 특징으로 하는 화자 인식 방법 |
7 |
7 제 1항에 있어서, 상기 추출한 특징 벡터로부터 화자 모델을 만드는 단계는 가우시안 혼합모델을 이용하여 화자 모델을 생성하는 것을 특징으로 하는 화자 인식 방법 |
8 |
8 제 1항에 있어서, 화자를 인식하는 단계에서 사용되는 입력된 음성으로부터 파악된 정보는 하기 수학식 2를 통하여 얻은 우도값이고, [수학식 2](여기서 화자 모델의 파라미터는 가중치, 평균, 공분산으로 구성된, i=1,2, |
9 |
9 제 1항에 있어서,화자의 음성으로부터 추출된 인식에 필요한 특징 벡터를 이용하여 이미 생성된 화자 모델을 적응시켜 나가는 단계를 더 포함하는 것을 특징으로 하는 화자 인식 방법 |
10 |
10 제 9항에 있어서,이미 생성된 화자 모델을 적응시켜 나가는 단계는 임의의 등록된 화자의 j번째 가우시안 혼합모델은 다음 수학식 4에 의해 계산한 다음,[수학식 4]통계적인 계산에 의해 다음 수학식 5와 같이 각각 가중치, 평균, 분산 파라미터를 계산하여, 이들 파라미터들을 근거로 해서 적응계수와의 결합으로부터 j번째 혼합모델의 적응된 파라미터를 얻으므로써, 새로운 화자 모델을 생성하는 것을 특징으로 하는 화자 인식 방법 |
11 |
11 컴퓨터 프로그램이 적절히 프로그램된 시스템 상에서 실행될 때, 화자가 음성을 이용하여 지속적으로 반응하도록 연속적으로 요구하는 컨텐츠를 이용하여 화자의 기본데이터 및 화자의 음성 데이터를 입력받는 단계;음성 데이터에서 화자의 음성만을 추출하는 단계;화자의 음성으로부터 인식에 필요한 특징 벡터를 추출하는 단계;상기 추출한 특징 벡터로부터 화자 모델을 만드는 단계; 및,화자를 인식하는 단계를 실행함으로써, 상기 적절하게 프로그램된 시스템이 화자를 인식하도록 구현되는 컴퓨터 프로그램을 갖는 컴퓨터 판독가능한 저장매체 |
12 |
12 화자가 음성을 이용하여 지속적으로 반응할 수 잇도록 요구하는 컨텐츠를 포함하고 있는 컨텐츠 저장부;상기 컨텐츠를 외부로 출력하기 위한 출력수단; 컨텐츠 저장부에 저장되어 있는 컨텐츠가 상기 출력수단을 통하여 출력되는 과정을 제어하기 위한 컨텐츠 관리부;상기 컨텐츠에 대응하여 생성되는 화자의 음성 정보를 입력받기 위한 입력수단;상기 음성 신호로부터 상기 컨텐츠에 해당하는 소리를 제거하여 화자의 음성만을 추출하는 음성 추출부;상기 추출된 화자의 음성으로부터 특징 벡터를 생성하는 특징 벡터 추출부; 상기 추출된 벡터에 기초하여 화자의 화자모델을 작성하는 화자모델 작성부;상기 추출된 벡터에 기초하여 화자의 화자모델을 적응시키는 화자모델 훈련부;화자모델에 관한 정보를 저장하는 메모리부; 및상기 추출된 벡터에 기초하여 상기 메모리부에 저장되어 있는 화자 모델을 검색하여 화자를 인식하는 화자 인식부를 포함하여 구성되는 화자 인식 장치 |
13 |
13 제 12항에 있어서, 상기 음성 입력장치로 음성을 입력받은 화자 각자의 호칭을 식별표지로서 입력받기 위한 입력장치를 더 포함하는 것을 특징으로 하는 화자 인식 장치 |
14 |
14 제 12항에 있어서, 상기 콘텐츠 저장 장치에 저장된 컨텐츠는 음악 컨텐츠, 오락 컨텐츠 또는 교육 컨텐츠 중에서 선택되는 어느 하나인 것을 특징으로 하는 화자 인식 장치 |
15 |
15 제 12항 내지 제 14항 중 어느 한 항의 화자 인식 장치를 포함하여 구성되는 가정용 서비스 로봇 |
지정국 정보가 없습니다 |
---|
순번 | 패밀리번호 | 국가코드 | 국가명 | 종류 |
---|---|---|---|---|
1 | US20080065380 | US | 미국 | FAMILY |
순번 | 패밀리번호 | 국가코드 | 국가명 | 종류 |
---|---|---|---|---|
1 | US2008065380 | US | 미국 | DOCDBFAMILY |
국가 R&D 정보가 없습니다. |
---|
특허 등록번호 | 10-0826875-0000 |
---|
표시번호 | 사항 |
---|---|
1 |
출원 연월일 : 20060908 출원 번호 : 1020060087004 공고 연월일 : 20080506 공고 번호 : 특허결정(심결)연월일 : 20080326 청구범위의 항수 : 15 유별 : G10L 17/00 발명의 명칭 : 온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치 존속기간(예정)만료일 : 20150426 |
순위번호 | 사항 |
---|---|
1 |
(권리자) 한국전자통신연구원 대전광역시 유성구... |
제 1 - 3 년분 | 금 액 | 370,500 원 | 2008년 04월 28일 | 납입 |
제 4 년분 | 금 액 | 370,000 원 | 2011년 04월 11일 | 납입 |
제 5 년분 | 금 액 | 370,000 원 | 2012년 03월 30일 | 납입 |
제 6 년분 | 금 액 | 370,000 원 | 2013년 03월 25일 | 납입 |
제 7 년분 | 금 액 | 670,000 원 | 2014년 03월 27일 | 납입 |
번호 | 서류명 | 접수/발송일자 | 처리상태 | 접수/발송번호 |
---|---|---|---|---|
1 | 특허출원서 | 2006.09.08 | 수리 (Accepted) | 1-1-2006-0651820-13 |
2 | 명세서등보정서 | 2007.02.28 | 보정승인간주 (Regarded as an acceptance of amendment) | 1-1-2007-0175722-49 |
3 | 선행기술조사의뢰서 | 2007.06.07 | 수리 (Accepted) | 9-1-9999-9999999-89 |
4 | 선행기술조사보고서 | 2007.07.11 | 수리 (Accepted) | 9-1-2007-0038984-12 |
5 | 의견제출통지서 | 2007.09.28 | 발송처리완료 (Completion of Transmission) | 9-5-2007-0527945-72 |
6 | [명세서등 보정]보정서 | 2007.11.12 | 보정승인간주 (Regarded as an acceptance of amendment) | 1-1-2007-0810791-52 |
7 | [거절이유 등 통지에 따른 의견]의견(답변, 소명)서 | 2007.11.12 | 수리 (Accepted) | 1-1-2007-0810790-17 |
8 | 등록결정서 | 2008.03.26 | 발송처리완료 (Completion of Transmission) | 9-5-2008-0165872-81 |
9 | 출원인정보변경(경정)신고서 | 2009.08.04 | 수리 (Accepted) | 4-1-2009-5150899-36 |
10 | 출원인정보변경(경정)신고서 | 2015.02.02 | 수리 (Accepted) | 4-1-2015-0006137-44 |
기술정보가 없습니다 |
---|
과제고유번호 | 1440000506 |
---|---|
세부과제번호 | 2004-S-007 |
연구과제명 | URC를위한내장형컴포넌트기술개발및표준화 |
성과구분 | 등록 |
부처명 | 지식경제부 |
연구관리전문기관명 | 정보통신연구진흥원 |
연구주관기관명 | 한국전자통신연구원 |
성과제출연도 | 2005 |
연구기간 | 200402~200801 |
기여율 | 1 |
연구개발단계명 | 개발연구 |
6T분류명 | IT(정보기술) |
과제고유번호 | 1440000850 |
---|---|
세부과제번호 | 2004-S-038 |
연구과제명 | 무선통신통합기술개발 |
성과구분 | 출원 |
부처명 | 지식경제부 |
연구관리전문기관명 | 정보통신연구진흥원 |
연구주관기관명 | 한국전자통신연구원 |
성과제출연도 | 2005 |
연구기간 | 200403~200702 |
기여율 | 1 |
연구개발단계명 | 응용연구 |
6T분류명 | IT(정보기술) |
[1020070107682] | 멀티홉 무선 네트워크에서의 데이터 전송률의 향상을 위한최적의 데이터 전송 방법 | 새창보기 |
---|---|---|
[1020060114093] | 온톨로지간 유사개념 매핑 방법 및 그 장치 | 새창보기 |
[1020060113476] | 휴대인터넷 망에서의 IP 멀티캐스트 그룹의 가입 메시지범람을 방지하기 위한 BS 장치 및 그 방법 | 새창보기 |
[1020060095012] | 손 모양을 인식하는 방법 및 이를 위한 장치 | 새창보기 |
[1020060087004] | 온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치 | 새창보기 |
[1020060084815] | 특정 클래스 정보를 갖는 선형투영기반 ICA를 이용한얼굴인식 방법 및 그 시스템 | 새창보기 |
[1020060082304] | 웹 서비스로 구성된 비지니스 프로세스 자동 복구 장치 및방법 | 새창보기 |
[1020060081834] | 공통 라디얼 스터브를 이용한 강유전체 결합 선로형 위상변위기 | 새창보기 |
[1020060079023] | 적응적 서비스품질 미들웨어 시스템 및 그 시스템에서의서비스 지원 방법 | 새창보기 |
[1020060072691] | 네트워크 기반 로봇제어장치, 로봇 및 로봇제어방법 | 새창보기 |
[1020060070230] | 양손 검출 및 추적 방법 | 새창보기 |
[1020060067215] | 화상 처리 시스템에서의 제스처 인식 장치 및 방법 | 새창보기 |
[1020060065503] | 원격조정이 가능한 로봇을 이용한 보안 감시 시스템 및방법 | 새창보기 |
[1020060065474] | OWL-S와 웹 서비스를 이용한 BPEL4WS 생성시스템 및 그 방법 | 새창보기 |
[1020060056212] | 양자점 레이저 다이오드 및 그 제조방법 | 새창보기 |
[1020060055956] | 로봇의 무게중심 이동장치, 그 장치를 이용한 시스템 및방법 | 새창보기 |
[1020060054907] | 의미정보 기반 서비스 제공 시스템 및 방법 | 새창보기 |
[1020060054906] | BPEL4WS 프로세스를 칼라드 페트리넷으로 변환하는방법 및 그 장치 | 새창보기 |
[1020060054905] | 베이지안 네트워크와 상황정보를 이용하여 분산환경에서서비스를 모델링하는 방법 및 그 시스템 | 새창보기 |
[1020060054902] | 무선 통신 시스템 수신단의 검파 장치 | 새창보기 |
[1020060052751] | 직교주파수분할다중 기반 무선랜 수신기의 채널 추정 장치및 그 방법 | 새창보기 |
[1020060047114] | 무선 센서 네트워크 시스템 및 무선 센서 네트워킹 방법 | 새창보기 |
[1020060044258] | 패스토큰 기반 웹 서비스 캐싱 방법 | 새창보기 |
[1020060042575] | 모바일 RFⅠD 리더의 태그 신호 수신 장치 및 방법 | 새창보기 |
[1020060041672] | 홈네트워크 서비스 품질 보장을 위한 홈서버 장치 및 그를이용한 서비스 품질 보장 방법 | 새창보기 |
[1020060040128] | 애드혹 기반의 단거리전용통신을 이용한 무선중계 시스템및 그 방법 | 새창보기 |
[1020060039741] | 로봇 환경에서 음원 추적 시스템 및 방법 | 새창보기 |
[1020060037758] | 얼굴 영상을 이용한 사용자 인증 방법 및 장치 | 새창보기 |
[1020060037756] | 파장분할다중방식에 부반송파다중화 및 부반송파다중접속방식을 혼용한 광 전송 장치 및 광 가입자망 | 새창보기 |
[1020060033300] | 타인 차량 단말기 및 기지국과 무선통신하기 위한 차량단말기 및 그 방법 | 새창보기 |
[1020060028419] | 웹 서비스 프로세스를 하이버네이션시키고 복원하는 방법및 그 장치 | 새창보기 |
[1020060027117] | 가입자별 서비스 대역폭 관리 방법 및 이를 이용한 이더넷기반 수동형 광가입자 망 시스템 | 새창보기 |
[1020060001956] | 맞춤형 데이터 방송 서비스를 위한 메타데이터 구성방법과 그 기록매체, 이를이용한 데이터 방송 서비스 제공방법 및 시스템, 이를 수신하기 위한 사용자 단말 | 새창보기 |
[1020060001955] | 차량간 통신 시스템에서의 멀티 홉 라우팅을 위한 맥포워딩 방법 | 새창보기 |
[1020050121003] | 로봇 서비스 가용성 평가 방법 및 시스템 | 새창보기 |
[1020050119798] | 시스템 자동제어용 제스처 인식 장치 및 그 방법 | 새창보기 |
[1020050119019] | 네트워크 기반 지능형 서비스 로봇의 비전 처리 장치 및방법과 이를 이용한 시스템 | 새창보기 |
[1020050113251] | 연료 전지를 이용한 이동형 로봇 및 연료 공급 방법 | 새창보기 |
[1020050097114] | 단일 클럭으로 다중레이트를 지원하기 위한 코덱 장치 및그 방법 | 새창보기 |
[1020050095074] | MIMO-OFDM 시스템에서 직교코드로 부호화된임펄스 열을 이용한 훈련신호 생성 방법과 직교코드복호화를 이용한 채널 추정 방법 | 새창보기 |
[1020050047371] | 직교주파수분할다중 기반 수신기의 채널 추정 장치 및 그방법 | 새창보기 |
[KST2016000934][한국전자통신연구원] | 켑스트럼 특징벡터에 기반한 음성인식 장치 및 방법 | 새창보기 |
---|---|---|
[KST2019000112][한국전자통신연구원] | 다중 화자 데이터를 이용한 딥러닝 기반 음성 합성 장치 및 방법 | 새창보기 |
[KST2015080405][한국전자통신연구원] | 적응 반음소 모델을 이용한 음성인식 서비스 방법 | 새창보기 |
[KST2015082510][한국전자통신연구원] | 핵심어 인식 기반의 탐색 네트워크 제한을 이용한연속음성인식 장치 및 방법 | 새창보기 |
[KST2015089192][한국전자통신연구원] | 음성 인식 방법 및 장치 | 새창보기 |
[KST2014067340][한국전자통신연구원] | 대화형 차량정보서비스를 위한 대화처리 기술 | 새창보기 |
[KST2015096552][한국전자통신연구원] | 음성 특징의 적응에 의한 음성 인식기의 성능 개선 방법 | 새창보기 |
[KST2015095842][한국전자통신연구원] | 멀티모달 융합을 위한 환경변수 측정방법 | 새창보기 |
[KST2015093746][한국전자통신연구원] | 음성부호화기에서 양자화 오차의 상관관계 특성을 이용한피치 검색 방법 | 새창보기 |
[KST2015093857][한국전자통신연구원] | 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법 | 새창보기 |
[KST2019005090][한국전자통신연구원] | 강연 자동 동시 통역을 위한 피드백 장치 및 방법 | 새창보기 |
[KST2015091455][한국전자통신연구원] | 자동 번역 및 통역 장치 및 그 방법 | 새창보기 |
[KST2022000933][한국전자통신연구원] | 자기 지도 학습을 이용한 VAE-GAN 기반 발성 스타일 변환 방법 및 장치 | 새창보기 |
[KST2015076461][한국전자통신연구원] | 텍스트/음성변환기에서의최적합성단위열선정방법 | 새창보기 |
[KST2015079601][한국전자통신연구원] | 복수 단계 디코딩을 이용한 연속 숫자음 인식 시스템 | 새창보기 |
[KST2015101339][한국전자통신연구원] | 오디오/영상물의 음향적 장면분할방법 | 새창보기 |
[KST2015091805][한국전자통신연구원] | WFST를 이용한 음성 끝점 검출 장치 및 방법 | 새창보기 |
[KST2015099340][한국전자통신연구원] | 고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치 | 새창보기 |
[KST2022006160][한국전자통신연구원] | 자동음성인식을 위한 음성 데이터 생성 방법 | 새창보기 |
[KST2015074589][한국전자통신연구원] | 대어휘음성인식을위한후보단어추출장치및추출방법 | 새창보기 |
[KST2015077055][한국전자통신연구원] | 대표특징열을이용한프레임압축방법및그를이용한음성인식방법 | 새창보기 |
[KST2015089723][한국전자통신연구원] | 구구조를 고려한 음성 인식 방법 및 기록 매체. | 새창보기 |
[KST2022006002][한국전자통신연구원] | 음성인식을 위한 사전훈련 모델 기반 문장단위 발화검증 장치 및 그 방법 | 새창보기 |
[KST2016001072][한국전자통신연구원] | 음성 인식을 통한 전자책 제어 방법 및 그 장치 | 새창보기 |
[KST2015094907][한국전자통신연구원] | 키워드 기반 N-gram 언어모델 구축 방법 | 새창보기 |
[KST2015077370][한국전자통신연구원] | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 | 새창보기 |
[KST2015076875][한국전자통신연구원] | 화행 정보를 이용한 음성 인식 방법 | 새창보기 |
[KST2015101338][한국전자통신연구원] | 네트워크를 이용한 음성 언어 번역 시스템 및 그 방법 | 새창보기 |
[KST2015089156][한국전자통신연구원] | 멀티미디어 컨텐츠 검색 방법 및 장치 | 새창보기 |
[KST2015080186][한국전자통신연구원] | 자동음성인식시스템의 음성 2단 끝점검출 장치 및 그 방법 | 새창보기 |
심판사항 정보가 없습니다 |
---|