맞춤기술찾기

이전대상기술

음성 인식 시스템 및 방법

  • 기술번호 : KST2014034730
  • 담당센터 : 경기기술혁신센터
  • 전화번호 : 031-8006-1570
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 음성 인식 시스템 및 방법에 관한 것으로서, 이 시스템은, 사용자를 촬영하여 비전 정보를 생성하고, 사용자로부터 발화된 음성을 인식하여 생성된 인식 단어 정보와 비전 정보에 따라 인식 단어 정보의 채택 여부를 결정하는 영상 기반 음성 인식 장치를 포함한다. 본 발명에 의하면, 사용자를 촬영한 비전 정보와 사용자로부터 발화된 음성을 함께 이용하여 사용자의 발화 단어를 인식함으로써 오인식이 발생할 확률이 낮아져 음성 인식 시스템 성능을 향상시킬 수 있다. 음성 인식, 비전 정보, 입술 모양, 특징 요소, 음소 그룹
Int. CL G10L 15/02 (2006.01)
CPC G10L 15/25(2013.01)G10L 15/25(2013.01)G10L 15/25(2013.01)G10L 15/25(2013.01)
출원번호/일자 1020090126406 (2009.12.17)
출원인 한국생산기술연구원
등록번호/일자 10-1092489-0000 (2011.12.05)
공개번호/일자 10-2011-0069605 (2011.06.23) 문서열기
공고번호/일자 (20111213) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2009.12.17)
심사청구항수 16

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국생산기술연구원 대한민국 충청남도 천안시 서북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 고우현 대한민국 인천광역시 부평구
2 지상훈 대한민국 서울특별시 서초구
3 남경태 대한민국 경기 용인시 기흥구
4 이상무 대한민국 경기 용인시 기흥구
5 손웅희 대한민국 경기 성남시 분당구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인명인 대한민국 서울특별시 강남구 테헤란로*길 **, *층(역삼동, 두원빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국생산기술연구원 충청남도 천안시 서북구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2009.12.17 수리 (Accepted) 1-1-2009-0782662-48
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.08.30 수리 (Accepted) 4-1-2010-5161401-06
3 선행기술조사의뢰서
Request for Prior Art Search
2010.10.07 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2010.11.15 수리 (Accepted) 9-1-2010-0070551-01
5 의견제출통지서
Notification of reason for refusal
2011.03.10 발송처리완료 (Completion of Transmission) 9-5-2011-0133691-12
6 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2011.05.11 수리 (Accepted) 1-1-2011-0346586-19
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.06.09 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2011-0435169-59
8 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.06.09 수리 (Accepted) 1-1-2011-0435167-68
9 등록결정서
Decision to grant
2011.11.30 발송처리완료 (Completion of Transmission) 9-5-2011-0706733-26
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.04.02 수리 (Accepted) 4-1-2012-5068733-13
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.04.26 수리 (Accepted) 4-1-2012-5090658-47
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.01.29 수리 (Accepted) 4-1-2013-5017806-08
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.01.16 수리 (Accepted) 4-1-2015-5006834-98
14 출원인정보변경(경정)신고서
Notification of change of applicant's information
2018.07.02 수리 (Accepted) 4-1-2018-5123030-77
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
사용자를 촬영하여 비전 정보를 생성하고, 상기 사용자로부터 발화된 음성을 인식하여 생성된 인식 단어 정보와 상기 비전 정보에 따라 상기 인식 단어 정보의 채택 여부를 결정하는 영상 기반 음성 인식 장치 를 포함하고, 상기 영상 기반 음성 인식 장치는 상기 인식 단어 정보에서 제1 음소 순서 정보를 추출하고, 상기 비전 정보에서 제2 음소 순서 정보를 추출하며, 상기 제1 및 제2 음소 순서 정보에 따라 상기 인식 단어 정보의 채택 여부를 결정하며, 상기 영상 기반 음성 인식 장치는, 상기 인식 단어 정보의 아스키 코드를 분석하여 음절별 모음을 추출하고, 상기 추출된 모음에 대응하는 음소 그룹을 결정하며, 상기 결정된 음소 그룹에 따라 상기 제1 음소 순서 정보를 생성하는 음성 인식 시스템
2 2
제1항에서, 상기 사용자로부터 발화된 음성을 인식하여 상기 인식 단어 정보를 생성하고 상기 인식 단어 정보를 상기 영상 기반 음성 인식 장치에 제공하는 음성 기반 음성 인식 장치를 더 포함하는 음성 인식 시스템
3 3
제1항에서, 상기 영상 기반 음성 인식 장치는 상기 비전 정보로부터 상기 사용자가 발화한 모음을 추출하여 음소 그룹별로 분류하는 음성 인식 시스템
4 4
제3항에서, 상기 음소 그룹은 각 모음의 특징 요소의 유사도에 따라 나뉘는 음성 인식 시스템
5 5
삭제
6 6
삭제
7 7
제1항에서, 상기 영상 기반 음성 인식 장치는, 상기 비전 정보를 기초로 입술 모양의 특징 요소의 값을 계산하고, 상기 계산된 특징 요소 값에 대응하는 음소 그룹에 따라 상기 제2 음소 순서 정보를 생성하는 음성 인식 시스템
8 8
제7항에서, 상기 특징 요소는 입술 폭, 입술 높이, 상기 입술 폭과 상기 입술 높이의 비율 및 입술 면적 중 적어도 하나를 포함하는 음성 인식 시스템
9 9
제7항에서, 상기 영상 기반 음성 인식 장치는, 상기 특징 요소에 기초한 특징 요소 공간에 각 음소 그룹을 구분하여 두고 최대 우도 값을 이용하여 상기 계산된 특징 요소 값에 대응하는 음소 그룹을 추출하는 음성 인식 시스템
10 10
제1항 내지 제4항 및 제7항 내지 제9항 중 어느 한 항의 음성 인식 시스템을 포함하는 로봇 시스템
11 11
제1항 내지 제4항 및 제7항 내지 제9항 중 어느 한 항의 음성 인식 시스템을 포함하는 대화 시스템
12 12
사용자를 촬영하여 비전 정보를 생성하는 단계, 그리고 상기 사용자로부터 발화된 음성 신호를 인식하여 생성된 인식 단어 정보와 상기 비전 정보에 따라 상기 인식 단어 정보의 채택 여부를 결정하는 단계 를 포함하고, 상기 결정 단계는, 상기 인식 단어 정보에서 제1 음소 순서 정보를 추출하는 단계, 상기 비전 정보에서 제2 음소 순서 정보를 추출하는 단계, 그리고 상기 제1 및 제2 음소 순서 정보에 따라 상기 인식 단어 정보의 채택 여부를 결정하는 단계를 포함하며, 상기 제1 음소 순서 정보 추출 단계는, 상기 인식 단어 정보의 아스키 코드를 분석하여 음절별 모음을 추출하는 단계, 상기 추출된 모음에 대응하는 음소 그룹을 결정하는 단계, 그리고 상기 결정된 음소 그룹에 따라 상기 제1 음소 순서 정보를 생성하는 단계를 포함하는 음성 인식 방법
13 13
삭제
14 14
제12항에서, 상기 결정 단계는 상기 비전 정보로부터 상기 사용자가 발화한 모음을 추출하여 음소 그룹별로 분류하는 단계를 포함하는 음성 인식 방법
15 15
제14항에서, 상기 음소 그룹은 각 모음의 특징 요소의 유사도에 따라 나뉘는 음성 인식 방법
16 16
삭제
17 17
삭제
18 18
제12항에서, 상기 제2 음소 순서 정보 추출 단계는, 상기 비전 정보를 기초로 입술 모양의 특징 요소의 값을 계산하는 단계, 그리고 상기 계산된 특징 요소 값에 대응하는 음소 그룹에 따라 상기 제2 음소 순서 정보를 생성하는 단계를 포함하는 음성 인식 방법
19 19
제18항에서, 상기 특징 요소는 입술 폭, 입술 높이, 상기 입술 폭과 상기 입술 높이의 비율 및 입술 면적 중 적어도 하나를 포함하는 음성 인식 방법
20 20
제18항에서, 상기 제2 음소 순서 정보 추출 단계는 상기 특징 요소에 기초한 특징 요소 공간에 각 음소 그룹을 구분하여 두고 최대 우도 값을 이용하여 상기 계산된 특징 요소 값에 대응하는 음소 그룹을 추출하는 단계를 더 포함하는 음성 인식 방법
21 21
컴퓨터에 제12항, 제14항, 제15항, 그리고 제18항 내지 제20항 중 어느 한 항의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.