맞춤기술찾기

이전대상기술

음소레벨 로그우도 비율 분포와 음소 지속시간 분포에 의한단어음색 모델 기반 발화검증 시스템 및 방법

  • 기술번호 : KST2015117060
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명에 의한 발화검증 시스템은, 입력 음성신호로부터 음성의 특징을 표현하는 특징벡터를 추출하는 특징벡터 추출부, 추출된 특징벡터로부터 음성인식을 수행하고, 음색도 추출부로 음소레벨의 인식정보를 전달하는 음성인식부, 음소레벨의 인식정보, 반모델 및 단어음색 모델을 이용하여 음소레벨 로그우도 음색도와 음소레벨 지속시간 음색도를 구하고, 각각으로부터 단어레벨 로그우도 음색도와 단어레벨 지속시간 음색도를 추출하는 음색도 추출부 및, 음색도 추출부에서 출력된 단어레벨 로그우도 음색도와 단어레벨 지속시간 음색도를 이용하여 음성인식된 결과에 대해 수락 또는 거절을 결정하는 발화검증부를 구비한다.
Int. CL G10L 15/10 (2013.01) G10L 15/04 (2013.01) G10L 15/01 (2013.01) G10L 15/14 (2013.01)
CPC G10L 15/01(2013.01) G10L 15/01(2013.01) G10L 15/01(2013.01) G10L 15/01(2013.01)
출원번호/일자 1020070136643 (2007.12.24)
출원인 한국과학기술원
등록번호/일자 10-0940641-0000 (2010.01.28)
공개번호/일자 10-2009-0068856 (2009.06.29) 문서열기
공고번호/일자 (20100205) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2007.12.24)
심사청구항수 23

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 권석봉 대한민국 서울 마포구
2 김회린 대한민국 대전 유성구
3 김정현 대한민국 대전 동구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 최태창 대한민국 서울(특허법인 퇴사후 사무소변경 미신고)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2007.12.24 수리 (Accepted) 1-1-2007-0927399-77
2 선행기술조사의뢰서
Request for Prior Art Search
2008.09.08 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2008.10.15 수리 (Accepted) 9-1-2008-0068655-99
4 [출원인변경]권리관계변경신고서
[Change of Applicant] Report on Change of Proprietary Status
2009.07.06 불수리 (Non-acceptance) 1-1-2009-0411323-85
5 [출원인변경]권리관계변경신고서
[Change of Applicant] Report on Change of Proprietary Status
2009.07.07 수리 (Accepted) 1-1-2009-0414029-81
6 서류반려이유통지서
Notice of Reason for Return of Document
2009.07.16 발송처리완료 (Completion of Transmission) 1-5-2009-0049616-03
7 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2009.07.23 수리 (Accepted) 1-1-2009-0448491-92
8 서류반려통지서
Notice for Return of Document
2009.08.28 발송처리완료 (Completion of Transmission) 1-5-2009-0062980-57
9 의견제출통지서
Notification of reason for refusal
2009.09.18 발송처리완료 (Completion of Transmission) 9-5-2009-0387876-48
10 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2009.11.18 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2009-0707148-00
11 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2009.11.18 수리 (Accepted) 1-1-2009-0707104-02
12 등록결정서
Decision to grant
2009.11.27 발송처리완료 (Completion of Transmission) 9-5-2009-0490798-79
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.02.01 수리 (Accepted) 4-1-2013-5019983-17
14 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.12.24 수리 (Accepted) 4-1-2014-5157968-69
15 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.12.24 수리 (Accepted) 4-1-2014-5157993-01
16 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.12.24 수리 (Accepted) 4-1-2014-5158129-58
17 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.04.24 수리 (Accepted) 4-1-2019-5081392-49
18 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.05.15 수리 (Accepted) 4-1-2020-5108396-12
19 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.12 수리 (Accepted) 4-1-2020-5131486-63
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
입력 음성신호로부터 음성의 특징을 표현하는 특징벡터를 추출하는 특징벡터 추출부; 추출된 특징벡터로부터 음성인식을 수행하고, 음색도 추출부로 음소레벨의 인식정보를 전달하는 음성인식부; 음소레벨의 인식정보, 반모델 및 단어음색 모델을 이용하여 음소레벨 로그우도 음색도와 음소레벨 지속시간 음색도를 구하고, 각각으로부터 단어레벨 로그우도 음색도와 단어레벨 지속시간 음색도를 추출하는 음색도 추출부 및; 음색도 추출부에서 출력된 단어레벨 로그우도 음색도와 단어레벨 지속시간 음색도를 이용하여 음성인식된 결과에 대해 수락 또는 거절을 결정하는 발화검증부를 구비하는 것을 특징으로 하는 발화검증 시스템
2 2
제1항에 있어서, 상기 음성인식부는 프레임별 비터비 탐색(time-synchronous Viterbi search)을 통해 음성인식을 수행하는 것을 특징으로 하는 발화검증 시스템
3 3
제1항에 있어서, 상기 음색도 추출부는, 음소레벨의 인식정보와 반모델을 이용하여 음소레벨 로그우도 비율(PLLR(ph))을 구하고, 음소레벨 로그우도 비율로부터 단어음색 모델을 사용해 음소레벨 로그우도 음색도(CVP(ph))를 추출하는 음소레벨 로그우도 음색도 추출부; 상기 음소레벨 로그우도 음색도 추출부에서 추출된 음소레벨 로그우도 음색도(CVP(ph))의 평균을 구하여 단어레벨 로그우도 음색도(CVPA(w))를 추출하는 단어레벨 로그우도 음색도 추출부; 음소레벨의 인식정보와 단어음색 모델을 이용하여 음소레벨 지속시간 음색도(CVPD(ph))를 추출하는 음소레벨 지속시간 음색도 추출부; 상기 음소레벨 지속시간 음색도 추출부에서 추출된 음소레벨 지속시간 음색도(CVPD(ph))의 평균을 구하여 단어레벨 지속시간 음색도(CVPD(w))를 추출하는 단어레벨 지속시간 음색도 추출부를 구비하는 것을 특징으로 하는 발화검증 시스템
4 4
제3항에 있어서, 상기 음소레벨 로그우도 음색도 추출부에서 음소레벨 로그우도 비율(PLLR(ph))은 수학식 와 같이 구하되, τ(ph)는 인식된 음소의 프레임 수, Xph는 인식된 음소의 입력 특징벡터열, 와 는 각각 인식된 음소에 대한 음향모델과 반모델을 나타내는 것을 특징으로 하는 발화검증 시스템
5 5
제3항에 있어서, 상기 음소레벨 로그우도 음색도 추출부에서 음소레벨 로그우도 음색도(CVP(ph))는 수학식 와 같이 구하되, 와 는 각각 단어 w의 음소 ph에 대한 음소레벨 로그우도 비율 분포의 평균과 표준편차를 나타내고, 는 수학식 와 같이 구하되, α는 음소레벨 로그우도 비율에서 나타날 수 있는 최소값의 경계점을 나타내고, β는 음소레벨 로그우도 음색도의 변화 속도를 나타내는 것을 특징으로 하는 발화검증 시스템
6 6
제3항에 있어서, 상기 단어레벨 로그우도 음색도 추출부에서 단어레벨 로그우도 음색도(CVPA(w))는 수학식 과 같이 구하되, np(w)는 단어를 이루는 음소열의 길이를 나타내는 것을 특징으로 하는 발화검증 시스템
7 7
제3항에 있어서, 상기 음소레벨 지속시간 음색도 추출부에서 음소레벨 지속시간 음색도(CVPD(ph))는 수학식 과 같이 구하되, τ(ph)는 인식된 음소 ph의 프레임 수, 와 는 각각 단어 w의 음소 ph에 대한 음소레벨 지속시간 분포의 평균과 표준편차를 나타내고, ε은 확실히 올바르게 발성이 되었다고 보는 지속시간 범위의 크기를 나타내는 것을 특징으로 하는 발화검증 시스템
8 8
제3항에 있어서, 상기 단어레벨 지속시간 음색도 추출부에서 단어레벨 지속시간 음색도(CVPD(w))는 수학식 과 같이 구하되, np(w)는 단어를 이루는 음소열의 길이를 나타내는 것을 특징으로 하는 발화검증 시스템
9 9
제1항에 있어서, 상기 발화검증부는 단어레벨 지속시간 음색도가 소정 문턱치보다 높거나 같을 경우 수락하고, 낮을 경우 거절하는 제1판단부; 제1판단부에서 수락된 경우에 대해, 단어레벨 로그우도 음색도가 소정 문턱치보다 높거나 같을 경우 수락하고, 낮을 경우 거절하는 제2판단부를 구비하는 것을 특징으로 하는 발화검증 시스템
10 10
제1항 내지 제9항 중 어느 한 항에 있어서, 개발음성 데이터로부터 인식된 레이블 파일을 이용하여, 음소레벨 로그우도 비율 분포와 음소레벨 지속시간 분포에 대한 정보를 포함하는 단어음색 모델을 생성하는 단어음색 모델 생성부를 더 구비하는 것을 특징으로 하는 발화검증 시스템
11 11
제10항에 있어서, 상기 레이블 파일은 음성인식된 단어에 대한 프레임 정보와 로그우도, 음소 단위의 프레임 정보와 로그우도 및, 반모델에 대한 로그우도 정보를 포함하는 것을 특징으로 하는 발화검증 시스템
12 12
(a) 입력 음성신호로부터 음성의 특징을 표현하는 특징벡터를 추출하는 단계; (b) 추출된 특징벡터로부터 음성인식을 수행하여, 음소레벨의 인식정보를 생성하는 단계; (c) 음소레벨의 인식정보, 반모델 및 단어음색 모델을 이용하여 음소레벨 로그우도 음색도와 음소레벨 지속시간 음색도를 구하고, 각각으로부터 단어레벨 로그우도 음색도와 단어레벨 지속시간 음색도를 추출하는 단계 및; (d) 단어레벨 로그우도 음색도와 단어레벨 지속시간 음색도를 이용하여 음성인식된 결과에 대해 수락 또는 거절을 결정하는 단계를 포함하는 것을 특징으로 하는 발화검증 방법
13 13
제12항에 있어서, 상기 (b) 단계에 있어서, 음성인식부는 프레임별 비터비 탐색(time-synchronous Viterbi search)을 통해 음성인식을 수행하는 것을 특징으로 하는 발화검증 방법
14 14
제12항에 있어서, 상기 (c) 단계는 (c1) 음소레벨의 인식정보와 반모델을 이용하여 음소레벨 로그우도 비율(PLLR(ph))을 구하는 단계; (c2) 음소레벨 로그우도 비율로부터 단어음색 모델을 사용해 음소레벨 로그우도 음색도(CVP(ph))를 추출하는 단계; (c3) 음소레벨 로그우도 음색도(CVP(ph))의 평균을 구하여 단어레벨 로그우도 음색도(CVPA(w))를 추출하는 단계를 포함하는 것을 특징으로 하는 발화검증 방법
15 15
제14항에 있어서, 상기 (c1) 단계에 있어서, 음소레벨 로그우도 비율(PLLR(ph))은 수학식 와 같이 구하되, τ(ph)는 인식된 음소의 프레임 수, Xph는 인식된 음소의 입력 특징벡터열, 와 는 각각 인식된 음소에 대한 음향모델과 반모델을 나타내는 것을 특징으로 하는 발화검증 방법
16 16
제14항에 있어서, 상기 (c2) 단계에 있어서, 음소레벨 로그우도 음색도(CVP(ph))는 수학식 와 같이 구하되, 와 는 각각 단어 w의 음소 ph에 대한 음소레벨 로그우도 비율 분포의 평균과 표준편차를 나타내고, 는 수학식 와 같이 구하되, α는 음소레벨 로그우도 비율에서 나타날 수 있는 최소값의 경계점을 나타내고, β는 음소레벨 로그우도 음색도의 변화 속도를 나타내는 것을 특징으로 하는 발화검증 방법
17 17
제14항에 있어서, 상기 (c3) 단계에 있어서, 단어레벨 로그우도 음색도(CVPA(w))는 수학식 과 같이 구하되, np(w)는 단어를 이루는 음소열의 길이를 나타내는 것을 특징으로 하는 발화검증 방법
18 18
제12항에 있어서, 상기 (c) 단계는 (c1) 음소레벨의 인식정보와 단어음색 모델을 이용하여 음소레벨 지속시간 음색도(CVPD(ph))를 추출하는 단계; (c2) 음소레벨 지속시간 음색도(CVPD(ph))의 평균을 구하여 단어레벨 지속시간 음색도(CVPD(w))를 추출하는 단계를 포함하는 것을 특징으로 하는 발화검증 방법
19 19
제18항에 있어서, 상기 (c1) 단계에 있어서, 음소레벨 지속시간 음색도(CVPD(ph))는 수학식 과 같이 구하되, τ(ph)는 인식된 음소 ph의 프레임 수, 와 는 각각 단어 w의 음소 ph에 대한 음소레벨 지속시간 분포의 평균과 표준편차를 나타내고, ε은 확실히 올바르게 발성이 되었다고 보는 지속시간 범위의 크기를 나타내는 것을 특징으로 하는 발화검증 방법
20 20
제18항에 있어서, 상기 (c2) 단계에 있어서, 단어레벨 지속시간 음색도(CVPD(w))는 수학식 과 같이 구하되, np(w)는 단어를 이루는 음소열의 길이를 나타내는 것을 특징으로 하는 발화검증 방법
21 21
제12항에 있어서, 상기 (d) 단계는, (d1) 단어레벨 지속시간 음색도가 소정 문턱치보다 높거나 같을 경우 수락하고, 낮을 경우 거절하는 단계; (d2) 상기 (d1) 단계에서 수락된 경우에 대해, 단어레벨 로그우도 음색도가 소정 문턱치보다 높거나 같을 경우 수락하고, 낮을 경우 거절하는 단계를 포함하는 것을 특징으로 하는 발화검증 방법
22 22
제12항 내지 제21항 중 어느 한 항에 있어서, 단어음색 모델은 개발음성 데이터로부터 인식된 레이블 파일을 이용하여 생성하며, 음소레벨 로그우도 비율 분포와 음소레벨 지속시간 분포에 대한 정보를 포함하는 것을 특징으로 하는 발화검증 방법
23 23
제22항에 있어서, 상기 레이블 파일은 음성인식된 단어에 대한 프레임 정보와 로그우도, 음소 단위의 프레임 정보와 로그우도 및, 반모델에 대한 로그우도 정보를 포함하는 것을 특징으로 하는 발화검증 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.