맞춤기술찾기

이전대상기술

대화체 연속음성인식 장치 및 방법

  • 기술번호 : KST2015094903
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 대화체 연속음성인식 장치 및 방법이 개시된다. 학습에 의해 구축된 음향모델 데이터베이스 및 발음사전 데이터베이스를 포함하는 본 발명에 따른 대화체 음성인식 장치는 입력된 음성으로부터 인식에 유용한 정보만을 추출하여 특징벡터로 변환하는 특징 추출부, 인식하고자 하는 영역의 대화를 특정 영역별로 세분화하여 다수의 로컬 언어모델 데이터베이스들로 구축하고, 세분화된 특정 영역에 포함되지 않는 일반 대화를 광범위 언어모델 데이터베이스로 각각 구축하고, 특징벡터에 따라 다수의 로컬 언어모델 데이터베이스들에서 추출된 언어모델과 광범위한 언어모델 데이터베이스에서 추출된 언어모델을 인터폴레이션하는 다중영역 언어모델링부, 음향모델 데이터베이스, 발음사전 데이터베이스 및 다중영역 언어모델링부를 참조하여 특징벡터와 유사할 확률이 가장 높은 단어열을 탐색하는 탐색부 및 탐색부에서 탐색된 단어열을 인식된 텍스트로서 출력하는 인식 결과 출력부를 포함하는 것을 특징으로 하며, 대화체 연속음성인식시 영역에 특화된 언어모델을 일반적인 언어모델과 인터폴레이션함으로써 언어인식 확률을 높일 수 있으며, 특정 영역에서의 말뭉치 부족으로 인한 언어모델 성능 저하를 최소화할 수 있다.
Int. CL G10L 15/183 (2013.01) G10L 15/06 (2013.01)
CPC G10L 15/183(2013.01) G10L 15/183(2013.01) G10L 15/183(2013.01) G10L 15/183(2013.01) G10L 15/183(2013.01)
출원번호/일자 1020020082084 (2002.12.21)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2004-0055417 (2004.06.26) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 거절
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2002.12.21)
심사청구항수 14

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 정의정 대한민국 대전광역시서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이영필 대한민국 서울 강남구 언주로 **길 **, *층, **층, **층, **층(도곡동, 대림아크로텔)(리앤목특허법인)
2 이해영 대한민국 서울 강남구 언주로 **길 **, *층, **층, **층, **층(도곡동, 대림아크로텔)(리앤목특허법인)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2002.12.21 수리 (Accepted) 1-1-2002-0423415-50
2 선행기술조사의뢰서
Request for Prior Art Search
2004.12.15 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2005.01.18 수리 (Accepted) 9-1-2005-0002095-92
4 의견제출통지서
Notification of reason for refusal
2005.02.21 발송처리완료 (Completion of Transmission) 9-5-2005-0074616-94
5 거절결정서
Decision to Refuse a Patent
2005.06.03 발송처리완료 (Completion of Transmission) 9-5-2005-0264279-56
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1

학습에 의해 구축된 음향모델 데이터베이스 및 발음사전 데이터베이스를 포함하는 대화체 연속음성인식 장치에 있어서,

입력된 음성으로부터 인식에 유용한 정보만을 추출하여 특징벡터로 변환하는 특징 추출부;

인식하고자 하는 영역의 대화를 특정 영역별로 세분화하여 다수의 로컬 언어모델 데이터베이스들로 구축하고, 상기 세분화된 특정 영역에 포함되지 않는 일반 대화를 광범위 언어모델 데이터베이스로 각각 구축하고, 상기 특징벡터에 따라 상기 다수의 로컬 언어모델 데이터베이스들에서 추출된 언어모델과 광범위한 언어모델 데이터베이스에서 추출된 언어모델을 인터폴레이션하는 다중영역 언어모델링부;

상기 음향모델 데이터베이스, 상기 발음사전 데이터베이스 및 상기 다중영역 언어모델링부를 참조하여 상기 특징벡터와 유사할 확률이 가장 높은 단어열을 탐색하는 탐색부; 및

상기 탐색부에서 탐색된 단어열을 인식된 텍스트로서 출력하는 인식 결과 출력부를 포함하는 것을 특징으로 하는 대화체 연속음성인식 장치

2 2

제1항에 있어서, 상기 다중영역 언어모델링부는

상기 로컬 언어모델 데이터베이스들에서 추출된 언어모델에 광범위 언어모델 데이터베이스에서 추출된 언어모델보다 높은 가중치를 부여하여 인터폴레이션하는 것을 특징으로 하는 대화체 연속음성인식 장치

3 3

제2항에 있어서, 상기 인터폴레이션은

영역별 n-gram의 카운트를 일정 비율로 높여주어, 디스카운팅 직전에 다음 수학식에 따라 재분배하는 것을 특징으로 하는 대화체 연속음성인식 장치

4 4

제1항에 있어서, 상기 탐색부는

비터비 알고리듬을 이용하여 단어열을 탐색하는 것을 특징으로 하는 대화체 연속음성인식 장치

5 5

(a)입력된 음성으로부터 음성인식에 유용한 정보만을 추출하여 특징벡터로 변환하는 단계;

(b)학습과정에서 미리 구축된 음향모델 데이터베이스 및 발음사전 데이터베이스와 다중영역 언어모델링을 이용하여 상기 특징 벡터와 유사할 확률이 가장 높은 단어열을 탐색하는 단계; 및

(c)상기 (b)단계에서 탐색된 단어열을 인식된 텍스트로서 생성하는 단계를 포함하는 것을 특징으로 하는 대화체 연속음성인식 방법

6 6

제5항에 있어서, 상기 다중영역 언어모델링은

인식하고자 하는 영역의 대화를 특정 영역별로 세분화하여 구축된 다수의 로컬 언어모델 데이터베이스들과 상기 세분화된 특정 영역에 포함되지 않는 일반 대화를 수집한 광범위 언어모델 데이터베이스를 참조하여, 상기 특징벡터에 따라 상기 다수의 로컬 언어모델 데이터베이스들에서 추출된 언어모델과 광범위한 언어모델 데이터베이스에서 추출된 언어모델을 인터폴레이션하는 것을 특징으로 하는 대화체 연속음성인식 방법

7 7

제6항에 있어서, 상기 인터폴레이션은

상기 로컬 언어모델 데이터베이스들에서 추출된 언어모델에 광범위 언어모델 데이터베이스에서 추출된 언어모델보다 높은 가중치를 부여하는 것을 특징으로 하는 대화체 연속음성인식 방법

8 8

제6항에 있어서, 상기 인터폴레이션은

영역별 n-gram의 카운트를 일정 비율로 높여주어, 디스카운팅 직전에 다음 수학식에 따라 재분배하는 것을 특징으로 하는 대화체 연속음성인식 방법

9 9

제5항에 있어서, 상기 (b)단계는

비터비 알고리듬을 이용하여 단어열을 탐색하는 것을 특징으로 하는 대화체 연속음성인식 방법

10 10

제5항의 대화체 연속음성인식 방법을 컴퓨터에서 실행 가능한 프로그램 코드로 기록된 기록 매체

11 11

(a)언어모델링을 하고자하는 영역을 세분화하여 세분화된 다수의 로컬 언어모델 데이터베이스들을 구축하는 단계;

(b)상기 (a)단계에서 세부적 언어영역으로 구분되지 않은 영역의 대화들을 수집하여 광범위 언어모델 데이터베이스로서 구축하는 단계;

(c)입력된 음성으로부터 추출된 특징 벡터와 유사할 확률이 높은 언어모델을 상기 다수의 로컬 언어모델 데이터베이스들에서 추출하는 단계;

(d)상기 특징 벡터와 유사할 확률이 높은 언어모델을 상기 광범위 언어모델 데이터베이스로부터 추출하는 단계; 및

(e)상기 (c) 및 (d)단계에서 추출된 언어모델 각각에 소정의 가중치를 부여하여 인터폴레이션하는 단계를 포함하는 것을 특징으로 하는 대화체 연속음성인식 장치에서 수행되는 다중영역 언어모델링 방법

12 12

제11항에 있어서, 상기 (e)단계의 인터폴레이션은

상기 (d)단계에서 추출된 언어모델보다 상기 (c)단계에서 추출된 언어모델에 높은 가중치를 부여하여 상기 로컬 언어모델 데이터베이스에서 추출된 언어모델을 강조하는 것을 특징으로 하는 대화체 연속음성인식 장치에서 수행되는 다중영역 언어모델링 방법

13 13

제11항에 있어서, 상기 (e)단계의 인터폴레이션은

영역별 n-gram의 카운트를 일정 비율로 높여주어, 디스카운팅 직전에 다음 수학식에 따라 재분배하는 것을 특징으로 하는 대화체 연속음성인식 장치에서 수행되는 다중영역 언어모델링 방법

14 14

제11항의 다중영역 언어모델링 방법을 컴퓨터에서 실행 가능한 프로그램 코드로 기록된 기록 매체

지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.