맞춤기술찾기

이전대상기술

트리탐색기반 음성 인식 방법 및 이를 이용한 대용량 연속음성 인식 시스템

  • 기술번호 : KST2015098221
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 트리탐색시 언어모델 미리보기를 적용하여 확률이 낮은 루트를 미리제거함으로서 문장단위의 연속 음성 인식시의 계산량을 줄인 트리 기반 음성 인식 방법 및 이를 이용한 대용량 연속 음성 인식 시스템을 제공하기 위한 것으로, 본 발명은 시간 t에서 입력된 음성에 대해 결정된 어휘를 추출하여, 상기 어휘들의 언어모델확률을 합하여 각 루트별로 언어학적으로 상기 시간 t에서 결정된 어휘에 이어질 가능성을 나타내는 기대치를 구하고, 각 루트별 기대치를 설정된 한계치와 비교하여, 기대치가 낮은 루트를 탐색대상에서 제외시킴으로서, 인식속도를 향상시키면서, 각 루트별로 속하는 모든 어휘를 고려하여 언어모델을 적용함으로서 성능저하를 감소시킨 것이다.음성 인식, 트리구조탐색, 언어모델, 음향모델, 언어모델 미리보기,
Int. CL G10L 15/197 (2013.01) G10L 15/183 (2013.01)
CPC G10L 15/197(2013.01) G10L 15/197(2013.01)
출원번호/일자 1020010065149 (2001.10.22)
출원인 한국전자통신연구원
등록번호/일자 10-0450396-0000 (2004.09.16)
공개번호/일자 10-2003-0033394 (2003.05.01) 문서열기
공고번호/일자 (20040930) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2001.10.22)
심사청구항수 7

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 정호영 대한민국 대전광역시서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인씨엔에스 대한민국 서울 강남구 언주로 **길 **, 대림아크로텔 *층(도곡동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2001.10.22 수리 (Accepted) 1-1-2001-0270894-16
2 전자문서첨부서류제출서
Submission of Attachment to Electronic Document
2001.10.23 수리 (Accepted) 1-1-2001-5291993-14
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2002.08.08 수리 (Accepted) 4-1-2002-0065009-76
4 선행기술조사의뢰서
Request for Prior Art Search
2003.10.07 수리 (Accepted) 9-1-9999-9999999-89
5 선행기술조사보고서
Report of Prior Art Search
2003.11.14 수리 (Accepted) 9-1-2003-0051956-56
6 의견제출통지서
Notification of reason for refusal
2004.02.05 발송처리완료 (Completion of Transmission) 9-5-2004-0044292-12
7 의견서
Written Opinion
2004.04.06 수리 (Accepted) 1-1-2004-0140363-38
8 명세서 등 보정서
Amendment to Description, etc.
2004.04.06 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2004-0140364-84
9 등록결정서
Decision to grant
2004.07.12 발송처리완료 (Completion of Transmission) 9-5-2004-0279222-71
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1

연속 입력된 음성을 문장단위로 인식하는 대용량 음성 인식 시스템의 트리탐색 기반 음성 인식 방법에 있어서,

가) 소정의 입력 음성에 대한 어휘가 결정되면 상기 결정된 어휘를 추출하는 단계;

나) 탐색트리의 각 루트별로 언어학적으로 상기 결정된 어휘에 이어질 가능성을 나타내는 기대치를 구하는 단계;

다) 상기 나)단계에서 구해진 각 루트별 기대치를 설정된 한계치와 비교하는 단계; 및

라) 상기 비교에서 한계치보다 낮은 기대치를 갖는 루트를 상기 탐색트리에서 제거시키는 단계; 및

마) 다음 음성을 입력받아 대응하는 어휘결정을 위해 상기 언어학적 기대치가 낮은 루트가 제거된 탐색트리를 탐색하는 단계

를 반복 수행하는 것을 특징으로 하는 트리탐색 기반 음성인식방법

2 2

제 1 항에 있어서, 상기 루트별 기대치를 구하는 나)단계는

a) 탐색트리의 루트별로 그 아래에 속하는 모든 어휘를 추출하는 단계;

b) 상기 a)단계에서 추출된 어휘들의 선행결정어휘에 대한 언어모델확률을 각각 구하는 단계; 및

c) 상기 b)단계에서 구해진 언어모델확률을 모두 더하여 해당 루트의 기대치를 계산하는 단계를 루트별로 실행하는 것을 특징으로 하는 트리탐색 기반 음성인식방법

3 3

제 1 항 또는 제 2 항에 있어서, 상기 탐색트리는

인식대상 어휘들의 음소를 시계열적으로 배열한 것임을 특징으로 하는 트리 탐색 기반 음성 임식방법

4 4

제 1 항 또는 제 2 항에 있어서, 상기 탐색트리는 루트에서 탐색을 진행하여 리프노드에 도달했을 때 비로소 어휘가 결정되는 것임을 특징으로 하는 트리 탐색 기반 음성 인식 방법

5 5

음성을 입력받아 전기신호로 변환하는 음성입력부;

상기 음성입력부로부터 인가되는 음성신호를 음성인식을 위한 특징변수로 변환하는 특징추출부;

특징추출부의 출력을 소정 시간지연후 인가하는 딜레이부;

상기 딜레이부를 통해 입력된 어휘를 공동음소별로 구성한 트리 구조를 기반으로 상기 K딜레이부를 통해 입력된 음성에 대해 가능성 있는 단어를 결정하는 트리기반탐색부;

상기 트리기반탐색부에서 매 순간마다 결정되는 어휘를 추출하는 중간결과추출부;

상기 중간결과추출부에 의해 추출된 결정어휘에 대해 트리 구조의 각 루트별로 언어모델을 적용하는 루트별 기대치를 정하고, 이 기대치가 설정 값보다 낮은 루트는 탐색에서 제외시키도록 상기 트리기반탐색부를 제어하는 언어모델미리보기처리부;

다수의 화자가 발성한 음성을 이용하여 구성된 음성의 통계적 모델을 저장하는 음향모델저장부;

인식영역에 해당하는 텍스트로부터 통계적으로 만들어진 언어모델을 저장하는 언어모델저장부; 및

상기 트리기반탐색부의 출력을 이용하여 인식결과를 제공하는 인식결과출력부로 이루어지는 트리기반탐색방법을 이용한 대용량 음성 인식 시스템

6 6

제 5 항에 있어서, 상기 언어모델미리보기처리부는

탐색트리의 각 루트별로 그 아래에 속하는 모든 어휘를 추출하고, 추출된 어휘의 선행결정어휘에 대한 언어모델확률을 구하며, 루트별로 그 아래에 속하는 모든 어휘에 대한 언어모델확률을 더하여 각 루트의 기대치를 정하고, 상기 기대치가 소정의 한계치보다 낮은 루트를 다음 탐색과정에서 제외시키는 것을 특징으로 하는 트리기반탐색방법을 이용한 대용량 음성 인식 시스템

7 7

트리기반탐색방법을 적용한 대용량 음성 인식 시스템에 있어서,

트리 기반 탐색에 의하여 소정 음성 인식 시간 t에서 인식결정된 어휘를 추출하는 선행결정어휘로 입력받는 기능;

탐색트리의 각 루트별로 그 아래에 속하는 어휘를 추출하는 기능;

상기 선행결정어휘에 대한 상기 탐색트리에서 추출된 어휘 각각에 대한 언어모델확률을 언어모델을 적용하여 구하는 기능;

탐색트리의 각 루트별로 그 아래에 속하는 어휘 각각의 언어모델확률을 더하여 루트별 기대치를 구하는 기능;

상기 각 루트별로 구해진 기대치를 미리 설정된 한계치와 비교하는 기능; 및

상기 비교결과 기대치가 한계치보다 낮은 루트를 다음 음성 인식 시간 t+1에서의 탐색시 제외시키는 기능을 실현하기 위한 프로그램이 저장된 컴퓨터로 판독 가능한 기록매체

지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.