맞춤기술찾기

이전대상기술

음성 인식 장치 및 그 방법

  • 기술번호 : KST2015085270
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 음성 인식 장치 및 그 방법에 관한 것으로, 구문분석의 계층구조를 이용한 계층별 인식단어 n-gram을 이용하여 근거리의 단어열뿐만 아니라 계층구조에 의한 원거리의 단어열에 대하여 언어모델 기반의 음성인식을 수행함으로써, 기존 n개의 확률로 제한되어 음성인식을 수행하던 것을 계층구조에 의해 원거리의 n-gram을 적용하여 원거리 음성인식의 오류를 줄일 수 있다. 또한, 본 발명은 원거리 단어에 대한 n-gram이 적용된 음성 인식 장치 및 그 방법을 제공함으로써, 음성 인식의 성능을 극대화시킬 수 있다. 음성 인식, 언어 모델, 계층별 n-gram, 형태소 분석, 구문 분석
Int. CL G10L 15/197 (2013.01) G10L 15/06 (2013.01) G10L 15/14 (2013.01)
CPC G10L 15/197(2013.01) G10L 15/197(2013.01) G10L 15/197(2013.01) G10L 15/197(2013.01) G10L 15/197(2013.01) G10L 15/197(2013.01) G10L 15/197(2013.01)
출원번호/일자 1020090057093 (2009.06.25)
출원인 한국전자통신연구원
등록번호/일자 10-1134455-0000 (2012.04.02)
공개번호/일자 10-2010-0138520 (2010.12.31) 문서열기
공고번호/일자 (20120413) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2009.06.25)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김정세 대한민국 대전광역시 유성구
2 김승희 대한민국 대전광역시 유성구
3 박준 대한민국 대전광역시 유성구
4 이수종 대한민국 대전광역시 유성구
5 윤승 대한민국 대전광역시 서구
6 이일빈 대한민국 대전광역시 중구
7 김상훈 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)
2 김원준 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)(제일특허법인(유))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 주식회사 레이어스 서울시 금천구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2009.06.25 수리 (Accepted) 1-1-2009-0386603-87
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
3 의견제출통지서
Notification of reason for refusal
2011.08.17 발송처리완료 (Completion of Transmission) 9-5-2011-0459762-12
4 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.10.17 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2011-0807878-82
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.10.17 수리 (Accepted) 1-1-2011-0807876-91
6 등록결정서
Decision to grant
2012.03.21 발송처리완료 (Completion of Transmission) 9-5-2012-0163863-51
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
음성신호에서 추출된 음성 특징과 음향모델들 및 발음열 정보들간을 비교하여 음향모델확률을 생성하고, 상기 음성신호에 대해 상기 음향모델들 및 발음열 정보들 간의 비교를 통해 선택된 단어열을 기반으로 언어모델확률을 생성하며, 상기 음향모델확률과 언어모델확률을 가산하여 생성된 음성인식확률을 기반으로 단어열을 생성하는 음성 인식부와, 상기 생성된 단어열에 대하여 형태소 품사 태깅과 구문 분석을 통해 생성된 계층구조를 이용하여 인식 단어에 대해 계층별 단어 리스트를 생성하고, 상기 계층별 단어 리스트에 대하여 계층별 n-gram DB에 기구축된 계층별 n-gram 단어 리스트를 이용하여 계층 n-gram 스코어(score)를 생성하며, 상기 음향모델확률 및 언어모델확률에 상기 계층 n-gram 스코어를 가산시켜 음성인식결과를 생성하는 계층별 n-gram 적용부를 포함하는 음성 인식 장치
2 2
제 1 항에 있어서, 상기 음성 인식부는, 상기 음성신호의 음성 특징을 추출하는 특징 추출부와,음향 모델들을 저장하는 음향 모델부와, 발음열 정보들이 수록되어 있는 발음 사전부와,상기 음성신호에 대해 상기 음향모델들 및 발음열 정보들 간의 비교를 통해 동일한 단어열을 선택하는 언어 모델부와, 상기 음성 특징과 상기 음향모델들 및 발음열 정보들간을 비교하여 음향모델확률을 생성하고, 상기 음성 특징과 상기 선택된 단어열간을 비교하여 언어모델확률을 생성하며, 상기 음향모델확률 및 언어모델확률을 통해 음성인식확률을 생성하며, 상기 음성인식확률을 기반으로 상기 음성신호와 일치하는 단어열을 탐색하는 탐색부를 포함하는 음성 인식 장치
3 3
제 2 항에 있어서, 상기 음성인식확률은, 수학식(여기서, α와 β는 상수값)에 의해 생성되는 음성 인식 장치
4 4
제 1 항에 있어서, 상기 계층별 n-gram 적용부는, 상기 단어열에 대하여 텍스트 DB에 저장된 텍스트들을 통해 검색 비교하면서 형태소 품사를 태깅하는 형태소 품사 태깅부와, 상기 태깅된 형태소 품사를 이용하여 구문 분석을 수행하여 계층구조를 생성하는 구분 분석부와,상기 생성된 계층구조를 이용하여 인식 단어에 대해 상기 계층별 단어 리스트를 생성하는 계층별 단어 리스트 생성부와,상기 계층별 단어 리스트에 대하여 계층별 n-gram DB에 기구축되어 저장된 계층별 n-gram 단어 리스트를 이용하여 계층 n-gram 스코어를 생성하는 계층 n-gram 적용부와,상기 음향모델확률 및 언어모델확률에 상기 생성된 계층 n-gram 스코어를 가산하여 상기 음성 인식부에서 생성한 단어열 중에 하나가 선택된 음성인식스코어를 생성하는 계산부를 포함하는 음성 인식 장치
5 5
제 4 항에 있어서, 상기 계층 n-gram 스코어는, 수학식(여기서, score(Wi,k)는 Wi,k에 대한 스코어 계산값을 의미하고, Wi,k는 i번째 계층의 k번째 단어를 의미하며, 은 Wi,k를 부모로 가진 단어들 m개의 리스트에서 m번째까지의 n-gram 확률로서, Wi+1,m 까지의 확률이며, 은 Wi,k를 부모로 가진 단어들 m개의 집합 다음에 Wi,k가 나올 확률이며, 는 같은 계층에서 Wi,k-1 까지의 n-gram 확률이며, 는 같은 계층에서 Wi,k이전 단어 k개의 집합 다음에 Wi,k가 나올 확률인 것을 의미한다
6 6
제 4 항에 있어서, 상기 음성인식스코어는, 수학식 (여기서, α와 β 그리고 γ은 상수값)에 의해 생성되는 음성인식결과인 음성 인식 장치
7 7
음성신호에서 추출된 음성 특징과 음향모델들 및 발음열 정보들간을 비교하여 음향모델확률을 생성하는 단계와, 상기 음성신호에 대해 상기 음향모델들 및 발음열 정보들 간의 비교를 통해 선택된 단어열을 기반으로 언어모델확률을 생성하는 단계와, 상기 음향모델확률과 언어모델확률을 가산하여 생성된 음성인식확률을 기반으로 단어열을 생성하는 단계와, 상기 생성된 단어열에 대하여 형태소 품사 태깅과 구문 분석을 통해 생성된 계층구조를 이용하여 인식 단어에 대해 계층별 단어 리스트를 생성하는 단계와,상기 계층별 단어 리스트에 대하여 계층별 n-gram DB에 기구축된 계층별 n-gram 단어 리스트를 이용하여 계층 n-gram 스코어를 생성하는 단계와,상기 음향모델확률 및 언어모델확률에 상기 계층 n-gram 스코어를 가산시켜 음성인식결과를 생성하는 단계를 포함하는 음성 인식 방법
8 8
제 7 항에 있어서, 상기 계층별 단어 리스트는, 댑스(depth)의 시작 인식 단어부터 그 상위 계층인 부모 노드의 첫 단어까지에 대한 리스트를 생성하는 음성 인식 방법
9 9
제 7 항에 있어서, 상기 계층별 n-gram 단어 리스트는, 구문분석결과 중에서 명사나 용언이 포함된 다수의 단어인 음성 인식 방법
10 10
제 7 항에 있어서, 상기 계층 n-gram 스코어는, Wi,k를 부모로 가진 단어들 m개의 리스트에서 m번째까지의 n-gram 확률로서, Wi+1,m 까지의 확률을 갖는 와 상기 Wi,k를 부모로 가진 단어들 m개의 집합 다음에 Wi,k가 나올 확률을 갖는 와 계층에서 Wi,k-1 까지의 n-gram 확률을 갖는 와 계층에서 Wi,k이전 단어 k개의 집합 다음에 Wi,k가 나올 확률을 갖는 을 곱셈연산을 통해 생성하는 음성 인식 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 지식경제부 한국전자통신연구원 IT성장동력기술개발 휴대형 한/영 자동통역 기술개발