맞춤기술찾기

이전대상기술

음성 인식 방법 및 장치(Speech recognition method and apparatus thereof)

  • 기술번호 : KST2017002201
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명의 실시 예들은, 음성 인식 방법 및 장치에 관한 것으로, 본 발명의 일 실시 예에 따른 음성 인식 방법은, 음성 특징 벡터들을 설정된 방법에 따라 N(여기서, N은 2이상의 정수)개의 음성 특징 벡터 그룹으로 그룹핑하는 단계; 상기 N개의 음성 특징 벡터 그룹을 병렬적으로 처리하여 제 n(여기서, n은 1≤n≤N인 정수) 음성 특징 벡터 그룹에 포함된 음성 특징 벡터들의 출력 확률을 계산하는 단계; 상기 제 n 음성 특징 벡터 그룹에 대하여 계산된 출력 확률과 기 구축된 HMM 모델을 기반으로 병렬적 음성 인식을 수행하여 N개의 음성 인식 결과를 생성하는 단계; 및 상기 N개의 음성 인식 결과를 결합하여 최종 음성 인식 결과를 생성하는 단계를 포함한다. 본 발명의 실시 예들에 따르면, 대용량 어휘 기반의 자연어 연속 음성 인식을 고속으로 수행할 수 있다.
Int. CL G10L 15/14 (2006.01.01) G10L 15/28 (2006.01.01)
CPC G10L 15/142(2013.01) G10L 15/142(2013.01)
출원번호/일자 1020150116871 (2015.08.19)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2017-0022188 (2017.03.02) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 취하
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 18

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김태중 대한민국 대전광역시 유성구
2 김윤주 대한민국 경기도 성남시 분당구
3 김주엽 대한민국 대전광역시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인이상 대한민국 서울특별시 서초구 바우뫼로 ***(양재동, 우도빌딩 *층)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2015.08.19 수리 (Accepted) 1-1-2015-0804522-78
2 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2016.10.15 수리 (Accepted) 1-1-2016-0999581-13
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
음성 특징 벡터들을 설정된 방법에 따라 N(여기서, N은 2이상의 정수)개의 음성 특징 벡터 그룹으로 그룹핑하는 단계; 상기 N개의 음성 특징 벡터 그룹을 병렬적으로 처리하여 제 n(여기서, n은 1≤n≤N인 정수) 음성 특징 벡터 그룹에 포함된 음성 특징 벡터들의 출력 확률을 계산하는 단계; 상기 제 n 음성 특징 벡터 그룹에 대하여 계산된 출력 확률과 기 구축된 HMM 모델을 기반으로 병렬적 음성 인식을 수행하여 N개의 음성 인식 결과를 생성하는 단계; 및 상기 N개의 음성 인식 결과를 결합하여 최종 음성 인식 결과를 생성하는 단계를 포함하는 음성 인식 방법
2 2
제 1 항에 있어서, 상기 그룹핑하는 단계는, 각각의 음성 특징 벡터 그룹이 동일한 시간 구간을 갖도록, 상기 음성 특징 벡터들을 그룹핑하는 단계를 포함하는 음성 인식 방법
3 3
제 1 항에 있어서, 상기 그룹핑하는 단계는, 제 n 음성 특징 벡터 그룹과 제 n-1 음성 특징 벡터 그룹이 적어도 하나의 음성 특징 벡터를 공유하도록, 상기 음성 특징 벡터들을 그룹핑하는 단계를 포함하는 음성 인식 방법
4 4
제 3 항에 있어서, 상기 N개의 음성 인식 결과를 결합하는 단계는, 상기 공유된 음성 특징 벡터가 나타내는 어느 하나의 음소를 기준으로 상기 N개의 음성 인식 결과를 결합하는 단계를 포함하는 음성 인식 방법
5 5
제 1 항에 있어서, 상기 그룹핑하는 단계는, 묵음 구간을 기준으로 하여, 상기 음성 특징 벡터들을 그룹핑하는 단계를 포함하는 음성 인식 방법
6 6
제 1 항에 있어서, 상기 그룹핑하는 단계는, 각각이 모든 음성 특징 벡터들을 포함하는 제 1 및 제 2 음성 특징 벡터 그룹으로 상기 음성 특징 벡터들을 그룹핑하는 단계를 포함하고, 상기 음성 인식을 병렬적으로 수행하는 단계는, 상기 제 1 음성 특징 벡터 그룹에 포함된 음성 특징 벡터들에 대하여 순차적으로 음성 인식을 수행하여 제 1 음성 인식 결과를 생성하고, 상기 제 2 음성 특징 벡터 그룹에 포함된 음성 특징 벡터들에 대하여 역순으로 음성 인식을 수행하여 제 2 음성 인식 결과를 생성하는 단계를 포함하는 음성 인식 방법
7 7
제 6 항에 있어서, 상기 N개의 음성 인식 결과를 결합하는 단계는, 상기 제 1 및 제 2 음성 특징 벡터 그룹에 속하는 음성 특징 벡터들 중 절반 이상에 대한 음성 인식이 수행되고 난 후, 상기 제 1 및 제 2 음성 특징 벡터 그룹 간에 동일한 음소가 최초로 인식되는 경우 해당 음소를 기준으로 상기 제 1 및 제 2 음성 인식 결과를 결합하는 단계를 포함하는 음성 인식 방법
8 8
제 1 항에 있어서, 상기 음성 인식을 병렬적으로 수행하는 단계는, 비터비 알고리즘을 이용하여 음성 인식을 수행하는 단계를 포함하는 음성 인식 방법
9 9
음성 인식의 대상이 되는 음성 신호로부터 음성 특징 벡터들을 도출하는 단계; 기 구축된 음향 모델이 설정된 방법에 따라 분할된 N(여기서, N은 2이상의 정수) 개의 서브 음향 모델들 중 제 n(여기서, n은 1≤n≤N인 정수) 음향 모델의 HMM 파라미터 및 상기 음성 특징 모듈로부터 수신되는 음성 특징 벡터들을 기반으로, 상기 음성 특징 벡터들의 출력 확률을 병렬적으로 계산하는 단계; 상기 제 n 음향 모델 및 상기 계산된 출력 확률들을 기반으로 비터비 경로 계산을 병렬적으로 수행하는 단계; 상기 제 n 음향 모델 및 상기 계산된 비터비 경로 정보를 기반으로 노드 갱신을 병렬적으로 수행하는 단계; 및 기 구축된 언어 모델 및 상기 갱신된 노드 정보를 기반으로 백트래킹을 수행하여 음성 인식 결과를 생성하는 단계 를 포함하는 음성 인식 방법
10 10
음성 특징 벡터들을 설정된 방법에 따라 N(여기서, N은 2이상의 정수)개의 음성 특징 벡터 그룹으로 그룹핑하는 그룹핑 모듈; 상기 N개의 음성 특징 벡터 그룹을 병렬적으로 처리하여 제 n(여기서, n은 1≤n≤N인 정수) 음성 특징 벡터 그룹에 포함된 음성 특징 벡터들의 출력 확률을 계산하는 확률 계산 모듈; 상기 제 n 음성 특징 벡터 그룹에 대하여 계산된 출력 확률과 기 구축된 HMM 모델을 기반으로 병렬적 음성 인식을 수행하여 N개의 음성 인식 결과를 생성하는 디코딩 모듈; 및 상기 N개의 음성 인식 결과를 결합하여 최종 음성 인식 결과를 생성하는 결합 모듈을 포함하는 음성 인식 장치
11 11
제 10 항에 있어서, 상기 그룹핑 모듈은, 각각의 음성 특징 벡터 그룹이 동일한 시간 구간을 갖도록, 상기 음성 특징 벡터들을 그룹핑하는 음성 인식 장치
12 12
제 10 항에 있어서, 상기 그룹핑 모듈은, 제 n 음성 특징 벡터 그룹과 제 n-1 음성 특징 벡터 그룹이 적어도 하나의 음성 특징 벡터를 공유하도록, 상기 음성 특징 벡터들을 그룹핑하는 음성 인식 장치
13 13
제 12 항에 있어서, 상기 결합 모듈은, 상기 공유된 음성 특징 벡터가 나타내는 어느 하나의 음소를 기준으로 상기 N개의 음성 인식 결과를 결합하는 음성 인식 장치
14 14
제 10 항에 있어서, 상기 그룹핑 모듈은, 묵음 구간을 기준으로 하여, 상기 음성 특징 벡터들을 그룹핑하는 음성 인식 장치
15 15
제 10 항에 있어서, 상기 그룹핑 모듈은, 각각이 모든 음성 특징 벡터들을 포함하는 제 1 및 제 2 음성 특징 벡터 그룹으로 상기 음성 특징 벡터들을 그룹핑하고, 상기 디코딩 모듈은, 상기 제 1 음성 특징 벡터 그룹에 포함된 음성 특징 벡터들에 대하여 순차적으로 음성 인식을 수행하여 제 1 음성 인식 결과를 생성하고, 상기 제 2 음성 특징 벡터 그룹에 포함된 음성 특징 벡터들에 대하여 역순으로 음성 인식을 수행하여 제 2 음성 인식 결과를 생성하는 음성 인식 장치
16 16
제 15 항에 있어서, 상기 디코딩 모듈은, 상기 제 1 및 제 2 음성 특징 벡터 그룹에 속하는 음성 특징 벡터들 중 절반 이상에 대한 음성 인식이 수행되고 난 후, 상기 제 1 및 제 2 음성 특징 벡터 그룹 간에 동일한 음소가 최초로 인식되는 경우 음성 인식을 중지하고, 상기 결합 모듈은, 상기 동일한 음소를 기준으로 상기 제 1 및 제 2 음성 인식 결과를 결합하는 음성 인식 장치
17 17
제 10 항에 있어서, 상기 디코딩 모듈은, 비터비 알고리즘을 이용하여 음성 인식을 수행하는 음성 인식 장치
18 18
음성 인식의 대상이 되는 음성 신호로부터 음성 특징 벡터들을 도출하는 음성 특징 모듈; 기 구축된 음향 모델이 설정된 방법에 따라 분할된 N(여기서, N은 2이상의 정수) 개의 서브 음향 모델들 중 제 n(여기서, n은 1≤n≤N인 정수) 음향 모델의 HMM 파라미터 및 상기 음성 특징 모듈로부터 수신되는 음성 특징 벡터들을 기반으로, 상기 음성 특징 벡터들의 출력 확률을 계산하는 제 n 확률 계산 모듈; 상기 제 n 음향 모델 및 제 1 내지 제 N 확률 계산 모듈로부터 수신되는 출력 확률을 기반으로, 비터비 경로 계산을 수행하는 제 n 경로 계산 모듈; 상기 제 n 음향 모델 및 제 1 내지 제 N 경로 계산 모듈로부터 수신되는 비터비 경로 정보를 기반으로, 노드를 갱신하는 제 n 노드 갱신 모듈; 및 기 구축된 언어 모델 및 제 1 내지 제 N 노드 갱신 모듈로부터 수신되는 갱신된 노드 정보를 기반으로, 백트래킹을 수행하여 음성 인식 결과를 생성하는 음성 인식 결과 생성 모듈을 포함하는 음성 인식 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 산업통상자원부 한국전자통신연구원 산업융합원천기술개발사업 D2D연결과 실시간 음성인식 제공 디지털미디어허브 개방형 HW/SW 플랫폼 기술 개발