맞춤기술찾기

이전대상기술

2단계 탐색을 이용한 음성인식 장치 및 그 방법

  • 기술번호 : KST2015131129
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 2단계 탐색을 이용한 음성인식 장치 및 그 방법이 개시된다.본 발명은 입력된 음성에 대하여 풀에 포함된 소정 개수 이하의 가우시안 분포들을 이용한 비터비 탐색을 수행하여 복수개의 후보 단어들을 생성하는 고속 탐색부, 상기 후보 단어들 중 신뢰도가 높은 순서로 후보 단어들을 추출하는 N-best 후보 생성부 및 상기 추출된 후보 단어들에 대하여 상기 풀에 포함된 소정 개수 이상의 가우시안 분포들을 이용한 비터비 탐색을 수행하여 인식된 단어를 출력하는 정밀 탐색부를 포함한다.본 발명에 의하면, 음성 인식률을 저하시키지 않으면서 음성 인식의 속도를 향상시킬 수 있고, 전체 시스템의 성능을 향상 시킬 수 있는 효과가 있다.
Int. CL G10L 15/28 (2013.01)
CPC G10L 15/08(2013.01) G10L 15/08(2013.01)
출원번호/일자 1020060020754 (2006.03.06)
출원인 고려대학교 산학협력단
등록번호/일자 10-0764247-0000 (2007.09.28)
공개번호/일자 10-2007-0070000 (2007.07.03) 문서열기
공고번호/일자 (20071008) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020050132412   |   2005.12.28
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2006.03.06)
심사청구항수 21

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 대한민국 서울특별시 성북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 고한석 미국 서울 용산구
2 정석영 대한민국 서울 서대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 현종철 대한민국 서울특별시 중구 다산로 **, *층 특허법인충현 (신당동, 두지빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 대한민국 서울특별시 성북구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2006.03.06 수리 (Accepted) 1-1-2006-0157030-17
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2007.03.22 수리 (Accepted) 4-1-2007-5043540-16
3 의견제출통지서
Notification of reason for refusal
2007.04.24 발송처리완료 (Completion of Transmission) 9-5-2007-0216902-14
4 의견서
Written Opinion
2007.06.20 수리 (Accepted) 1-1-2007-0447966-29
5 명세서등보정서
Amendment to Description, etc.
2007.06.20 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2007-0447965-84
6 등록결정서
Decision to grant
2007.09.20 발송처리완료 (Completion of Transmission) 9-5-2007-0511179-96
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2008.03.05 수리 (Accepted) 4-1-2008-5034712-96
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.06.09 수리 (Accepted) 4-1-2009-5111177-32
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.08.12 수리 (Accepted) 4-1-2010-5149278-93
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.02.11 수리 (Accepted) 4-1-2014-5018243-16
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.04.22 수리 (Accepted) 4-1-2014-5049934-62
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.10.10 수리 (Accepted) 4-1-2019-5210941-09
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
입력된 음성에 대하여 풀에 포함된 특정 개수(이하 "N1"이라 함)의 가우시안 분포들을 이용한 비터비 탐색을 수행하여 복수개의 후보 단어들을 생성하는 고속 탐색부;상기 후보 단어들 중 신뢰도가 높은 순서로 후보 단어들을 추출하는 N-best 후보 생성부; 및상기 추출된 후보 단어들에 대하여 상기 풀에 포함된 특정 개수(이하 "N2"이라 함)의 가우시안 분포들을 이용한 비터비 탐색을 수행하여 인식된 단어를 출력하는 정밀 탐색부를포함하는 2단계 탐색을 이용한 음성인식 장치
2 2
제 1 항에 있어서,상기 N1은 상기 N2보다 작거나 같은 것을 특징으로 하는 2단계 탐색을 이용한 음성인식 장치
3 3
제 2 항에 있어서,상기 고속 탐색부는상기 풀에 포함된 모든 가우시안 분포들에 대해 마할라노비스 거리값들을 연산하는 마할라노비스 거리 연산부;상기 풀에 포함된 가우시안 분포들 중 상기 마할라노비스 거리값들이 큰 순서로 상기 N1 개의 가우시안 분포들을 선택하는 가우시안 선택부; 및상기 선택된 가우시안 분포들을 이용하여 로그합 연산을 수행하는 로그합 연산부를 포함함을 특징으로 하는 2단계 탐색을 이용한 음성인식 장치
4 4
제 3 항에 있어서,상기 연산된 마할라노비스 거리값들을 저장하는 가우시안 캐쉬 저장부를 더 포함하고,상기 정밀 탐색부는상기 가우시안 캐쉬 저장부로부터 마할라노비스 거리값들을 독출하는 가우시안 캐쉬 적용부를 포함함을 특징으로 하는 2단계 탐색을 이용한 음성인식 장치
5 5
제 3 항에 있어서,상기 마할라노비스 거리 연산부는상기 음성의 프레임마다 추출된 특징벡터와 상기 모든 가우시안 분포들 사이의 마할라노비스 거리값들을 연산하는 것을 특징으로 하는 2단계 탐색을 이용한 음성인식 장치
6 6
제 3 항에 있어서,상기 정밀 탐색부는상기 N2 개의 가우시안 분포들을 이용하여 로그합 연산을 수행하는 로그합 연산부; 및상기 로그합 연산의 결과 및 상기 마할라노비스 거리값들을 이용하여 상기 후보 단어들 중 가장 높은 우도를 갖는 1개의 단어를 추출하고, 상기 추출된 단어를 상기 인식된 단어로 출력하는 1-Best 탐색부를 포함함을 특징으로 하는 2단계 탐색을 이용한 음성인식 장치
7 7
제 2 항에 있어서,상기 N-best 후보 생성부는상기 후보 단어들의 신뢰도를 연산하여 상기 후보 단어들 중 상기 신뢰도가 임계값 이상인 후보 단어들을 선택하는 NLLR 검증부; 및상기 선택된 후보 단어들을 상기 정밀 탐색부로 출력하는 탐색 공간 생성부를 포함함을 특징으로 하는 2단계 탐색을 이용한 음성인식 장치
8 8
제 7 항에 있어서,상기 NLLR 검증부는상기 후보 단어들의 정규화된 로그 우도 비율을 연산하여, 상기 정규화된 로그 우도 비율이 임계값 이상인 후보 단어들을 선택하는 것을 특징으로 하는 는 2단계 탐색을 이용한 음성인식 장치
9 9
제 2 항에 있어서,상기 고속 탐색부 및 정밀 탐색부는동일한 음향모델을 적용함을 특징으로 하는 2단계 탐색을 이용한 음성인식 장치
10 10
제 2 항에 있어서, 상기 정밀 탐색부는상기 음성의 발화가 완료된 이후에, 비터비 탐색을 수행하여 인식된 단어를 출력하는 것을 특징으로 하는 2단계 탐색을 이용한 음성인식 장치
11 11
입력된 음성에 대하여 풀에 포함된 특정 개수(이하 "N1"이라 함)의 가우시안 분포들을 이용한 비터비 탐색을 수행하여 복수개의 후보 단어들을 생성하는 단계; 상기 후보 단어들 중 신뢰도가 높은 순서로 후보 단어들을 추출하는 단계; 및상기 추출된 후보 단어들에 대하여 상기 풀에 포함된 특정 개수(이하 "N2"이라 함)의 가우시안 분포들을 이용한 비터비 탐색을 수행하여 인식된 단어를 출력하는 단계를 포함하는2단계 탐색을 이용한 음성인식 방법
12 12
제 11 항에 있어서,상기 N1은 상기 N2보다 작거나 같은 것을 특징으로 하는 2단계 탐색을 이용한 음성인식 방법
13 13
제 12 항에 있어서,상기 후보 단어들을 생성하는 단계는상기 풀에 포함된 모든 가우시안 분포들에 대해 마할라노비스 거리값들을 연산하는 단계;상기 풀에 포함된 가우시안 분포들 중 상기 마할라노비스 거리값들이 큰 순서로 상기 N1 개의 가우시안 분포들을 선택하는 단계; 및상기 선택된 가우시안 분포들을 이용하여 로그합 연산을 수행하는 단계를 포함함을 특징으로 하는 2단계 탐색을 이용한 음성인식 방법
14 14
제 13 항에 있어서,상기 마할라노비스 거리값들을 연산하는 단계는상기 음성의 프레임마다 추출된 특징벡터와 상기 모든 가우시안 분포들 사이의 마할라노비스 거리값들을 연산하는 단계인 것을 특징으로 하는 2단계 탐색을 이용한 음성인식 방법
15 15
제 13 항에 있어서,상기 인식된 단어를 출력하는 단계는상기 N2 개의 가우시안 분포들을 이용하여 로그합 연산을 수행하는 단계; 및상기 로그합 연산의 결과 및 상기 마할라노비스 거리값들을 이용하여 상기 후보 단어들 중 가장 높은 우도를 갖는 1개의 단어를 추출하고, 상기 추출된 단어를 상기 인식된 단어로 출력하는 단계인 것을 특징으로 하는 2단계 탐색을 이용한 음성인식 방법
16 16
제 12 항에 있어서,상기 후보 단어들을 추출하는 단계는상기 후보 단어들의 신뢰도를 연산하는 단계; 및상기 후보 단어들 중 상기 신뢰도가 임계값 이상인 후보 단어들을 선택하는 단계를 더 포함함을 특징으로 하는 2단계 탐색을 이용한 음성인식 방법
17 17
제 16 항에 있어서,상기 신뢰도를 연산하는 단계는상기 후보 단어들의 정규화된 로그 우도 비율을 연산하는 단계인 것을 특징으로 하는 2단계 탐색을 이용한 음성인식 방법
18 18
제 17 항에 있어서,상기 정규화된 로그 우도 비율을 연산하는 단계는T가 인식될 음성의 프레임 개수이고, NLLRv가 V번째 후보 단어의 정규화된 로그 우도 비율이고, LKv 가 V번째 후보 단어의 우도이고, LLv 가 v번째 후보 단어의 로그 우도이고, LKmax가 모든 후보 단어들의 최대 우도이고, LLmax가 모든 후보 단어들의 최대 로그 우도인 경우에,의 식을 이용하여 상기 정규화된 로그 우도 비율을 연산하는 단계인 것을 특징으로 하는 2단계 탐색을 이용한 음성인식 방법
19 19
제 12 항에 있어서,상기 후보 단어들을 생성하는 단계 및 상기 인식된 단어를 출력하는 단계는동일한 음향모델을 적용함을 특징으로 하는 2단계 탐색을 이용한 음성인식 방법
20 20
제 12 항에 있어서, 상기 인식된 단어를 출력하는 단계는상기 음성의 발화가 완료된 이후에, 상기 비터비 탐색을 수행하여 인식된 단어를 출력하는 단계인 것을 특징으로 하는 2단계 탐색을 이용한 음성인식 방법
21 21
제 11 항 내지 제 20 항 중 어느 한 항에 기재된 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.