맞춤기술찾기

이전대상기술

음성 인식 방법 및 장치

  • 기술번호 : KST2015089192
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 음성 인식 진행 시에, 음성의 단구간 특징뿐만 아니라 시간 특성이 반영된 음성의 장구간 특징을 함께 파악하여, 전체적인 음성 인식의 성능을 개선할 수 있는 음성 인식 기술이 개시된다. 이를 위해, 본 발명에 따른 음성 인식 방법은 음성 신호에서 프레임 음성 특징 벡터를 추출하는 단계; 프레임 음성 특징 벡터와 프레임 기반 확률 모델을 이용하여, 음성 신호의 프레임 구간에 대한 음성 인식을 진행하는 단계; 상기 음성 신호를 상기 프레임 구간보다 시간상 길이가 긴 세그먼트 구간으로 분할하는 단계; 세그먼트 구간의 경계 구간을 중심으로 세그먼트 음성 특징 벡터를 추출하는 단계; 세그먼트 음성 특징 벡터와 세그먼트 기반 확률 모델을 이용하여 음성 인식을 진행하는 단계; 및 프레임 구간의 음성 인식의 결과와 세그먼트 구간의 음성 인식 결과를 결합하는 단계를 포함한다.
Int. CL G10L 15/02 (2006.01) G10L 15/14 (2006.01)
CPC
출원번호/일자 1020100133957 (2010.12.23)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2012-0072145 (2012.07.03) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 취하
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 16

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 정호영 대한민국 대전광역시 서구
2 박전규 대한민국 서울특별시 서초구
3 정훈 대한민국 강원도 홍천군

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 한양특허법인 대한민국 서울특별시 강남구 논현로**길 **, 한양빌딩 (도곡동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2010.12.23 수리 (Accepted) 1-1-2010-0854009-90
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
음성 신호에서 프레임 음성 특징 벡터를 추출하는 단계;상기 프레임 음성 특징 벡터와 프레임 기반 확률 모델을 이용하여, 상기 음성 신호의 프레임 구간에 대한 음성 인식을 진행하는 단계;상기 음성 신호를 상기 프레임 구간보다 시간상 길이가 긴 세그먼트 구간으로 분할하는 단계;상기 세그먼트 구간의 분할 경계 구간을 중심으로 세그먼트 음성 특징 벡터를 추출하는 단계;상기 세그먼트 음성 특징 벡터와 세그먼트 기반 확률 모델을 이용하여 음성 인식을 진행하는 단계; 및상기 프레임 구간의 음성 인식의 결과와 상기 세그먼트 구간의 음성 인식 결과를 결합하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법
2 2
청구항 1에 있어서, 상기 음성 신호를 상기 세그먼트 구간으로 분할하는 단계는, 인접하는 제 1 프레임 음성 특징 벡터와 제 2 프레임 음성 특징 벡터 사이의 거리 척도를 계산하여 기 정해진 값보다 큰 값을 갖는 경우, 상기 제 1 프레임 음성 특징 벡터와 상기 제 2 프레임 음성 특징 벡터의 사이를 세그먼트의 분할 지점으로 하여 상기 음성 신호를 상기 세그먼트 구간으로 분할하는 것을 특징으로 하는 음성 인식 방법
3 3
청구항 2에 있어서,상기 거리 척도는 시간에 따른 상기 음성 신호의 변화 값인 것을 특징으로 하는 음성 인식 방법
4 4
청구항 1에 있어서,상기 프레임 구간의 음성 인식의 결과와 상기 세그먼트 구간의 음성 인식 결과를 동기화하는 단계를 더 포함하는 것을 특징으로 하는 음성 인식 방법
5 5
청구항 4에 있어서, 상기 프레임 구간의 음성 인식의 결과와 상기 세그먼트 구간의 음성 인식 결과를 동기화하는 단계에서, 상기 프레임 구간의 음성 인식의 결과와 상기 세그먼트 구간의 음성 인식 결과의 음소 분할의 동기화를 위하여,상기 프레임 기반 확률 모델과 상기 세그먼트 기반 확률 모델의 결합 부분에 DBN(Dynamic Bayesian Network)에 기반한 전환선형동적모델(SLDM; Switching Linear Dynamic Model)을 적용하는 것을 특징으로 하는 음성 인식 방법
6 6
청구항 1에 있어서,상기 세그먼트 음성 특징 벡터를 추출하는 단계는,상기 세그먼트 음성 특징 벡터를상기 음성 신호의 상기 세그먼트 구간에 대한 주요소해석(PCA; Principle Component Analysis) 및 궤적 정보(Trajectory Information) 특징 추출 기법을 이용하여 추출하는 것을 특징으로 하는 음성 인식 방법
7 7
청구항 1에 있어서,상기 세그먼트 기반 확률 모델은 상기 세그먼트 음성 특징 벡터에 기반한 가우시안 모델인 것을 특징으로 하는 음성 인식 방법
8 8
청구항 1에 있어서, 상기 프레임 기반 확률 모델은 은닉 마르코프 모델(HMM; Hidden Markov Model)인 것을 특징으로 하는 음성 인식 방법
9 9
음성 신호에서 프레임 음성 특징 벡터를 추출하고, 상기 프레임 음성 특징 벡터와 프레임 기반 확률 모델을 이용하여, 상기 음성 신호의 프레임 구간에 대한 음성 인식을 진행하는 프레임 기반 음성 인식부;상기 음성 신호를 상기 프레임 구간보다 시간상 길이가 긴 세그먼트 구간으로 분할하는 세그먼트 분할부;상기 세그먼트 구간의 분할 경계 부분을 중심으로 세그먼트 음성 특징 벡터를 추출하는 세그먼트 특징 추출부;상기 세그먼트 음성 특징 벡터와 세그먼트 기반 확률 모델을 이용하여 음성 인식을 진행하는 세그먼트 음성 인식 진행부; 및상기 프레임 기반 음성 인식부에 의한 음성 인식 결과와, 상기 세그먼트 음성 인식 진행부의 음성 인식 결과를 결합하는 결합 동기화부를 포함하는 것을 특징으로 하는 음성 인식 장치
10 10
청구항 9에 있어서, 상기 세그먼트 분할부는인접하는 제 1 프레임 음성 특징 벡터와 제 2 프레임 음성 특징 벡터 사이의 거리 척도를 계산하여 기 정해진 값보다 큰 값을 갖는 경우, 상기 제 1 프레임 음성 특징 벡터와 상기 제 2 프레임 음성 특징 벡터의 사이를 세그먼트의 분할 지점으로 하여 상기 음성 신호를 세그먼트 구간으로 분할하는 것을 특징으로 하는 음성 인식 장치
11 11
청구항 10에 있어서, 상기 거리 척도는 시간에 따른 상기 음성 신호의 변화 값인 것을 특징으로 하는 음성 인식 장치
12 12
청구항 9에 있어서,상기 결합 동기화부는상기 프레임 기반 음성 인식부의 음성 인식 결과와, 상기 세그먼트 음성 인식 진행부의 음성 인식 결과를 동기화하는 것을 특징으로 하는 음성 인식 장치
13 13
청구항 12에 있어서,상기 결합 동기화부는상기 프레임 기반 음성 인식부의 음성 인식 결과와, 상기 세그먼트 음성 인식 진행부의 음성 인식 결과를 동기화하기 위하여,상기 프레임 기반 음성 인식부의 음성 인식 결과와, 상기 세그먼트 음성 인식 진행부의 음성 인식 결과의 결합 부분에 DBN(Dynamic Bayesian Network)에 기반한 전환선형동적모델(SLDM; Switching Linear Dynamic Model)을 적용하는 것을 특징으로 하는 음성 인식 장치
14 14
청구항 9에 있어서,상기 세그먼트 특징 추출부는,상기 세그먼트 음성 특징 벡터를상기 음성 신호의 상기 세그먼트 구간에 대한 주요소해석(PCA; Principle Component Analysis) 및 궤적 정보(Trajectory Information) 특징 추출 기법을 이용하여 추출하는 것을 특징으로 하는 음성 인식 장치
15 15
청구항 9에 있어서, 상기 세그먼트 기반 확률 모델은 상기 세그먼트 음성 특징 벡터에 기반한 가우시안 모델인 것을 특징으로 하는 음성 인식 장치
16 16
청구항 9에 있어서, 상기 프레임 기반 확률 모델은 은닉 마르코프 모델(HMM; Hidden Markov Model)인 것을 특징으로 하는 음성 인식 장치
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US20120166194 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2012166194 US 미국 DOCDBFAMILY
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 지식경제부 한국전자통신연구원 정보통신산업원천기술개발사업 모바일 플랫폼 기반 대화모델 적용 자연어 음성 인터페이스 기술 개발