맞춤기술찾기

이전대상기술

강인한 음성인식을 위한 채널 정규화 장치 및 그 방법

  • 기술번호 : KST2016001094
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 음성인식의 실제 적용에 있어 성능에 영향을 주는 채널변이를 해결하고자 하는 것이다. 이러한 본 발명의 장치는 멜(mel)-주파수 켑스트럼 계수(MFCC) 특징을 추출하여 시간에 따른 프레임열을 출력하는 특징추출부; 상기 출력된 멜-주파수 켑스트럼 계수(MFCC) 특징열의 평균값을 계산하는 특징 파라미터 평균계산부; 채널변이를 줄인 음성 데이터베이스로부터 코드북을 구성한 후, 채널왜곡된 입력음성의 멜-주파수 켑스트럼 계수(MFCC)값이 들어오면 각 프레임의 멜-주파수 켑스트럼 계수(MFCC)값과 상기 코드북 중심값과의 거리를 구해 프레임별 채널변이를 추정하는 프레임별 채널변이 추정부; 및 상기 특징 파라미터 평균계산부에서 얻어진 채널변이와 상기 프레임별 채널변이 추정부에서 얻어진 시간별 채널변이의 평균값을 스무싱(smoothing)한 후 스무싱된 평균값을 각 프레임의 멜-주파수 켑스트럼 계수(MFCC)에서 빼어 채널정규화된 멜-주파수 켑스트럼 계수(MFCC) 특징열을 출력하는 스무싱 기반 채널정규화부로 구성된다. 따라서 본 발명은 음성인식시스템의 안정적인 성능을 위해서 채널정규화 방법을 제시하고 있으며, 다양한 채널변이가 있는 환경, 특히 전화망 환경에서 인식성능 향상에 기여할 수 있다. 음성인식, 채널정규화, MFCC, 평균, 채널변이 추정
Int. CL G10L 15/28 (2013.01) G10L 25/24 (2013.01)
CPC G10L 15/20(2013.01)
출원번호/일자 1020050037094 (2005.05.03)
출원인 한국전자통신연구원
등록번호/일자 10-0614932-0000 (2006.08.16)
공개번호/일자 10-2006-0067097 (2006.06.19) 문서열기
공고번호/일자 (20060825) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020040105509   |   2004.12.14
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2005.05.03)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 정호영 대한민국 대전시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 권태복 대한민국 서울시 강남구 테헤란로*길 **, *층 (역삼동, 청원빌딩)(아리특허법률사무소)
2 이화익 대한민국 서울시 강남구 테헤란로*길** (역삼동,청원빌딩) *층,***,***호(영인국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2005.05.03 수리 (Accepted) 1-1-2005-0233417-09
2 등록결정서
Decision to grant
2006.08.10 발송처리완료 (Completion of Transmission) 9-5-2006-0461939-37
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
멜-주파수 켑스트럼 계수(MFCC) 특징을 추출하여 시간에 따른 프레임열을 출력하는 특징추출부; 상기 출력된 멜-주파수 켑스트럼 계수(MFCC) 특징열의 평균값을 계산하는 특징 파라미터 평균계산부; 채널변이를 줄인 음성 데이터베이스로부터 코드북을 구성한 후, 채널왜곡된 입력음성의 멜-주파수 켑스트럼 계수(MFCC)값이 들어오면 각 프레임의 멜-주파수 켑스트럼 계수(MFCC)값과 상기 코드북 중심값과의 거리를 구해 프레임별 채널변이를 추정하는 프레임별 채널변이 추정부; 및 상기 특징 파라미터 평균계산부에서 얻어진 채널변이와 상기 프레임별 채널변이 추정부에서 얻어진 시간별 채널변이의 평균값을 스무싱(smoothing)한 후 스무싱된 평균값을 각 프레임의 멜-주파수 켑스트럼 계수(MFCC)에서 빼어 채널정규화된 멜-주파수 켑스트럼 계수(MFCC) 특징열을 출력하는 스무싱 기반 채널정규화부를 포함하는 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 장치
2 2
제 1 항에 있어서, 상기 코드북은 피시에이(PCA:Principle Component Analysis) 기반으로 구성된 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 장치
3 3
제 2 항에 있어서, 상기 PCA 기반 코드북은 중심값 개수를 8∼10개로 설계하는 것을 특징으로 하는강인한 음성인식을 위한 채널 정규화 장치
4 4
제 1 항에 있어서, 상기 채널 정규화 장치는 채널정규화의 실시간처리를 위해 이전 발화로부터 얻어진 채널추정값으로 현재 입력발화를 정규화하고, 현재발화의 추정값은 다음 발화를 위해 과거값과 함께 지속적으로 갱신하는 채널변이 갱신부를 더 구비한 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 장치
5 5
제 4 항에 있어서, 상기 실시간 채널정규화장치는 온라인 음성인식시스템에 적용되는 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 장치
6 6
제 1 항에 있어서, 상기 특징추출부는 음성신호의 주파수 스펙트럼 정보를 추출하는 스펙트럼 분석부와, 상기 스펙트럼 분석부에 의해 구해진 스펙트럼으로부터 간략화된 스펙트럼의 포락선을 구하는 필터뱅크부와, 상기 간략화된 스펙트럼의 크기를 로그함수를 이용하여 함축시키는 로그 압축부와, 상기 로그 압축부의 출력을 이산 코사인 변환(DCT)하여 켑스트럼 계수를 구하는 이산 코사인 변환부로 구성된 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 장치
7 7
각 시간별 채널변이를 추정하기 위하여 채널변이를 줄인 음성을 대상으로 멜-주파수 켑스트럼 계수(MFCC) 특징을 추출한 후, 일정크기의 코드북을 구성하는 단계; 입력음성에 대한 각 프레임의 멜-주파수 켑스트럼 계수(MFCC)값과 상기 코드북 중심값과의 거리를 구해 프레임별 채널변이로 추정하는 추정하는 단계; 상기 입력음성에 대한 멜-주파수 켑스트럼 계수(MFCC) 특징열의 평균값을 계산하는 단계; 및 상기 평균값으로 얻어진 채널변이와 상기 시간별 채널변이의 추정으로 구한 평균값을 스무싱(smoothing)한 후 스무싱된 평균값을 각 프레임의 멜-주파수 켑스트럼 계수(MFCC)에서 빼어 채널정규화된 멜-주파수 켑스트럼 계수(MFCC) 특징열을 출력하는 단계를 구비한 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 방법
8 8
제 7 항에 있어서, 상기 코드북은 피시에이(PCA: Principle Component Analysis) 기반으로 구성된 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 방법
9 9
제 8 항에 있어서, 상기 PCA기반 코드북은 중심값 개수를 8∼10개로 설계하는 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 방법
10 10
제 7 항에 있어서, 상기 채널 정규화 방법은 채널정규화의 실시간처리를 위해 이전 발화로부터 얻어진 채널추정값으로 현재 입력발화를 정규화하고, 현재발화의 추정값은 다음 발화를 위해 과거값과 함께 지속적으로 갱신하는 단계를 더 구비한 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 방법
11 11
제 7 항에 있어서, 상기 채널변이 추정 단계는 수학식으로 채널변이를 추정하는 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 방법
12 12
제 7 항에 있어서, 상기 스무싱 단계는 수학식으로 채널변이를 산출하는 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 방법
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US07702505 US 미국 FAMILY
2 US20060129391 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2006129391 US 미국 DOCDBFAMILY
국가 R&D 정보가 없습니다.