맞춤기술찾기

이전대상기술

자동음성인식시스템의 음성 2단 끝점검출 장치 및 그 방법

  • 기술번호 : KST2015080186
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명의 목적은 로그 에너지를 이용한 음성의 끝점검출 방법과 통계적 모델을 이용한 음성의 끝점검출 방법의 장점만을 실현시켜 동적인 잡음환경 혹은 정적인 잡음환경 하에서도 보다 정확한 음성의 시작점 혹은 끝점을 검출하도록 하는 자동음성인식시스템의 음성 2단 끝점검출 장치 및 그 방법을 제공하는 데 있다. 상기와 같은 목적을 달성하기 위한 본 발명의 자동음성인식시스템의 음성 2단 끝점검출 장치는, 입력신호로부터 부가잡음 성분을 제거하여 입력신호의 음질을 향상시키는 입력 신호 음질 향상부와, 상기 입력 신호 음질 향상 수단에서 출력되는 부가잡음이 제거된 입력신호의 로그 에너지를 이용하여 음성의 시작점 혹은 끝점을 검출하는 로그 에너지 기반 음성 검출부와, 상기 로그 에너지 기반 음성 검출 수단에서 출력되는 상기 음성의 시작점 혹은 음성의 끝점 정보를 이용하고, 통계적 모델을 이용한 음성의 끝점검출 방법을 통해 음성의 시작 혹은 끝점을 검출하는 통계적 모델 기반 음성 검출부로 구성된다. 음성의 끝점검출, 음성 추출, 비음성 제거, 로그 에너지, 통계적 모델
Int. CL G10L 15/02 (2006.01) G10L 15/20 (2006.01)
CPC G10L 25/87(2013.01) G10L 25/87(2013.01) G10L 25/87(2013.01)
출원번호/일자 1020040097113 (2004.11.24)
출원인 한국전자통신연구원
등록번호/일자 10-0639930-0000 (2006.10.24)
공개번호/일자 10-2006-0057919 (2006.05.29) 문서열기
공고번호/일자 (20061101) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2004.11.24)
심사청구항수 18

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이성주 대한민국 대전시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 권태복 대한민국 서울시 강남구 테헤란로*길 **, *층 (역삼동, 청원빌딩)(아리특허법률사무소)
2 이화익 대한민국 서울시 강남구 테헤란로*길** (역삼동,청원빌딩) *층,***,***호(영인국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 주식회사 아이티레이 서울특별시 금천구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2004.11.24 수리 (Accepted) 1-1-2004-0551362-11
2 선행기술조사의뢰서
Request for Prior Art Search
2006.03.16 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2006.04.14 수리 (Accepted) 9-1-2006-0024431-80
4 의견제출통지서
Notification of reason for refusal
2006.04.27 발송처리완료 (Completion of Transmission) 9-5-2006-0243774-43
5 명세서등보정서
Amendment to Description, etc.
2006.06.27 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2006-0459589-11
6 의견서
Written Opinion
2006.06.27 수리 (Accepted) 1-1-2006-0459590-57
7 등록결정서
Decision to grant
2006.10.17 발송처리완료 (Completion of Transmission) 9-5-2006-0600766-18
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
입력신호로부터 부가잡음 성분을 제거하여 입력신호의 음질을 향상시키는 입력 신호 음질 향상 수단과;상기 입력 신호 음질 향상 수단에서 출력되는 부가잡음이 제거된 입력신호의 로그 에너지를 이용하여 음성의 시작점 혹은 끝점을 검출하는 로그 에너지 기반 음성 검출 수단과;상기 로그 에너지 기반 음성 검출 수단에서 출력되는 상기 음성의 시작점 혹은 음성의 끝점 정보를 이용하고, 통계적 모델을 이용한 음성의 끝점검출 방법을 통해 음성의 시작 혹은 끝점을 검출하는 통계적 모델 기반 음성 검출 수단을 포함하여 구성되어, 동적인 잡음환경과 정적인 잡음환경 하에서도 보다 정확한 음성의 시작점과 끝점을 검출하는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 장치
2 2
제 1 항에 있어서, 상기 입력신호 음질 향상 수단은 입력신호를 버퍼링하고, 그 버퍼링된 입력신호들로부터 음질을 향상시키고자 하는 소정의 짧은 구간의 음성신호를 프레이밍하는 입력신호 버퍼링 및 프레이밍부와; 상기 입력신호 버퍼링 및 프레이밍부에서 프레이밍된 신호의 주파수 스펙트럼을 분석하여 그 주파수 스펙트럼을 추정하는 입력신호 스펙트럼 추정부와; 상기 입력신호 버퍼링 및 프레이밍부에서 프레이밍된 신호가 음성신호인지를 판단하는 음성 검출부와; 상기 음성 검출부의 음성 검출 결과를 이용하여 잡음 스펙트럼을 추정하는 잡음 스펙트럼 추정부와; 상기 입력신호 스펙트럼 추정부에서 추정된 입력신호의 스펙트럼과 상기 잡음 스펙트럼 추정부에서 추정된 잡음 스펙트럼을 이용하여 입력신호의 신호 대 잡음비를 추정하고 이를 기반 잡음 제거 계수를 추정하는 잡음제거 필터 계수 추정부와; 상기 입력신호 버퍼링 및 프레이밍부에서 프레이밍된 신호에 잡음 제거 필터 계수를 적용하여 음질이 향상된 음성신호를 출력하는 신호 재생부로 구성되는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 장치
3 3
제 2 항에 있어서, 상기 잡음 스펙트럼 추정부는 상기 음성 검출부에서 음성이 검출되지 않는 프레임에 대해서는 잡음 스펙트럼을 업데이트하고, 음성이 검출된 프레임에 대해서는 잡음 스펙트럼을 업데이트 하지 않는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 장치
4 4
제 1 항에 있어서, 상기 로그 에너지 기반 음성 검출 수단은 상기 입력신호 품질 향상 수단을 통하여 음질이 향상된 입력신호의 프레임으로부터 로그 에너지를 추정하는 로그 에너지 추정부와; 상기 로그 에너지 추정부를 통하여 추정된 입력 프레임의 로그 에너지와 음성 검출부의 음성 검출 결과를 기반으로 잡음의 로그 에너지 평균를 추정하는 잡음 로그 에너지 평균 추정부와; 상기 잡음 로그 에너지 평균 추정부에서 추정된 잡음의 로그 에너지 평균과 상기 로그 에너지 추정부에서 추정된 로그 에너지를 비교하여 입력 프레임이 음성인지 아니면 배경 잡음인지를 판단하는 음성 검출부와; 상기 음성 검출부의 음성 검출 결과를 기반으로 음성의 시작점과 끝점을 검출하는 음성 시작점/끝점 검출부로 구성되는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 장치
5 5
제 4 항에 있어서, 상기 잡음 로그 에너지 평균 추정부는 입력 로그 에너지가 잡음의 로그 에너지 평균 보다 소정의 정도 이상 크면 음성으로 판단하고, 그렇지 않은 경우 배경잡음으로 판단하는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 장치
6 6
제 4 항에 있어서, 상기 음성 검출부는 음성검출 결과 음성프레임으로 판별된 프레임이 연속적으로 일정 수 이상 나타날 경우, 연속된 음성 프레임들 중 첫 프레임을 음성의 시작점으로 판별하고, 음성의 시작점이 검출된 후 배경잡음 프레임으로 판별된 입력 프레임이 일정 수 이상 연속하여 나타날 경우 연속된 배경잡음 프레임들 중 첫 프레임을 음성의 끝점으로 판별하는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 장치
7 7
제 1 항에 있어서, 상기 통계적 모델 기반 음성 검출 수단은 상기 로그 에너지 기반 음성 검출수단에서 검출된 입력신호의 확률 분포 함수를 추정하는 입력 신호 확률 분포 함수 추정부와; 상기 입력신호 확률 분포 함수 추정부를 통한 신호의 잡음의 확률 분포 함수를 추정하는 잡음 확률 분포 함수를 추정하는 잡음 확률 분포 함수 추정부와; 상기 입력 신호 확률 분포 함수 추정부에서 추정된 입력신호의 확률 분포 함수와 상기 잡음 확률 분포 함수 추정부에서 추정된 잡음의 확률 분포 함수를 기반으로 음성이 존재하지 않을 확률 혹은 음성이 존재할 확률을 입력 프레임으로 계산하고, 이 확률값과 임계치를 비교하여 음성 검출 여부를 판단하는 확률 계산 및 음성 검출부와; 상기 확률 계산 및 음성 검출부의 음성 검출 결과를 기반으로 음성의 시작점과 끝점을 검출하는 음성 시작점/끝점 검출부로 구성되는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 장치
8 8
제 7 항에 있어서, 상기 음성 검출부는 음성이 존재하지 않을 확률이 특정 임계치 보다 높은 경우, 해당 입력프레임을 비음성 프레임으로 판단하고, 그렇지 않은 경우 음성프레임으로 판단하는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 장치
9 9
제 7 항에 있어서, 상기 음성 시작점/끝점 검출부는 음성검출 결과 음성프레임으로 판별된 프레임이 연속적으로 일정 수 이상 나타날 경우, 연속된 음성 프레임들 중 첫 프레임을 음성의 시작점으로 판별하고, 음성의 시작점이 검출된 후 배경잡음 프레임으로 판별된 입력 프레임이 일정 수 이상 연속하여 나타날 경우 연속된 배경잡음 프레임들 중 첫 프레임을 음성의 끝점으로 판별하는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 장치
10 10
입력신호가 입력되면, 그 입력신호로부터 부가잡음 성분을 제거하여 입력신호의 음질을 향상시키는 제1 단계와;상기 부가잡음이 제거된 입력신호의 로그 에너지를 이용하여 음성의 시작점 혹은 끝점을 검출하는 제2 단계와;상기 검출된 음성의 시작점 혹은 음성의 끝점 정보를 이용하고, 통계적 모델을 이용한 음성의 끝점검출 방법을 통한 음성의 시작 혹은 끝점을 검출하는 제3 단계를 포함하여 이루어져 동적인 잡음환경과 정적인 잡음환경 하에서도 보다 정확한 음성의 시작점과 끝점을 검출하는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 방법
11 11
제 10 항에 있어서, 상기 제1 단계는 디지털 입력신호를 실시간으로 처리하기 위하여 입력신호를 버퍼링하고, 버퍼링된 입력 신호들로부터 음질을 향상시키고자 하는 소정의 짧은 구간의 음성신호를 프레이밍하는 제1 과정과; 싱기 프레이밍된 신호의 주파수 스펙트럼을 분석하여 입력신호의 스펙트럼을 추정하는 제2 과정과; 상기 프레이밍된 신호가 음성신호인지를 판단하는 제3 과정과; 상기 음성검출 결과를 이용하여 잡음 스펙트럼을 추정하는 제4 과정과; 상기 추정된 입력신호의 스펙트럼과 상기 추정된 잡음 스펙트럼을 이용하여 입력신호의 신호대잡음비를 추정하고, 이를 기반으로 잡음제거 필터 계수를 추정하는 제5 과정과; 상기 프레이밍된 신호에 잡음제거 필터 계수를 적용하여 음질이 향상된 음성신호를 얻는 제6 과정으로 이루어 지는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 방법
12 12
제 11 항에 있어서, 제4 과정은 음성이 검출되지 않는 프레임에 대해서는 잡음 스펙트럼을 업데이트하고, 음성이 검출된 프레임에 대해서는 잡음 스펙트럼을 업데이트 하지 않는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 방법
13 13
제 10 항에 있어서, 상기 제2 단계는,상기 제1 단계에서 음질이 향상된 입력신호의 프레임으로부터 로그 에너지를 추정하는 제1 과정과;상기 추정된 입력 프레임의 로그 에너지와 음성검출 결과를 기반으로 잡음의 로그 에너지를 추정하는 제2 과정과;상기 추정된 잡음의 로그에너지 평균과 입력 로그 에너지를 비교하여 입력 프레임이 음성인지 아니면 배경 잡음인지를 판단하는 제3 과정과;상기 음성검출 결과를 기반으로 음성의 시작점과 끝점을 검출하는 제4 과정으로 이루어지는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 방법
14 14
제 13 항에 있어서, 상기 제3 과정은 입력 로그 에너지가 잡음의 로그 에너지 평균 보다 소정의 정도 이상 크면 음성으로 판단하고, 그렇지 않은 경우 배경잡음으로 판단하는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 방법
15 15
제 13 항에 있어서, 제4 과정은 음성검출 결과 음성프레임으로 판별된 프레임이 연속적으로 일정 수 이상 나타날 경우, 연속된 음성 프레임들 중 첫 프레임을 음성의 시작점으로 판별하는 제4-1 과정과; 음성의 시작점이 검출된 후 배경잡음 프레임으로 판별된 입력 프레임이 일정 수 이상 연속하여 나타날 경우 연속된 배경잡음 프레임들 중 첫 프레임을 음성의 끝점으로 판별하는 제4-2 과정으로 이루어 지는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 방법
16 16
제 10 항에 있어서, 상기 제3 단계는,상기 제2 단계에서의 입력 프레임으로부터 입력신호의 확률 분포 함수를 추정하는 제1 과정과;상기 추정된 입력신호의 확률 분포 함수와 음성 검출 결과를 기반으로 잡음의 확률 분포 함수를 추정하는 제2 과정과;상기 추정된 입력신호의 확률분포함수와 잡음신호의 확률분포함수를 기반으로 음성이 존재하지 않을 확률 혹은 음성이 존재할 확률을 입력프레임으로부터 계산하는 제3 과정과;이 확률값과 임계치를 비교함으로써 음성검출 여부를 판단하는 제4 과정과;상기 음성검출 결과를 기반으로 음성의 시작점과 끝점을 검출하는 제5 과정으로 이루어 지는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 방법
17 17
제 16 항에 있어서, 상기 제4 과정은 음성이 존재하지 않을 확률이 특정 임계치 보다 높은 경우, 해당 입력프레임을 비음성 프레임으로 판단하고, 그렇지 않은 경우 음성프레임으로 판단하는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 방법
18 18
제 16 항에 있어서, 상기 제5 과정은 음성검출 결과 음성프레임으로 판별된 프레임이 연속적으로 일정 수 이상 나타날 경우, 연속된 음성 프레임들 중 첫 프레임을 음성의 시작점으로 판별하는 제5-1 서브과정과; 음성의 시작점이 검출된 후 배경잡음 프레임으로 판별된 입력 프레임이 일정 수 이상 연속하여 나타날 경우 연속된 배경잡음 프레임들 중 첫 프레임을 음성의 끝점으로 판별하는 제5-2 서브과정으로 이루어 지는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 방법
19 18
제 16 항에 있어서, 상기 제5 과정은 음성검출 결과 음성프레임으로 판별된 프레임이 연속적으로 일정 수 이상 나타날 경우, 연속된 음성 프레임들 중 첫 프레임을 음성의 시작점으로 판별하는 제5-1 서브과정과; 음성의 시작점이 검출된 후 배경잡음 프레임으로 판별된 입력 프레임이 일정 수 이상 연속하여 나타날 경우 연속된 배경잡음 프레임들 중 첫 프레임을 음성의 끝점으로 판별하는 제5-2 서브과정으로 이루어 지는 것을 특징으로 하는 자동음성인식시스템의 음성 2단 끝점검출 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.