맞춤기술찾기

이전대상기술

모음 특징을 이용한 음성구간 검출 시스템 및 방법과 이에 사용되는 음향 스펙트럼 유사도 측정 방법

  • 기술번호 : KST2015132305
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 음성 인식을 위한 음성구간 검출 기술에 관한 것으로서, 본 발명에 따른 모음 특징을 이용한 음성구간 검출 시스템은 모음의 스펙트럼에서 특징 피크가 위치한 피크 대역을 나타내는 모음특징정보를 저장하는 모음특징 저장부; 및 입력 음향의 스펙트럼에서 상기 저장된 모음특징정보가 나타내는 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 이용하여 상기 입력 음향이 음성에 해당하는지를 판단함으로써 음성구간을 검출하는 음성구간 검출부를 포함하는 것을 특징으로 하여, 다양한 잡음 환경 및 SNR 하에서 음성구간 검출 성능을 개선함은 물론, 연산량을 감소시켜 음성 인식 시스템의 에너지 효율을 개선하는 이점을 제공한다.
Int. CL G10L 15/20 (2013.01) G10L 25/03 (2013.01) G10L 15/08 (2013.01) G10L 25/84 (2013.01)
CPC G10L 25/78(2013.01) G10L 25/78(2013.01) G10L 25/78(2013.01) G10L 25/78(2013.01) G10L 25/78(2013.01) G10L 25/78(2013.01)
출원번호/일자 1020090033531 (2009.04.17)
출원인 고려대학교 산학협력단
등록번호/일자 10-1022519-0000 (2011.03.08)
공개번호/일자 10-2010-0115033 (2010.10.27) 문서열기
공고번호/일자 (20110316) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2009.04.17)
심사청구항수 19

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 대한민국 서울특별시 성북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 육동석 대한민국 서울 용산구
2 유인철 대한민국 서울특별시 성북구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인충현 대한민국 서울특별시 서초구 동산로 **, *층(양재동, 베델회관)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 대한민국 서울특별시 성북구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2009.04.17 수리 (Accepted) 1-1-2009-0232808-17
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.06.09 수리 (Accepted) 4-1-2009-5111177-32
3 선행기술조사의뢰서
Request for Prior Art Search
2009.12.02 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2010.01.15 수리 (Accepted) 9-1-2010-0004990-49
5 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2010.04.02 수리 (Accepted) 1-1-2010-0213273-14
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.08.12 수리 (Accepted) 4-1-2010-5149278-93
7 의견제출통지서
Notification of reason for refusal
2010.08.31 발송처리완료 (Completion of Transmission) 9-5-2010-0384107-66
8 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2010.11.01 수리 (Accepted) 1-1-2010-0710592-43
9 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2010.11.01 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2010-0710594-34
10 등록결정서
Decision to grant
2011.03.03 발송처리완료 (Completion of Transmission) 9-5-2011-0121816-18
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.02.11 수리 (Accepted) 4-1-2014-5018243-16
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.04.22 수리 (Accepted) 4-1-2014-5049934-62
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.10.10 수리 (Accepted) 4-1-2019-5210941-09
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
사전 학습된 잡음없는 모음의 스펙트럼에서 특징 피크가 위치한 피크 대역을 나타내는 모음특징정보를 미리 저장하는 모음특징 저장부; 및 입력 음향의 스펙트럼에서 상기 저장된 모음특징정보가 나타내는 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 이용하여 상기 입력 음향이 음성에 해당하는지를 판단함으로써 음성구간을 검출하는 음성구간 검출부를 포함하는 모음 특징을 이용한 음성구간 검출 시스템
2 2
제1항에 있어서, 상기 모음특징 저장부는, 상기 모음의 스펙트럼 피크들 중 미리 결정된 문턱값(threshold)보다 큰 에너지를 지니는 피크를 특징 피크로 추출하는 특징피크 추출부; 및 상기 추출된 특징 피크가 상기 모음의 스펙트럼에서 위치한 피크 대역을 나타내는 모음특징정보를 생성하는 특징정보 생성부를 포함하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
3 3
제2항에 있어서, 상기 특징정보 생성부는, 상기 모음의 전체 스펙트럼 대역을 소정 개수의 단위 대역으로 구별하여, 상기 모음의 스펙트럼에서 상기 피크 대역에 해당하는 단위 대역을 1로 나타내고 상기 피크 대역 이외의 대역인 밸리 대역(valley band)에 해당하는 단위 대역을 0으로 나타내는 상기 모음특징정보를 생성하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
4 4
제1항에 있어서, 상기 음성구간 검출부는, 상기 입력 음향의 스펙트럼에서, 상기 저장된 모음특징정보의 상기 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 산출하는 평균에너지 산출부; 및 상기 대응 대역 및 상기 비대응 대역 간의 평균에너지 차를 이용하여 상기 모음 및 상기 입력 음향 간 스펙트럼 유사도를 측정하는 유사도 측정부를 포함하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
5 5
제4항에 있어서, 상기 유사도 측정부는, 상기 대응 대역의 평균에너지에서 상기 비대응 대역의 평균에너지를 감산한 값을 나타내는 PVED(Peak-Valley Energy Difference) 값을 이용하여 상기 스펙트럼 유사도를 측정하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
6 6
제5항에 있어서, 상기 음성구간 검출부는, 상기 PVED 값이 미리 결정된 임계값보다 큰 경우 상기 입력 음향을 음성으로 판단하여 음성구간으로 검출하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
7 7
제6항에 있어서, 상기 음성구간 검출부는, 상기 저장된 모음특징정보들에 대하여 상기 PVED 값을 산출하고, 상기 산출된 PVED 값 중 최대 PVED 값이 상기 임계값보다 큰 경우 상기 입력 음향을 음성으로 판단하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
8 8
제6항에 있어서, 상기 음성구간 검출부는, 상기 PVED 값이 상기 임계값보다 크지 않은 경우 상기 입력 음향에 대해 행오버(Hang-over) 알고리즘을 적용하는 행오버 처리부를 더 포함하고, 상기 음성구간 검출부는, 상기 행오버 처리부에 의해 상기 입력 음향이 음성으로 처리되는 경우 상기 입력 음향을 음성으로 판단하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
9 9
음성구간 검출 시스템(Voice Activity Detection system)에서 상기 시스템에 입력되는 입력 음향들의 음성구간을 검출하는 방법에 있어서, 사전 학습된 잡음없는 모음의 스펙트럼에서 특징 피크가 위치한 피크 대역을 나타내는 모음특징정보를 미리 저장하는 모음특징 저장 단계; 및 입력 음향의 스펙트럼에서 상기 저장된 모음특징정보가 나타내는 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 이용하여 상기 입력 음향이 음성에 해당하는지를 판단함으로써 음성구간을 검출하는 음성구간 검출 단계를 포함하는 모음 특징을 이용한 음성구간 검출 방법
10 10
제9항에 있어서, 상기 모음특징 저장 단계는, 상기 모음의 스펙트럼 피크들 중 미리 결정된 문턱값(threshold)보다 큰 에너지를 지니는 피크를 특징 피크로 추출하는 특징피크 추출 단계; 및 상기 추출된 특징 피크가 상기 모음의 스펙트럼에서 위치한 피크 대역을 나타내는 모음특징정보를 생성하는 특징정보 생성 단계를 포함하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
11 11
제10항에 있어서, 상기 특징정보 생성 단계는, 상기 모음의 전체 스펙트럼 대역을 소정 개수의 단위 대역으로 구별하여, 상기 모음의 스펙트럼에서 상기 피크 대역에 해당하는 단위 대역을 1로 나타내고 상기 피크 대역 이외의 대역인 밸리 대역(valley band)에 해당하는 단위 대역을 0으로 나타내는 상기 모음특징정보를 생성하는 단계인 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
12 12
제9항에 있어서, 상기 음성구간 검출 단계는, 상기 입력 음향의 스펙트럼에서, 상기 저장된 모음특징정보의 상기 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 산출하는 평균에너지 산출 단계; 및 상기 대응 대역 및 상기 비대응 대역 간의 평균에너지 차를 이용하여 상기 모음 및 상기 입력 음향 간 스펙트럼 유사도를 측정하는 유사도 측정 단계를 포함하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
13 13
제12항에 있어서, 상기 유사도 측정 단계는, 상기 대응 대역의 평균에너지에서 상기 비대응 대역의 평균에너지를 감산한 값을 나타내는 PVED(Peak-Valley Energy Difference) 값을 이용하여 상기 스펙트럼 유사도를 측정하는 단계인 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
14 14
제13항에 있어서, 상기 음성구간 검출 단계는, 상기 PVED 값이 미리 결정된 임계값보다 큰 경우 상기 입력 음향을 음성으로 판단하여 음성구간으로 검출하는 단계인 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
15 15
제14항에 있어서, 상기 음성구간 검출 단계는, 상기 저장된 모음특징정보들에 대하여 상기 PVED 값을 산출하고, 상기 산출된 PVED 값 중 최대 PVED 값이 상기 임계값보다 큰 경우 상기 입력 음향을 음성으로 판단하는 단계인 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
16 16
제14항에 있어서, 상기 음성구간 검출 단계는, 상기 PVED 값이 상기 임계값보다 크지 않은 경우 상기 입력 음향에 대해 행오버(Hang-over) 알고리즘을 적용하는 행오버 처리 단계를 더 포함하고, 상기 음성구간 검출 단계는, 상기 행오버 처리 단계에 의해 상기 입력 음향이 음성으로 처리되는 경우 상기 입력 음향을 음성으로 판단하는 단계인 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
17 17
음성구간 검출 시스템(Voice Activity Detection system)에서 사전 학습된 잡음없는 모음 및 상기 시스템에 입력되는 입력 음향 간 주파수 스펙트럼의 유사도(similarity)를 측정하는 방법에 있어서, 상기 입력 음향의 스펙트럼에서, 상기 모음의 스펙트럼 상 특징 피크가 위치한 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 산출하는 단계; 및 상기 대응 대역 및 상기 비대응 대역 간의 평균에너지 차를 이용하여 상기 모음 및 상기 입력 음향 간 스펙트럼 유사도를 측정하는 단계를 포함하는 음향 스펙트럼 유사도 측정 방법
18 18
제17항에 있어서, 상기 유사도 측정 단계는, 상기 대응 대역의 평균에너지에서 상기 비대응 대역의 평균에너지를 감산한 값을 나타내는 PVED(Peak-Valley Energy Difference) 값을 이용하여 상기 스펙트럼 유사도를 측정하는 단계인 것을 특징으로 하는 음향 스펙트럼 유사도 측정 방법
19 19
제9항 내지 제18항 중 어느 한 항에 따른 방법을 컴퓨터로 실행하기 위한 프로그램이 기록된 컴퓨터 판독가능 기록매체
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.