맞춤기술찾기

이전대상기술

피치 정보를 이용한 음성부 검출장치 및 그 검출방법

  • 기술번호 : KST2015102275
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 컴퓨터를 이용한 음성인식기의 응용분야에서 피치 정보를 이용한 음성 검출방법에 관한 것으로, 종래의 음성부(音聲部) 검출방법이 대부분 입력 신호의 에너지와 영교차율을 이용하여 음성의 시작점을 검출하기 때문에 인간의 음성뿐만 아니라 인간의 음성과 비슷한 에너지와 영교차율을 가진 비음성 잡음도 검출하는 단점이 있어서 음성인식기의 성능을 저하시키고 이에 따라 사용상에 많은 불편이 있었다. 이에 본 발명은 입력 신호를 마이크로 입력받아 이를 디지탈 신호로 변환하는 신호 입력부와, 에너지와 영교차율을 이용하여 음성신호의 시작점 후보 및 끝점을 검출하는 음성신호 시작점 후보 및 끝점 검출부와, 검출된 음성 신호의 시작점 후보 이후부터 유성음 구간을 검출하고 이 구간에 대하여 피치를 검출한 후 검출된 피치로부터 음성과 비음성을 판정하는 피치 정보에 의한 음성 판정부로 구성되어, 음성이 입력되었을 경우에만 음성부를 검출하고 기타 여러가지 비음성 잡음이 입력되었을 경우에는 이를 효과적이고도 신뢰성있게 배제시키는 기능을 갖도록 개발하여 이와같은 방법으로 검출된 음성부를 음성인식시스템의 입력으로 사용할 경우, 우수한 성능을 나타낼 수 있도록 하였다.
Int. CL G10L 25/90 (2006.01)
CPC G10L 25/90(2013.01)
출원번호/일자 1019970051434 (1997.10.07)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-1999-0030943 (1999.05.06) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 거절
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (1997.10.07)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 서영주 대한민국 대전광역시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이화익 대한민국 서울시 강남구 테헤란로*길** (역삼동,청원빌딩) *층,***,***호(영인국제특허법률사무소)
2 김명섭 대한민국 서울특별시 강남구 테헤란로**길 *, 테헤란오피스빌딩 ***호 시몬국제특허법률사무소 (역삼동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 출원심사청구서
Request for Examination
1997.10.07 수리 (Accepted) 1-1-1997-0163092-98
2 대리인선임신고서
Notification of assignment of agent
1997.10.07 수리 (Accepted) 1-1-1997-0163091-42
3 특허출원서
Patent Application
1997.10.07 수리 (Accepted) 1-1-1997-0163090-07
4 의견제출통지서
Notification of reason for refusal
1999.11.20 발송처리완료 (Completion of Transmission) 9-5-1999-0348731-19
5 거절사정서
Decision to Refuse a Patent
2000.02.24 발송처리완료 (Completion of Transmission) 9-5-2000-0032079-18
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2001.04.19 수리 (Accepted) 4-1-2001-0046046-20
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2002.08.08 수리 (Accepted) 4-1-2002-0065009-76
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1

입력된 신호를 프레임화시켜 음성신호의 시작점후보와 끝점을 검출하기 위한 프레임 임계에너지 및 임계 영교차율과, 음성/비음성을 판별하기 위한 임계 프레임 갯수를 설정하는 임계치 설정단계를 수행하고;

상기 임계치설정단계 이후에 입력된 외부신호를 연속적으로 프레임화하여 각 프레임 단위별로 에너지와 영교차율을 구하고 상기 임계 에너지 및 임계 영교차율과 비교하여 음성프레임여부를 판정하고 음성프레임에 대하여 시작점 후보를 구하는 시작점후보 검출단계를 수행하고;

상기 시작점후보 검출단계 이후에 입력되는 프레임에 대하여 유성음 구간을 검출하고 이 구간에 대하여 피치를 검출한 후, 검출된 피치로부터 음성과 비음성을 판정하는 피치분석에 의한 음성판정단계를 수행하고;

상기 음성판정단계에서 비음성으로 판정될 경우에는 다시 시작점 후보를 구하는 단계를 수행하게 하고, 음성으로 판정된 경우에는 상기 음성의 시작점 후보를 음성의 시작점으로 결정하고 음성신호의 끝점을 구하는 끝점 검출단계를 수행하여,

비음성 잡음을 배제하고 음성신호의 시작점과 끝점에 의해 검출되어지는 음성신호에 대해서만 음성인식시스템으로 입력하게 하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출방법

2 2

제 1 항에 있어서,

상기 임계치 설정단계는,

초기에 입력되는 묵음신호의 에너지와 영교차율에 의거하여 임계 에너지와 임계영교차율을 설정하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출방법

3 3

제 1 항에 있어서,

상기 음성신호의 시작점 후보 검출단계는,

음성신호가 입력되면 연속적으로 프레임화하여 각 프레임 단위별로 에너지와 영교차율을 구하는 단계와;

상기 프레임의 에너지가 상기 임계치 설정단계에서 설정된 임계 에너지보다 크거나 상기 프레임의 영교차율이 상기 임계치 설정단계에서 설정된 임계 영교차율보다 클 경우 그 프레임을 음성프레임으로 판정하는 단계와;

상기 시작점 후보검출에서 입력되는 프레임들중에서 음성으로 판정된 프레임들을 누적하여 그 누적된 갯수가 상기 임계치 설정단계의 시작점 후보 판단 임계 프레임 갯수를 초과할 때 그 초과시점의 프레임에서 임계 프레임의 개수만큼 이전에 위치한 프레임을 음성신호의 시작점 후보로 검출하는 단계로 이루어지는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출방법

4 4

제 1 항에 있어서,

상기 피치분석에 의한 음성판정단계는,

상기 시작점 후보 검출이후에 입력되는 프레임을 소정구간으로 나누고 상기 구간내의 프레임별 에너지레벨에 의거하여 유성음 구간을 검출하는 단계와;

상기 유성음구간으로 검출된 프레임 구간에 대하여 상호상관계수를 검출해내는 단계와;

상기 상호상관 계수들에 대하여 피크피킹방법에 의해 상호 상관 계수중 최대치의 인덱스를 피치로서 검출하는 단계와;

검출된 피치가 음성으로 판단할 수 있는 소정의 피치 구간내에 있으면서, 최대 상호상관계수값이 임계치보다 크면 음성으로 판정하여 상기 음성의 시작점 후보를 음성의 시작점으로 결정하고 비음성으로 판정되는 경우에는 상기 시작점 후보를 검출하게 하는 단계를 수행하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출방법

5 5

제 4 항에 있어서,

상기 유성음 구간 검출 단계는,

음성신호 시작점 후보 검출단계에서 검출된 시작점후보 이후부터 입력된 소정 구간의 프레임들중에서 최대의 에너지 레벨을 가지는 프레임을 구한후 이 프레임 및 주변 소정의 프레임을 유성음 프레임으로 검출하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출방법

6 6

제 1 항에 있어서,

상기 음성신호의 끝점 검출단계는,

상기 시작점 후보 이후의 프레임들이 상기 검출된 피치에 의해 비음성으로 판정될 경우 다시 상기 음성신호의 시작점 후보를 검출하게 하는 단계를 수행하게 하고,

상기 시작점 후보 이후의 프레임들이 음성으로 판정될 경우 연속적으로 읽여지는 프레임들중에서 비음성으로 판정되는 프레임들의 누적된 갯수가 상기 임계치 설정 단계에서 설정된 음성 신호의 끝점 판단 임계 프레임 갯수를 초과할 때 그 프레임을 음성신호의 끝점으로 검출하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출방법

7 7

마이크를 통해 외부신호를 입력받아 아날로그 음성신호를 디지털 변환시키는 신호 입력수단과;

상기 입력수단을 통해 입력된 신호를 프레임화시켜 음성신호의 시작점후보와 끝점을 검출하기 위한 프레임 임계에너지 및 임계 영교차율과, 음성/비음성을 판별하기 위한 임계프레임갯수를 설정하는 임계치 설정부와,

각 프레임 단위별 에너지와 영교차율을 구하고 상기 임계치 설정부에 서 설정된 상기 임계 에너지 및 임계 영교차율과 비교하여 음성프레임여부를 판정하여 음성프레임에 대하여 시작점 후보를 검출하는 시작점 후보 검출부와,

시작점 후보가 검출되어진 이후의 프레임들에 대한 음성/비음성여부에 따라 음성으로 판정된 경우에 상기 음성의 시작점 후보를 음성의 시작점으로 결정하고 음성신호의 끝점을 구하는 끝점 검출부로 이루어진 음성신호의 시작점 후보 및 끝점 검출수단과;

음성신호의 시작점 및 끝점 검출수단에 의해 검출된 시작점 후보 이후로 입력되는 프레임에 대하여 유성음 구간을 검출하고 이 구간에 대하여 피치를 검출한 후 검출된 피치로부터 음성과 비음성을 판정하는 음성판정수단으로 구성되어;

비음성 잡음은 배제하고 시작점 검출과 끝점 검출에 의한 음성신호만을 음성인식시스템으로 입력하게 하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출장치

8 8

제 7 항에 있어서,

상기 음성신호의 시작점 후보 및 끝점 검출수단의 임계치 설정부는,

초기 입력신호인 묵음신호의 에너지 및 영교차율에 의거하여 임계에너지와 임계영교차율을 설정하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출장치

9 9

제 7 항에 있어서,

상기 음성신호의 시작점 후보 및 끝점 검출수단의 시작점 후보 검출부는,

음성신호가 입력되면 연속적으로 프레임화하여 각 프레임 단위별로 에너지와 영교차율을 구하고, 상기 프레임의 에너지가 미리 설정된 임계 에너지보다 크거나, 상기 프레임의 영교차율이 미리 설정된 임계 영교차율보다 클 경우 그 프레임을 음성프레임으로 판정하며 상기 연속적으로 읽여지는 프레임들중에서 음성으로 판정된 프레임들의 누적된 수가 미리 설정된 시작점 판단 임계 프레임수를 초과할 때 그 초과 시점의 프레임에서 임계 프레임수 만큼 이전의 지점을 음성신호의 시작점 후보로서 검출하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출수단

10 10

제 7 항에 있어서,

상기 음성신호의 시작점 후보 및 끝점 검출수단의 끝점검출부는,

검출된 음성 신호의 시작점 후보 이후의 프레임에 대하여 유성음 구간을 검출하고 이 구간에 대하여 피치를 검출한 후 검출된 피치로부터 음성과 비음성을 판정하고, 상기 시작점 후보 이후의 프레임들이 상기 검출된 피치에 의해 음성으로 판정될 경우 연속적으로 읽여지는 프레임들중에서 비음성으로 판정되는 프레임들의 누적된 갯수가 미리 설정된 음성 프레임의 끝점 판단 임계 프레임 갯수를 초과할 때 그 프레임을 음성신호의 끝점으로 검출하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출장치

지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.