맞춤기술찾기

이전대상기술

음성신호 기반의 성별인식 방법 및 장치

  • 기술번호 : KST2015082628
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 음성신호 기반의 성별인식 방법 및 장치에 관한 것이다. 본 발명에 따른 성별인식 방법에서는, 음성신호를 구성하는 유성음과 무성음 성분 중에서 성별에 따라 뚜렷한 변화를 가지지 않는 무성음 성분을 제거한 특징벡터를 추출하고, 상기 무성음 성분을 제거한 특징벡터를 미리 생성한 가우시안 혼합 모델(GMM Gaussian Mixture Model)과 비교함으로써 성별인식의 정확성을 높일 수 있다. 또한, 유성음에 적용되는 성대 떨림의 주기인 피치(pitch) 또는 포먼트 스펙트럼(formant spectrum)을 이용하여 성별을 인식할 경우, 본 발명에 따라 무성음을 제거한 음성신호를 기반으로 함으로써 상기 피치 또는 평균 성대 길이를 이용시 더욱 정확한 성별인식이 가능하다. 성별인식, 성대, 피치 유성음, 무성음, 특징벡터
Int. CL G10L 25/51 (2013.01) G10L 25/03 (2013.01) G10L 17/00 (2013.01) G10L 15/08 (2013.01)
CPC G10L 25/15(2013.01) G10L 25/15(2013.01) G10L 25/15(2013.01) G10L 25/15(2013.01)
출원번호/일자 1020070045691 (2007.05.10)
출원인 한국과학기술연구원, 한국전자통신연구원
등록번호/일자 10-0901191-0000 (2009.05.29)
공개번호/일자 10-2008-0099740 (2008.11.13) 문서열기
공고번호/일자 (20090604) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2007.05.10)
심사청구항수 9

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술연구원 대한민국 서울특별시 성북구
2 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김형곤 대한민국 서울 서초구
2 장준혁 대한민국 인천 남구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김 순 영 대한민국 서울특별시 종로구 종로*길 **, **층 케이씨엘특허법률사무소 (수송동, 석탄회관빌딩)
2 김영철 대한민국 서울특별시 종로구 종로*길 **, **층 케이씨엘특허법률사무소 (수송동, 석탄회관빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국과학기술연구원 대한민국 서울특별시 성북구
2 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2007.05.10 수리 (Accepted) 1-1-2007-0348378-48
2 선행기술조사의뢰서
Request for Prior Art Search
2008.01.14 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2008.02.14 수리 (Accepted) 9-1-2008-0009047-22
4 의견제출통지서
Notification of reason for refusal
2008.11.27 발송처리완료 (Completion of Transmission) 9-5-2008-0602350-44
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2009.01.20 수리 (Accepted) 1-1-2009-0036880-42
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2009.01.20 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2009-0036879-06
7 등록결정서
Decision to grant
2009.05.25 발송처리완료 (Completion of Transmission) 9-5-2009-0217623-17
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.12.15 수리 (Accepted) 4-1-2009-5247056-16
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.02.19 수리 (Accepted) 4-1-2014-5022002-69
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
다수의 음성신호에 대하여 무성음 성분이 제거된 가우시안 혼합 모델(GMM; Gaussian Mixture Model)을 생성하는 단계; 화자의 음성신호를 수신하는 단계; 상기 음성신호에 대하여 무성음 성분이 제거된 특징벡터를 추출하는 단계; 및 상기 추출된 특징벡터를 상기 가우시안 혼합 모델과 비교하여 상기 음성신호의 성별을 판단하는 단계를 포함하되, 상기 특징벡터를 추출하는 단계는, 음성신호를 소정 시간 주기의 구간으로 구분하는 단계; 상기 음성신호의 각 구간 별로 미리 설정된 특정 주파수 이상의 고주파 대역의 평균 에너지(EH)와 상기 특정 주파수 이하의 저주파 대역의 평균 에너지(EL)의 비율(Er)을 구하는 단계; 상기 음성신호의 각 구간의 비율(Er)값과 미리 설정된 문턱 값의 크기를 비교하는 단계; 및 상기 비교 결과, 상기 문턱 값을 초과하는 각 구간의 음성신호에 대한 특징벡터를 추출하는 단계를 포함하는 것을 특징으로 하는 음성신호기반의 성별인식 방법
2 2
삭제
3 3
제1항에 있어서, 상기 특징벡터는 상기 음성신호의 피치(pitch)인 것을 특징으로 하는 음성신호 기반의 성별인식 방법
4 4
제1항에 있어서, 상기 특징벡터는 상기 음성신호의 포먼트 스펙트럼 (formant spectrum)인 것을 특징으로 하는 음성신호 기반의 성별인식방법
5 5
음성신호 기반의 성별인식을 위한 통계적 모델 생성 방법에 있어서, 음성신호를 소정 시간 주기의 구간으로 구분하는 단계; 상기 음성신호의 각 구간 별로 미리 설정한 특정 주파수 이상의 고주파 대역의 평균 에너지(EH)와 상기 특정 주파수 이하의 저주파 대역의 평균 에너지(EL)의 비율(Er)을 구하는 단계; 상기 음성신호의 각 구간의 비율(Er)을 미리 설정된 문턱 값과의 크기를 비교하는 단계; 상기 비교 결과, 상기 문턱 값을 초과하는 각 구간의 음성신호에 대한 특징벡터를 추출하는 단계; 및 상기 추출한 특징벡터들로부터 가우시안혼합 모델을 생성하는 단계를 포함하는 것을 특징으로 하는 통계적 모델 생성 방법
6 6
제5항에 있어서, 상기 특징벡터는 상기 음성신호의 음높이(pitch)인 것을 특징으로 하는 통계적 모델 생성 방법
7 7
제5항에 있어서, 상기 특징벡터는 상기 음성신호의 포먼트 스펙트럼 (formant spectrum)인 것을 특징으로 하는 통계적 모델 생성 방법
8 8
다수의 음성신호에 대한 가우시안 혼합 모델을 저장하는 저장부; 음성신호를 입력받는 입력부; 상기 입력된 음성신호로부터 무성음 성분이 제거된 특징벡터를 추출하되, 상기 입력된 음성신호를 소정 시간 주기의 구간으로 구분하고, 상기 음성신호의 각 구간 별로 미리 설정된 특정 주파수 이상의 고주파 대역의 평균 에너지(EH)와 상기 특정 주파수 이하의 저주파 대역의 평균 에너지(EL)의 비율(Er)을 구하며, 상기 음성신호의 각 구간의 비율(Er)값과 미리 설정된 문턱 값의 크기를 비교하고, 상기 비교 결과에 따라 상기 문턱 값을 초과하는 각 구간의 음성신호에 대한 특징벡터를 추출하는 특징벡터 추출부; 및 상기 추출된 특징벡터를 상기 저장부에 저장된 상기 가우시안 혼합 모델과 비교하여 상기 입력된 음성신호의 성별을 판단하는 성별판단부를 포함하는 것을 특징으로 하는 음성신호 기반의 성별인식 장치
9 9
제8항에 있어서, 상기 특징벡터 추출부는, 상기 입력된 음성신호를 소정 시간 주기의 구간으로 구분하고, 상기 각 구간별로 무성음 성분이 제거된 음성신호의 피치(pitch)를 검출하는 피치 검출부를 포함하는 것을 특징으로 하는 음성신호 기반의 성별인식장치
10 10
제8항에 있어서, 상기 특징벡터 추출부는, 상기 입력된 음성신호를 소정 시간 주기의 구간으로 구분하고, 상기 각 구간별로 무성음 성분이 제거된 음성신호의 포먼트 스펙트럼 (formant spectrum)을 검출하는 포먼트 스펙트럼 검출부를 포함하는 것을 특징으로 하는 음성신호 기반의 성별인식 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.