맞춤기술찾기

이전대상기술

통계적 모델을 이용한 목표 신호 검출 장치 및 그 방법

  • 기술번호 : KST2014032122
  • 담당센터 : 부산기술혁신센터
  • 전화번호 : 051-606-6561
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 통계적 모델을 이용한 목표 신호 검출 장치 및 그 방법에 관한 것으로, 사용자의 위치가 이미 알려져 있다는 가정하에 필터뱅크 출력신호들의 정규화된 상호상관함수를 특징벡터로 하고, 이를 통계적 모델을 이용하여 모델링함으로써, 다양한 음향적 잡음원들과 음성이 혼재하는 열악한 잡음 환경에서 사용자의 음성이 존재하는 음성 프레임 구간을 검출함으로써, 기존에서와 같이 전문가의 선험적인 파라미터 튜닝을 필연적으로 수행하여야만 하는 사용상의 불편한 문제점을 해결할 수 있다. 또한, 본 발명은 통계적 모델을 기반으로 화자위치를 이용한 목표 신호 검출 장치 및 그 방법을 제공함으로써, 사용자의 음성이 존재하는 음성 프레임 구간을 잡음 환경에 무관하게 검출할 수 있다. 목표 신호, 검출, 통계적 모델, 오디오 신호, 프레임
Int. CL G10L 15/20 (2006.01) G10L 15/14 (2006.01)
CPC G10L 25/78(2013.01) G10L 25/78(2013.01) G10L 25/78(2013.01) G10L 25/78(2013.01) G10L 25/78(2013.01)
출원번호/일자 1020090095740 (2009.10.08)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2011-0038447 (2011.04.14) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 취하
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이성주 대한민국 충청남도 계룡시 장안로 **,

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)
2 김원준 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)(제일특허법인(유))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2009.10.08 수리 (Accepted) 1-1-2009-0617522-39
2 [출원서등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2010.03.08 수리 (Accepted) 1-1-2010-0146041-89
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
오디오 신호에 해당하는 다수개의 음원 프레임에 대한 조건부 확률들을 계산하고, 상기 조건부 확률들을 통해 정규화된 상호상관함수에 대한 목표신호존재의 경우와 부재의 경우의 조건부 확률의 우도(likelihood ratio)(Λk)를 추정하는 상호상관함수 추정부와, 상기 상호상관함수에 대하여 이동평균으로 밀도를 추정하고, 상기 밀도를 통해 조건부 목표신호부재확률(target signal absence probability)을 생성하는 밀도 추정부와, 상기 조건부 목표신호부재확률에서 간섭신호 프레임을 갖는 정규화된 상호상관함수의 통계적 평균 및 편차를 추정하는 간섭신호 밀도 추정부와, 상기 조건부 목표신호부재확률에 상기 통계적 평균 및 편차를 적용하여 생성시킨 목표신호부재확률을 기정의된 문턱치(threshold)와 비교하여 목표신호프레임을 검출하는 타겟 프레임 검출부와, 상기 다수개의 음원 프레임에 대하여 임계값을 기반으로 VAD(voice activity detection) 정보를 검출하는 음성 활성 검출부와, 통계적 모델을 이용한 목표신호프레임 검출 결과와 입력신호의 에너지를 이용한 VAD 정보 모두가 목표 프레임으로 판별되는 경우 목표신호로 결정하는 타겟 프레임 결정부 를 포함하는 통계적 모델을 이용한 목표 신호 검출 장치
2 2
제 1 항에 있어서, 상기 목표 신호 검출 장치는, 상기 오디오 신호를 디지털 방식으로 변환하는 A/D 변환부와, 상기 디지털 방식의 오디오 신호에 대한 채널의 증폭 및 위상을 동기화하는 채널 동기화부와, 동기화된 상기 디지털 방식의 오디오 신호에 대하여 시간지연으로 필터링하는 필터부와, 필터링된 상기 디지털 방식의 오디오 신호에 대하여 잡음의 에너지가 높은 주파수 대역을 필터링하는 잡음 제거 필터링부와, 고주파 성분이 필터링된 상기 디지털 방식의 오디오 신호에 대하여 필터 뱅크 대역폭에 따른 주파수 성분을 분석하는 분석부와, 주파수 성분이 분석된 상기 디지털 방식의 오디오 신호에 대한 음원 프레이밍 작업으로 다수개의 음원 프레임을 생성하여 상기 상호상관함수 추정부에 제공하는 프레이밍부와, 상기 주파수 성분이 분석된 상기 디지털 방식의 오디오 신호에 대하여 지연 및 합 빔포밍(delay-and-sum beamforming)을 수행하는 음향적 빔포밍부와, 상기 다수개의 음원 프레임에서 에너지 분광 밀도(power spectral density)를 추정하는 에너지 추정부와, 상기 에너지 분광 밀도가 추정된 상기 다수개의 음원 프레임에 대하여 로그함수로 양자화를 수행하여 상기 음성 활성 검출부에 제공하는 양자화부 를 더 포함하는 통계적 모델을 이용한 목표 신호 검출 장치
3 3
제 1 항에 있어서, 상기 상호상관함수 추정부는, 상기 다수개의 음원 프레임에 대하여 목표신호부재(H0) 및 목표신호존재(H1)로 구분하여 상기 조건부 확률들을 계산하는 통계적 모델을 이용한 목표 신호 검출 장치
4 4
제 3 항에 있어서, 상기 목표신호부재(H0)의 정규화된 상호상관함수에 대한 조건부 확률은, [수학식] (여기서, Rx1x2(n,k)는 n번째 프레임, k번째 필터뱅크(filter bank) 출력의 정규화된 상호상관함수를 의미하고, λn,k는 간섭신호의 k번째 필터뱅크 출력의 정규화된 상호상관함수의 편차(variance)를 의미하며, mn,k는 간섭신호의 k번째 필터뱅크 출력의 정규화된 상호상관함수의 평균(mean)을 의미한다
5 5
제 3 항에 있어서, 상기 목표신호존재(H1)의 정규화된 상호상관함수에 대한 조건부 확률은, [수학식] (여기서, Rx1x2(n,k)는 n번째 프레임, k번째 필터뱅크 출력의 정규화된 상호상관함수를 의미하고, λin,k는 간섭신호와 음성신호를 모두 포함한 전체 입력신호의 k번째 필터뱅크 출력의 정규화된 상호상관함수의 편차를 의미하며, min,k는 전체 입력신호의 k번째 필터뱅크 출력의 정규화된 상호상관함수의 평균(mean)을 의미한다
6 6
제 1 항에 있어서, 상기 정규화된 상호상관함수에 대한 목표신호존재의 경우와 부재의 경우의 조건부 확률의 우도(Λk)는, [수학식] 을 통해 계산되는 통계적 모델을 이용한 목표 신호 검출 장치
7 7
제 1 항에 있어서, 상기 조건부 목표신호부재확률은, [수학식] (여기서, q=p(H1)/p(H0)를 나타내며, p(H0)=1-p(H1)인 관계를 의미한다
8 8
제 1 항에 있어서, 상기 간섭신호 프레임을 갖는 정규화된 상호상관함수의 통계적 평균 및 편차는, [수학식] (여기서, n+1,k는 통계적 평균이고, n+1,k는 통계적 편차를 의미하고, 간섭신호와 음성신호를 모두 포함한 전체 입력신호의 k번째 필터뱅크 출력의 정규화된 상호상관함수의 통계적 평균 및 편차를 구하기 위해 if 조건을 제외하고 입력신호에 대해서 평균과 편차를 계속 업데이트 하면서 추정한다
9 9
오디오 신호에 해당하는 다수개의 음원 프레임에 대한 조건부 확률들을 계산하고, 상기 조건부 확률들을 통해 정규화된 상호상관함수에 대한 목표신호존재의 경우와 부재의 경우의 조건부 확률의 우도(Λk)를 추정하는 단계와, 상기 상호상관함수에 대하여 이동평균으로 밀도를 추정하고, 상기 밀도를 통해 조건부 목표신호부재확률(target absence probability)을 생성하는 단계와, 상기 조건부 목표신호부재확률에서 간섭신호 프레임을 갖는 정규화된 상호상관함수의 통계적 평균 및 편차를 추정하는 단계와, 상기 조건부 목표신호부재확률에 상기 통계적 평균 및 편차를 적용하여 생성시킨 목표신호부재확률을 기정의된 문턱치와 비교하여 목표신호프레임을 검출하는 단계와, 상기 다수개의 음원 프레임에 대하여 임계값을 기반으로 입력신호의 에너지를 이용한 VAD 정보를 검출하는 단계와, 통계적 모델을 이용한 목표신호프레임 검출 결과와 입력신호의 에너지를 이용한 VAD 정보 모두가 목표 프레임으로 판별되는 경우 목표신호로 결정하는 단계 를 포함하는 통계적 모델을 이용한 목표 신호 검출 방법
10 10
제 9 항에 있어서, 상기 우도(Λk)를 추정하는 단계는, 상기 오디오 신호를 디지털 방식으로 변환하는 단계와, 상기 디지털 방식의 오디오 신호에 대한 채널의 증폭 및 위상을 동기화하는 단계와, 동기화된 상기 디지털 방식의 오디오 신호에 대하여 시간지연으로 필터링하는 단계와, 필터링된 상기 디지털 방식의 오디오 신호에 대하여 고주파 성분으로 필터링하는 단계와, 고주파 성분이 필터링된 상기 디지털 방식의 오디오 신호에 대하여 필터 뱅크 대역폭에 따른 주파수 성분을 분석하는 단계와, 주파수 성분이 분석된 상기 디지털 방식의 오디오 신호에 대한 음원 프레이밍 작업으로 다수개의 음원 프레임을 생성하여 상기 우도(Λk)를 추정하는 단계 를 포함하는 통계적 모델을 이용한 목표 신호 검출 방법
11 11
제 9 항에 있어서, 상기 입력신호의 에너지를 이용한 VAD 정보를 검출하는 단계는, 상기 주파수 성분이 분석된 상기 디지털 방식의 오디오 신호에 대하여 지연 및 합 빔포밍을 수행하는 단계와, 상기 다수개의 필터뱅크 출력신호에 대하여 빔모밍한 음원 프레임에서 에너지 분광 밀도를 추정하는 단계와, 상기 에너지 분광 밀도가 추정된 상기 다수개의 음원 프레임에 대하여 로그함수로 양자화를 수행하여 상기 VAD 정보를 검출하는 단계 를 포함하는 통계적 모델을 이용한 목표 신호 검출 방법
12 12
제 9 항에 있어서, 상기 목표신호로 결정하는 단계는, 상기 목표신호프레임의 검출 결과와 상기 VAD 정보의 결과에 대하여 모두 목적하는 신호 프레임으로 검출되는 경우, 목표 프레임이 검출된 것으로 판별되고, 상기 검출된 목표 프레임의 결과가 미디언 필터를 이용한 스무딩 과정 그리고 목표 프레임의 끝나는 시점의 hangover 과정을 통해 목표 프레임 검출 결과의 후처리 과정이 수행되어 상기 목표신호가 결정되는 통계적 모델을 이용한 목표 신호 검출 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 지식경제부 한국전자통신연구원 IT성장동력기술개발 신성장동력산업용 대용량 대화형 분산 처리 음성인터페이스 기술개발