1 |
1
오디오 신호에 해당하는 다수개의 음원 프레임에 대한 조건부 확률들을 계산하고, 상기 조건부 확률들을 통해 정규화된 상호상관함수에 대한 목표신호존재의 경우와 부재의 경우의 조건부 확률의 우도(likelihood ratio)(Λk)를 추정하는 상호상관함수 추정부와,
상기 상호상관함수에 대하여 이동평균으로 밀도를 추정하고, 상기 밀도를 통해 조건부 목표신호부재확률(target signal absence probability)을 생성하는 밀도 추정부와,
상기 조건부 목표신호부재확률에서 간섭신호 프레임을 갖는 정규화된 상호상관함수의 통계적 평균 및 편차를 추정하는 간섭신호 밀도 추정부와,
상기 조건부 목표신호부재확률에 상기 통계적 평균 및 편차를 적용하여 생성시킨 목표신호부재확률을 기정의된 문턱치(threshold)와 비교하여 목표신호프레임을 검출하는 타겟 프레임 검출부와,
상기 다수개의 음원 프레임에 대하여 임계값을 기반으로 VAD(voice activity detection) 정보를 검출하는 음성 활성 검출부와,
통계적 모델을 이용한 목표신호프레임 검출 결과와 입력신호의 에너지를 이용한 VAD 정보 모두가 목표 프레임으로 판별되는 경우 목표신호로 결정하는 타겟 프레임 결정부
를 포함하는 통계적 모델을 이용한 목표 신호 검출 장치
|
2 |
2
제 1 항에 있어서,
상기 목표 신호 검출 장치는,
상기 오디오 신호를 디지털 방식으로 변환하는 A/D 변환부와,
상기 디지털 방식의 오디오 신호에 대한 채널의 증폭 및 위상을 동기화하는 채널 동기화부와,
동기화된 상기 디지털 방식의 오디오 신호에 대하여 시간지연으로 필터링하는 필터부와,
필터링된 상기 디지털 방식의 오디오 신호에 대하여 잡음의 에너지가 높은 주파수 대역을 필터링하는 잡음 제거 필터링부와,
고주파 성분이 필터링된 상기 디지털 방식의 오디오 신호에 대하여 필터 뱅크 대역폭에 따른 주파수 성분을 분석하는 분석부와,
주파수 성분이 분석된 상기 디지털 방식의 오디오 신호에 대한 음원 프레이밍 작업으로 다수개의 음원 프레임을 생성하여 상기 상호상관함수 추정부에 제공하는 프레이밍부와,
상기 주파수 성분이 분석된 상기 디지털 방식의 오디오 신호에 대하여 지연 및 합 빔포밍(delay-and-sum beamforming)을 수행하는 음향적 빔포밍부와,
상기 다수개의 음원 프레임에서 에너지 분광 밀도(power spectral density)를 추정하는 에너지 추정부와,
상기 에너지 분광 밀도가 추정된 상기 다수개의 음원 프레임에 대하여 로그함수로 양자화를 수행하여 상기 음성 활성 검출부에 제공하는 양자화부
를 더 포함하는 통계적 모델을 이용한 목표 신호 검출 장치
|
3 |
3
제 1 항에 있어서,
상기 상호상관함수 추정부는,
상기 다수개의 음원 프레임에 대하여 목표신호부재(H0) 및 목표신호존재(H1)로 구분하여 상기 조건부 확률들을 계산하는 통계적 모델을 이용한 목표 신호 검출 장치
|
4 |
4
제 3 항에 있어서,
상기 목표신호부재(H0)의 정규화된 상호상관함수에 대한 조건부 확률은,
[수학식]
(여기서, Rx1x2(n,k)는 n번째 프레임, k번째 필터뱅크(filter bank) 출력의 정규화된 상호상관함수를 의미하고, λn,k는 간섭신호의 k번째 필터뱅크 출력의 정규화된 상호상관함수의 편차(variance)를 의미하며, mn,k는 간섭신호의 k번째 필터뱅크 출력의 정규화된 상호상관함수의 평균(mean)을 의미한다
|
5 |
5
제 3 항에 있어서,
상기 목표신호존재(H1)의 정규화된 상호상관함수에 대한 조건부 확률은,
[수학식]
(여기서, Rx1x2(n,k)는 n번째 프레임, k번째 필터뱅크 출력의 정규화된 상호상관함수를 의미하고, λin,k는 간섭신호와 음성신호를 모두 포함한 전체 입력신호의 k번째 필터뱅크 출력의 정규화된 상호상관함수의 편차를 의미하며, min,k는 전체 입력신호의 k번째 필터뱅크 출력의 정규화된 상호상관함수의 평균(mean)을 의미한다
|
6 |
6
제 1 항에 있어서,
상기 정규화된 상호상관함수에 대한 목표신호존재의 경우와 부재의 경우의 조건부 확률의 우도(Λk)는,
[수학식]
을 통해 계산되는 통계적 모델을 이용한 목표 신호 검출 장치
|
7 |
7
제 1 항에 있어서,
상기 조건부 목표신호부재확률은,
[수학식]
(여기서, q=p(H1)/p(H0)를 나타내며, p(H0)=1-p(H1)인 관계를 의미한다
|
8 |
8
제 1 항에 있어서,
상기 간섭신호 프레임을 갖는 정규화된 상호상관함수의 통계적 평균 및 편차는,
[수학식]
(여기서, n+1,k는 통계적 평균이고, n+1,k는 통계적 편차를 의미하고, 간섭신호와 음성신호를 모두 포함한 전체 입력신호의 k번째 필터뱅크 출력의 정규화된 상호상관함수의 통계적 평균 및 편차를 구하기 위해 if 조건을 제외하고 입력신호에 대해서 평균과 편차를 계속 업데이트 하면서 추정한다
|
9 |
9
오디오 신호에 해당하는 다수개의 음원 프레임에 대한 조건부 확률들을 계산하고, 상기 조건부 확률들을 통해 정규화된 상호상관함수에 대한 목표신호존재의 경우와 부재의 경우의 조건부 확률의 우도(Λk)를 추정하는 단계와,
상기 상호상관함수에 대하여 이동평균으로 밀도를 추정하고, 상기 밀도를 통해 조건부 목표신호부재확률(target absence probability)을 생성하는 단계와,
상기 조건부 목표신호부재확률에서 간섭신호 프레임을 갖는 정규화된 상호상관함수의 통계적 평균 및 편차를 추정하는 단계와,
상기 조건부 목표신호부재확률에 상기 통계적 평균 및 편차를 적용하여 생성시킨 목표신호부재확률을 기정의된 문턱치와 비교하여 목표신호프레임을 검출하는 단계와,
상기 다수개의 음원 프레임에 대하여 임계값을 기반으로 입력신호의 에너지를 이용한 VAD 정보를 검출하는 단계와,
통계적 모델을 이용한 목표신호프레임 검출 결과와 입력신호의 에너지를 이용한 VAD 정보 모두가 목표 프레임으로 판별되는 경우 목표신호로 결정하는 단계
를 포함하는 통계적 모델을 이용한 목표 신호 검출 방법
|
10 |
10
제 9 항에 있어서,
상기 우도(Λk)를 추정하는 단계는,
상기 오디오 신호를 디지털 방식으로 변환하는 단계와,
상기 디지털 방식의 오디오 신호에 대한 채널의 증폭 및 위상을 동기화하는 단계와,
동기화된 상기 디지털 방식의 오디오 신호에 대하여 시간지연으로 필터링하는 단계와,
필터링된 상기 디지털 방식의 오디오 신호에 대하여 고주파 성분으로 필터링하는 단계와,
고주파 성분이 필터링된 상기 디지털 방식의 오디오 신호에 대하여 필터 뱅크 대역폭에 따른 주파수 성분을 분석하는 단계와,
주파수 성분이 분석된 상기 디지털 방식의 오디오 신호에 대한 음원 프레이밍 작업으로 다수개의 음원 프레임을 생성하여 상기 우도(Λk)를 추정하는 단계
를 포함하는 통계적 모델을 이용한 목표 신호 검출 방법
|
11 |
11
제 9 항에 있어서,
상기 입력신호의 에너지를 이용한 VAD 정보를 검출하는 단계는,
상기 주파수 성분이 분석된 상기 디지털 방식의 오디오 신호에 대하여 지연 및 합 빔포밍을 수행하는 단계와,
상기 다수개의 필터뱅크 출력신호에 대하여 빔모밍한 음원 프레임에서 에너지 분광 밀도를 추정하는 단계와,
상기 에너지 분광 밀도가 추정된 상기 다수개의 음원 프레임에 대하여 로그함수로 양자화를 수행하여 상기 VAD 정보를 검출하는 단계
를 포함하는 통계적 모델을 이용한 목표 신호 검출 방법
|
12 |
12
제 9 항에 있어서,
상기 목표신호로 결정하는 단계는,
상기 목표신호프레임의 검출 결과와 상기 VAD 정보의 결과에 대하여 모두 목적하는 신호 프레임으로 검출되는 경우, 목표 프레임이 검출된 것으로 판별되고, 상기 검출된 목표 프레임의 결과가 미디언 필터를 이용한 스무딩 과정 그리고 목표 프레임의 끝나는 시점의 hangover 과정을 통해 목표 프레임 검출 결과의 후처리 과정이 수행되어 상기 목표신호가 결정되는 통계적 모델을 이용한 목표 신호 검출 방법
|