1 |
1
스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 단계;상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 단계;상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 단계;상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 단계를 포함하는 음성/비음성 구간 검출 방법
|
2 |
2
제1항에 있어서,상기 센터 채널 성분의 프레임 별 에너지를 계산하는 단계를 더 포함하고,상기 판단하는 단계는,상기 센터 채널 성분의 프레임 별 에너지가 임계값 보다 작은 경우 비음성 구간으로 판단하고, 상기 센터 채널 성분의 프레임 별 에너지가 임계값 보다 큰 경우 상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 음성/비음성 구간 검출 방법
|
3 |
3
제1항에 있어서,상기 스테레오 오디오 신호의 채널간 관계 정보는,상기 스테레오 오디오 신호의 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보를 포함하는 음성/비음성 구간 검출 방법
|
4 |
4
제1항에 있어서,상기 스테레오 오디오 신호의 채널간 관계 정보는,상기 스테레오 오디오 신호의 채널간 상호연관성 정보를 더 포함하는 음성/비음성 구간 검출 방법
|
5 |
5
제1항에 있어서,상기 분류하는 단계는,상기 스테레오 오디오 신호의 각 요소 별 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보가 임계치 보다 작으면 센터 채널 성분으로 분류하고, 상기 스테레오 오디오 신호의 각 요소 별 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보가 임계치 보다 크면 서라운드 채널 성분으로 분류하는 음성/비음성 구간 검출 방법
|
6 |
6
제1항에 있어서,상기 추출하는 단계는,상기 분류된 센터 채널 성분과 서라운드 채널 성분의 스펙트로그램 값을 이용하여 각각의 특징벡터를 추출하는 음성/비음성 구간 검출 방법
|
7 |
7
제1항에 있어서,상기 추출하는 단계는,상기 분류된 센터 채널 성분과 서라운드 채널 성분의 멜 주파수 캡스트럼(Mel-Frequency Cepstral Coefficient; MFCC)를 이용하여 각각의 특징벡터를 추출하는 음성/비음성 구간 검출 방법
|
8 |
8
스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 획득부;상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 분류부;상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 추출부;상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 판단부를 포함하는 음성/비음성 구간 검출 장치
|
9 |
9
제8항에 있어서,상기 센터 채널 성분의 프레임 별 에너지를 계산하는 계산부를 더 포함하고,상기 판단부는,상기 센터 채널 성분의 프레임 별 에너지가 임계값 보다 작은 경우 비음성 구간으로 판단하고, 상기 센터 채널 성분의 프레임 별 에너지가 임계값 보다 큰 경우 상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 음성/비음성 구간 검출 장치
|
10 |
10
제8항에 있어서,상기 분류부는,상기 스테레오 오디오 신호의 각 요소 별 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보가 임계치 보다 작으면 센터 채널 성분으로 분류하고, 상기 스테레오 오디오 신호의 각 요소 별 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보가 임계치 보다 크면 서라운드 채널 성분으로 분류하는 음성/비음성 구간 검출 장치
|
11 |
11
스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 단계;상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 단계;상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 단계; 및상기 추출된 각각의 특징벡터를 이용하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 학습하는 단계를 포함하는 음성/비음성 구간 학습 방법
|
12 |
12
제11항에 있어서,상기 추출하는 단계는,상기 분류된 센터 채널 성분과 서라운드 채널 성분의 스펙트로그램 값을 이용하여 각각의 특징벡터를 추출하는 음성/비음성 구간 학습 방법
|
13 |
13
제11항에 있어서,상기 분류된 센터 채널 성분과 서라운드 채널 성분의 멜 주파수 캡스트럼(Mel-Frequency Cepstral Coefficient; MFCC)를 이용하여 각각의 특징벡터를 추출하는 음성/비음성 구간 학습 방법
|
14 |
14
제11항에 있어서,상기 학습하는 단계는,심층신경망(Deep Neural Net; DNN)을 이용하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 학습하는 음성/비음성 구간 학습 방법
|
15 |
15
스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 획득부;상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 분류부;상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 추출부; 및상기 추출된 각각의 특징벡터를 이용하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 학습하는 학습부를 포함하는 음성/비음성 구간 학습 장치
|