1 |
1
음성신호의 각 프레임에 대하여 서로 다른 m개의 보코더(m은 2 이상임)로부터 특징 파라미터를 획득하는 단계;상기 특징 파라미터를 컨벌루션 신경망(Convolution Neural Network, CNN) 학습에 적합한 형태로 변환하여 특징 파라미터 조합을 생성하는 단계;상기 특징 파라미터 조합 및 상기 m개의 보코더의 유형을 나타내는 정보에 대하여 상기 컨벌루션 신경망 학습을 수행하여 상기 음성신호의 압축에 사용된 보코더의 유형을 판별하는 보코더 유형 판별 모델을 생성하는 단계;임의의 음성신호에 대한 상기 특징 파라미터 조합에 해당하는 값에 상기 보코더 유형 판별 모델을 적용하여 상기 임의의 음성신호의 압축에 사용된 보코더의 유형을 판별하는 단계를 포함하고,상기 컨벌루션 신경망은, 컨벌루션층(convolution layer), 최대 풀링층(max-pooling layer), 완전 연결층(fully-connected layer), 출력층(output layer)을 포함하며,상기 보코더 유형 판별 모델을 생성하는 단계는,상기 컨벌루션층에서 가중치를 공유하는 단계;상기 최대 풀링층에서 최대치를 풀링하여 상기 특징 파라미터 조합의 차원을 축소시키는 단계;상기 최대 풀링층과 상기 완전 연결층 사이의 가중치 및 바이어스를 학습시키는 단계; 및상기 가중치 및 바이어스를 학습시킨 결과를 상기 출력층에서 출력하는 단계를 포함하는보코더 유형 판별 방법
|
2 |
2
제 1 항에 있어서,상기 특징 파라미터 조합은,상기 각 프레임의 각 특징 파라미터별로 생성되는 조합인보코더 유형 판별 방법
|
3 |
3
제 1 항에 있어서,상기 보코더의 유형을 나타내는 정보는,상기 m개의 보코더의 유형 각각을 나타내는 m차원의 불리언(Boolean) 형식인보코더 유형 판별 방법
|
4 |
4
제 1 항에 있어서,상기 보코더의 유형을 나타내는 정보는,상기 m개의 보코더의 유형 및 오류를 각각 나타내는 m+1차원의 불리언 형식인보코더 유형 판별 방법
|
5 |
5
제 1 항에 있어서,상기 보코더 유형 판별 모델은,상기 임의의 음성신호의 압축에 상기 m개의 보코더의 각각이 사용되었을 확률을 산출하고,상기 보코더의 유형을 판별하는 단계는,상기 확률 중 가장 큰 값을 갖는 보코더가 상기 임의의 음성신호의 압축에 사용된 것으로 판별하는 단계를 포함하는보코더 유형 판별 방법
|
6 |
6
삭제
|
7 |
7
음성신호의 각 프레임에 대하여 서로 다른 m개의 보코더(m은 2이상임)로부터 획득된 특징 파라미터를 컨벌루션 신경망 학습에 적합한 형태로 변환하여 특징 파라미터 조합을 생성하는 데이터 변환부;상기 특징 파라미터 조합 및 상기 m개의 보코더의 유형을 나타내는 정보에 대하여 상기 컨벌루션 신경망 학습을 수행하여 상기 음성신호의 압축에 사용된 보코더의 유형을 판별하는 보코더 유형 판별 모델을 생성하는 모델 학습부;임의의 음성신호에 대한 상기 특징 파라미터 조합에 해당하는 값에 상기 보코더 유형 판별 모델을 적용하여 상기 임의의 음성신호의 압축에 사용된 보코더의 유형을 판별하는 판별부를 포함하고,상기 컨벌루션 신경망은, 컨벌루션층(convolution layer), 최대 풀링층(max-pooling layer), 완전 연결층(fully-connected layer), 출력층(output layer)을 포함하며,상기 모델 학습부는,상기 컨벌루션층에서 가중치를 공유하고,상기 최대 풀링층에서 최대치를 풀링하여 상기 특징 파라미터 조합의 차원을 축소시키고,상기 최대 풀링층과 상기 완전 연결층 사이의 가중치 및 바이어스를 학습시키고,상기 가중치 및 바이어스를 학습시킨 결과를 상기 출력층에서 출력하는보코더 유형 판별 장치
|
8 |
8
제 7 항에 있어서,상기 특징 파라미터 조합은,상기 각 프레임의 각 특징 파라미터별로 생성되는 조합인보코더 유형 판별 장치
|
9 |
9
제 7 항에 있어서,상기 보코더의 유형을 나타내는 정보는,상기 m개의 보코더의 유형 각각을 나타내는 m차원의 불리언 형식인보코더 유형 판별 장치
|
10 |
10
제 7 항에 있어서,상기 보코더의 유형을 나타내는 정보는,상기 m개의 보코더의 유형 및 오류를 각각 나타내는 m+1차원의 불리언 형식인보코더 유형 판별 장치
|
11 |
11
제 7 항에 있어서,상기 보코더 유형 판별 모델은,상기 임의의 음성신호의 압축에 상기 m개의 보코더의 각각이 사용되었을 확률을 산출하고,상기 판별부는 상기 확률 중 가장 큰 값을 갖는 보코더가 상기 임의의 음성신호의 압축에 사용된 것으로 판별하는보코더 유형 판별 장치
|
12 |
12
삭제
|