1 |
1
제1 설정 길이의 발성 데이터를 획득하는 획득부;상기 제1 설정 길이보다 짧은 제2 설정 길이를 갖는 세그먼트로 상기 발성 데이터를 분할하는 분할부;상기 세그먼트 단위로 화자의 특징 정보를 추출하는 추출부;를 포함하는 화자 특징 추출 장치
|
2 |
2
제1항에 있어서,상기 분할부는 상기 발성 데이터를 제1 세그먼트와 제2 세그먼트가 포함된 복수의 세그먼트로 분할하고,상기 분할부는 상기 제1 세그먼트와 상기 제2 세그먼트가 일부 겹쳐지도록 상기 발성 데이터를 분할하는 화자 특징 추출 장치
|
3 |
3
제1항에 있어서,상기 분할부는 시간축을 따라 이동하면서 상기 발성 데이터를 복수의 상기 세그먼트로 분할하고,상기 분할부는 상기 제2 설정 길이보다 짧은 제3 설정 길이만큼 상기 시간축을 따라 이동할 때마다 상기 세그먼트를 추출하며,상기 제2 설정 길이와 상기 제3 설정 길이의 차이로 인해, 복수의 상기 세그먼트 각각은 인접한 다른 세그먼트에 일부가 겹쳐지게 형성되는 화자 특징 추출 장치
|
4 |
4
제3항에 있어서,상기 분할부는 상기 세그먼트를 추출할 때마다 상기 제2 설정 길이보다 짧은 범위 내에서 상기 제3 설정 길이를 랜덤하게 재설정하고,상기 분할부는 상기 세그먼트 추출시마다 랜덤하게 재설정되는 상기 제3 설정 길이만큼 이동하면서 상기 세그먼트를 추출하는 화자 특징 추출 장치
|
5 |
5
제1항에 있어서,상기 분할부는 상기 발성 데이터를 복수의 상기 세그먼트로 분할하고,상기 추출부는 각 세그먼트별로 상기 특징 정보를 독립적으로 추출하는 화자 특징 추출 장치
|
6 |
6
제5항에 있어서,복수의 상기 특징 정보를 평균한 평균 정보를 산출하는 평균부, 상기 화자를 식별하는 제1 식별부 및 제2 식별부가 마련되고,상기 제1 식별부는 상기 특징 정보를 이용해서 상기 화자를 식별하며,상기 제2 식별부는 상기 평균 정보를 이용해서 상기 화자를 식별하는 화자 특징 추출 장치
|
7 |
7
제6항에 있어서,상기 제1 식별부의 식별 결과를 이용하여 산출된 제1 교차 엔트로피 오차 값과 상기 제2 식별부의 식별 결과를 이용하여 산출된 제2 교차 엔트로피 오차 값을 더하여 최종 오차 값을 계산하는 학습부가 마련되고,상기 학습부는 상기 최종 오차 값을 이용해서 상기 추출부를 학습시키는 화자 특징 추출 장치
|
8 |
8
제1항에 있어서,상기 추출부는 RawNet 구조에서 잔차 블록(residual block)에 있는 배치 정규화 기법과 leakyReLU 비선형 활성화 함수를 합성곱 계층 이전으로 이동하여 적용하고,상기 추출부는 RawNet 구조에서 VoxCeleb1 데이터 세트에서 VoxCeleb2 데이터 세트로 확장하여 사용하는 화자 특징 추출 장치
|
9 |
9
화자 특징 추출 장치에 의해 수행되는 화자 특징 추출 방법에 있어서,제1 설정 길이의 발성 데이터를 획득하는 단계;상기 제1 설정 길이보다 짧은 제2 설정 길이를 갖는 세그먼트로 상기 발성 데이터를 분할하는 단계;각 세그먼트별로 화자의 특징 정보를 추출하는 단계;복수의 상기 특징 정보를 이용해서 화자를 제1 식별하는 단계;복수의 상기 특징 정보를 평균한 평균 정보를 산출하는 단계;상기 평균 정보를 이용해서 화자를 제2 식별하는 단계;상기 제1 식별 결과를 이용해서 제1 교차 엔트로피 오차 값을 산출하고, 상기 제2 식별 결과를 이용해서 제2 교차 엔트로피 오차 값을 산출하는 단계;상기 제1 교차 엔트로피 오차 값과 상기 제2 교차 엔트로피 오차 값을 더하여 최종 오차 값을 계산하는 단계;상기 최종 오차 값을 이용해서 상기 특징 정보를 추출하는 모델을 학습시키는 단계;를 포함하는 화자 특징 추출 방법
|