1 |
1
전처리부에 의해 입력된 음성 내의 잡음을 제거한 다음 딥러닝 기반으로 음성 인식을 수행하는 음성의 잡음 제거 장치에 있어서,상기 전처리부는,잡음이 삽입된 음성과 잡음이 삽입되지 아니한 순수 음성을 수집한 다음 수집된 음성에 대해, 데이터 셋의 수, SNR 평균값, 신호 길이의 평균, 음성 구간의 위치를 토대로 복수의 그룹으로 분류하는 그룹 설정부;각 그룹 별 음성에 대해 다수의 음성 구간 검출 알고리즘을 수행하여 각각의 음성 구간을 검출하는 다수의 음성 구간 검출부; 검출된 각 음성 구간의 음성에 대해 정해진 음성 검출 평가 기준을 토대로 음성간 검출 성능을 도출하고 도출된 음성간 검출 성능을 토대로 다수의 음성 구간 검출 알고리즘 중 선택된 음성구간 검출 알고리즘의 음성 구간의 문턱값을 최적의 음성 구간 문턱값으로 설정하는 최적 문턱값 설정부;입력된 잡음 제거 대상 음성에 대해, 최적 음성 구간 문턱값으로 음성이 포함되지 아니한 구간을 제거하여 잡음 제거 대상의 음성 길이를 단축하는 음성 길이 단축부; 및상기 음성 길이가 단축된 잡음 제거 대상의 음성에 대해 기 정해진 딥러닝 기반의 잡음 제거 모델을 기반으로 음성에 포함된 잡음을 제거하는 잡음 제거부를 포함하는 것을 특징으로 하는 음성 내의 잡음 제거 장치
|
2 |
2
제1항에 있어서, 상기 상기 복수의 그룹은,로우 SNR 그룹, 미디움 SNR 그룹, 및 하이 SNR 그룹으로 설정하는 것을 특징으로 하는 음성 내의 잡음 제거 장치
|
3 |
3
제2항에 있어서, 상기 음성 구간 검출 평가 기준은,총 인스턴스(instance) 중 관련 인스턴스의 비율을 나타내는 정밀도 precision, 실제 음성과 실제 음성이 검출된 음성 구간 내에 존재하는 비율을 나타내는 재현성 recall, 및 음성 구간 검출의 정확도를 나타내는 정확도 F1 score 인 것을 특징으로 하는 음성 내의 잡음 제거 장치
|
4 |
4
제1항에 있어서, 상기 다수의 음성 구간 검출부는, 수집된 음성에 대해, 에너지 기반 필터링 기법, 엔트로피 기반 필터링 기법, 퍼지 클러스터 기반 필터링 기법, 퍼지 클러스터링을 사용한 에너지 기반 필터링 기법, 퍼지 클러스터링을 사용한 엔트로피 기반 필터링 기법 중 적어도 하나인 것을 포함하는 것을 특징으로 하는 음성 내의 잡음 제거 장치
|
5 |
5
전처리부에 의해 입력된 음성 내의 잡음을 제거한 다음 딥러닝 기반으로 음성 인식을 수행하는 음성의 잡음 제거 방법에 있어서,잡음이 삽입된 음성과 잡음이 삽입되지 아니한 순수 음성을 수집한 다음 수집된 음성에 대해, 데이터 셋의 수, SNR 평균값, 신호 길이의 평균, 음성 구간의 위치를 토대로 복수의 그룹으로 분류하는 그룹 설정단계;각 그룹 별 음성에 대해 다수의 음성 구간 검출 알고리즘을 수행하여 각각의 음성 구간을 검출하는 다수의 음성 구간 검출단계; 검출된 각 음성 구간의 음성에 대해 정해진 음성 검출 평가 기준을 토대로 음성간 검출 성능을 도출하고 도출된 음성간 검출 성능을 토대로 다수의 음성 구간 검출 알고리즘 중 선택된 음성구간 검출 알고리즘의 음성 구간의 문턱값을 최적의 음성 구간 문턱값으로 설정하는 최적 문턱값 설정단계;입력된 잡음 제거 대상 음성에 대해, 최적 음성 구간 문턱값으로 음성이 포함되지 아니한 구간을 제거하여 잡음 제거 대상의 음성 길이를 단축하는 음성 길이 단축단계; 및상기 음성 길이가 단축된 잡음 제거 대상의 음성에 대해 기 정해진 딥러닝 기반의 잡음 제거 모델을 기반으로 음성에 포함된 잡음을 제거하는 잡음 제거단계를 포함하는 것을 특징으로 하는 음성 내의 잡음 제거 방법
|