1 |
1
PTT 단말의 음향 감지부에서 인가된 음향 신호를 STFT 변환하여 음향 주파수 신호를 획득하는 STFT부; 상기 PTT 단말의 송신 버튼에 의해 활성화되는 동작 신호에 응답하여, 상기 음향 주파수 신호를 음성 주파수 신호와 잡음 주파수 신호로 구분하고, 상기 음성 주파수 신호와 이전 획득된 상기 잡음 주파수 신호 각각의 진폭과 위상을 분리하여, 음성 스펙트럴 진폭과 음성 스펙트럴 위상 및 잡음 스펙트럴 진폭과 잡음 스펙트럴 위상을 획득하는 진폭 위상 분리부; 상기 잡음 스펙트럴 진폭에서 획득되는 상기 음성 스펙트럴 진폭의 잡음 진폭 스펙트럼에 대한 a priori SNR 및 a posteriori SNR과 음성 존재 불확실성 계수로부터 진폭 추정 이득값을 획득하고, 상기 진폭 추정 이득값을 상기 음성 스펙트럴 진폭에 적용하여, 개선된 음성 스펙트럴 진폭을 획득하는 진폭 추정부; 상기 음성 스펙트럴 위상을 인가받아, 엔벨롭 위상과 선형 위상 및 여기 위상으로 분리하고, 분리된 상기 여기 위상의 순간 위상차인 여기 위상 왜곡을 시간 평활화하고, 상기 엔벨롭 위상과 상기 선형 위상과 재결합하여 개선된 음성 스펙트럴 위상을 획득하는 위상 추정부; 및 상기 개선된 음성 스펙트럴 진폭과 상기 개선된 음성 스펙트럴 위상을 결합하고, ISTFT를 수행하여 명료성이 개선된 음성 신호를 획득하는 ISTFT부; 를 포함하고, 상기 위상 추정부는, 상기 음성 스펙트럴 위상에 대해 ZZT(Zeros of Z-Transform)를 수행하여, 상기 음성 스펙트럴 위상에 포함된 상기 엔벨롭 위상으로 추정하는 엔벨롭 위상 추정부; 상기 음성 스펙트럴 위상에서 추정된 상기 엔벨롭 위상을 차감하여 음성 위상을 획득하는 음성 위상 분리부; 상기 음성 위상에 포함된 상기 선형 위상을 인접 프레임의 선형 위상과 현재 프레임의 기본 주파수를 이용하여 추정하고, 상기 음성 위상에서 추정된 상기 선형 위상을 차감하여 상기 여기 위상을 획득하는 선형 위상 추정부; 상기 여기 위상의 순간 위상 차인 여기 위상 왜곡을 계산하고, 상기 여기 위상 왜곡을 시간 평활화하여, 개선된 여기 위상 차를 획득하는 여기 위상 교정부; 및 추정된 상기 엔벨롭 위상과 추정된 상기 엔벨롭 위상 및 개성된 여기 위상 차를 재결합하여 개선된 음성 스펙트럴 위상을 획득하는 위상 결합부; 및 개선된 하모닉스 기반의 상기 음성 스펙트럴 위상을 시간-주파수 인덱스로 변환하여, STFT 도메인의 개선된 음성 스펙트럴 위상을 획득하는 스펙트럼 변환부; 를 포함하는 PTT 기반 음성 명료성 향상 장치
|
2 |
2
제1 항에 있어서, 상기 진폭 추정부는 상기 음성 스펙트럴 진폭과 상기 잡음 스펙트럴 진폭 사이의 코사인 유사도를 계산하여, 상기 음성 스펙트럴 진폭의 음성 구간을 판별하고, 상기 음성 구간 판별 결과에 따라 조건부 음성 존재 확률을 추정하는 음성 구간 판별부; 상기 조건부 음성 존재 확률을 기반으로 노이즈 플로어 평활화를 적용해 시변 평활화 변수를 획득하며, 상기 시변 평활화 변수를 이용하여, 이전 프레임의 상기 음성 스펙트럴 진폭에서 추정된 잡음 진폭 스펙트럼과 현재 프레임의 상기 음성 스펙트럴 진폭 사이에 시변 평활화를 수행함으로써, 현재 프레임의 상기 음성 스펙트럴 진폭에 포함된 상기 잡음 진폭 스펙트럼을 추정하는 잡음 추정부; 상기 잡음 추정부에서 추정된 상기 잡음 진폭 스펙트럼과 상기 음성 스펙트럴 진폭을 이용하여 상기 a posteriori SNR을 추정하고, 추정된 상기 a posteriori SNR 및 이전 획득된 개선된 음성 스펙트럴 진폭 및 기설정된 스무딩 파라미터로부터 상기 a priori SNR을 추정하는 SNR 추정부; 상기 코사인 유사도에 근거한 프레임별 음성 존재 확률로부터 음성 부재 확률을 계산하고, 상기 음성 부재 확률과 상기 a priori SNR 및 상기 a posteriori SNR을 이용하여 음성 존재 불확실성 계수를 계산하며, 상기 a priori SNR과 계산된 상기 음성 존재 불확실성 계수를 이용하여 상기 진폭 추정 이득값을 획득하는 이득값 계산부; 및 상기 진폭 추정 이득값을 상기 음성 스펙트럴 진폭에 적용하여, 상기 개선된 음성 스펙트럴 진폭을 획득하는 음성 진폭 추정부; 를 포함하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 장치
|
3 |
3
제2 항에 있어서, 상기 음성 구간 판별부는 상기 잡음 스펙트럴 진폭의 전체 주파수 빈에 대한 평균값인 평균 스펙트럴 진폭과 최소값인 최소 스펙트럴 진폭을 계산하고, 상기 평균 스펙트럴 진폭과 상기 음성 스펙트럴 진폭과 코사인 유사도를 계산하며, 계산된 상기 코사인 유사도가 기설정된 기준 문턱값 이하이면 상기 최소 스펙트럴 진폭을 구간 판별 문턱값으로 설정하고, 상기 코사인 유사도가 기설정된 기준 문턱값을 초과하면 상기 평균 스펙트럴 진폭을 구간 판별 문턱값으로 설정한 후, 상기 코사인 유사도가 설정된 상기 구간 판별 문턱값 이하이면, 해당 프레임의 음성 스펙트럴 진폭이 음성 구간인 것으로 판별하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 장치
|
4 |
4
제2 항에 있어서, 상기 이득값 계산부는 상기 a priori SNR과 상기 a posteriori SNR을 이용하여, 가중 베타 지수승 STSA(short-time spectral amplitude) 추정 기반의 진폭 추정 이득값을 계산하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 장치
|
5 |
5
삭제
|
6 |
6
PTT 단말에 구비되고, STFT부, 진폭 위상 분리부, 진폭 추정부, 위상 추정부 및 ISTFT부를 포함하는 음성 명료성 향상 장치의 음성 명료성 향상 방법에 있어서, 상기 STFT부가 PTT 단말음향 감지부에서 인가된 음향 신호를 STFT 변환하여 음향 주파수 신호를 획득하는 단계; 상기 진폭 위상 분리부가 상기 PTT 단말의 송신 버튼에 의해 활성화되는 동작 신호에 응답하여, 상기 음향 주파수 신호를 음성 주파수 신호와 잡음 주파수 신호로 구분하고, 상기 음성 주파수 신호와 이전 획득된 상기 잡음 주파수 신호 각각의 진폭과 위상을 분리하여, 음성 스펙트럴 진폭과 음성 스펙트럴 위상 및 잡음 스펙트럴 진폭과 잡음 스펙트럴 위상을 획득하는 단계; 상기 진폭 추정부가 상기 잡음 스펙트럴 진폭을 이용하여 획득되는 상기 음성 스펙트럴 진폭의 잡음 진폭 스펙트럼에 대한 a priori SNR 및 a posteriori SNR과 음성 존재 불확실성 계수로부터 진폭 추정 이득값을 획득하고, 상기 진폭 추정 이득값을 상기 음성 스펙트럴 진폭에 적용하여, 개선된 음성 스펙트럴 진폭을 획득하는 단계; 상기 위상 추정부가 상기 음성 스펙트럴 위상을 인가받아, 엔벨롭 위상과 선형 위상 및 여기 위상으로 분리하고, 분리된 상기 여기 위상의 순간 위상차인 여기 위상 왜곡을 시간 평활화하고, 상기 엔벨롭 위상과 상기 선형 위상과 재결합하여 개선된 음성 스펙트럴 위상을 획득하는 단계; 및 상기 ISTFT부가 상기 개선된 음성 스펙트럴 진폭과 상기 개선된 음성 스펙트럴 위상을 결합하고, ISTFT를 수행하여 명료성이 개선된 음성 신호를 획득하는 단계; 를 포함하고, 상기 개선된 음성 스펙트럴 위상을 획득하는 단계는 상기 음성 스펙트럴 위상에 대해 ZZT(Zeros of Z-Transform)를 수행하여, 상기 음성 스펙트럴 위상에 포함된 상기 엔벨롭 위상으로 추정하는 단계; 상기 음성 스펙트럴 위상에서 추정된 상기 엔벨롭 위상을 차감하여 음성 위상을 획득하는 단계; 상기 음성 위상에 포함된 선형 위상을 인접 프레임의 선형 위상과 현재 프레임의 기본 주파수를 이용하여 추정하는 단계; 상기 음성 위상에서 추정된 상기 선형 위상을 차감하여 상기 여기 위상을 획득하는 단계; 상기 여기 위상의 순간 위상 차인 여기 위상 왜곡을 계산하고, 상기 여기 위상 왜곡을 시간 평활화하여, 개선된 여기 위상 차를 획득하는 단계; 및 추정된 상기 엔벨롭 위상과 추정된 상기 엔벨롭 위상 및 개성된 여기 위상 차를 재결합하여 개선된 음성 스펙트럴 위상을 획득하는 단계; 및 개선된 하모닉스 기반의 상기 음성 스펙트럴 위상을 STFT 기반의 시간-주파수 인덱스로 변환하여, STFT 도메인의 개선된 음성 스펙트럴 위상을 획득하는 단계; 를 포함하는 PTT 기반 음성 명료성 향상 방법
|
7 |
7
제6 항에 있어서, 상기 음성 스펙트럴 진폭을 획득하는 단계는 상기 음성 스펙트럴 진폭과 상기 잡음 스펙트럴 진폭 사이의 코사인 유사도를 계산하여, 상기 음성 스펙트럴 진폭의 음성 구간을 판별하고, 상기 음성 구간 판별 결과에 따라 조건부 음성 존재 확률을 추정하는 단계; 상기 조건부 음성 존재 확률을 기반으로 노이즈 플로어 평활화를 적용해 시변 평활화 변수를 획득하며, 상기 시변 평활화 변수를 이용하여, 이전 프레임의 상기 음성 스펙트럴 진폭에서 추정된 잡음 진폭 스펙트럼과 현재 프레임의 상기 음성 스펙트럴 진폭 사이에 시변 평활화를 수행함으로써, 현재 프레임의 상기 음성 스펙트럴 진폭에 포함된 상기 잡음 진폭 스펙트럼을 추정하는 단계; 추정된 상기 잡음 진폭 스펙트럼과 상기 음성 스펙트럴 진폭을 이용하여 상기 a posteriori SNR을 추정하고, 추정된 상기 a posteriori SNR 및 이전 획득된 개선된 음성 스펙트럴 진폭 및 기설정된 스무딩 파라미터로부터 상기 a priori SNR을 추정하는 단계; 상기 코사인 유사도에 근거한 프레임별 음성 존재 확률로부터 음성 부재 확률을 계산하고, 상기 음성 부재 확률과 상기 a priori SNR 및 상기 a posteriori SNR을 이용하여 음성 존재 불확실성 계수를 계산하며, 상기 a priori SNR과 계산된 상기 음성 존재 불확실성 계수를 이용하여 상기 진폭 추정 이득값을 획득하는 단계; 및 상기 진폭 추정 이득값을 상기 음성 스펙트럴 진폭에 적용하여, 상기 개선된 음성 스펙트럴 진폭을 획득하는 단계; 를 포함하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 방법
|
8 |
8
제7 항에 있어서, 상기 조건부 음성 존재 확률을 추정하는 단계는 상기 잡음 스펙트럴 진폭의 전체 주파수 빈에 대한 평균값인 평균 스펙트럴 진폭과 최소값인 최소 스펙트럴 진폭을 계산하는 단계; 상기 평균 스펙트럴 진폭과 상기 음성 스펙트럴 진폭과 코사인 유사도를 계산하는 단계; 계산된 상기 코사인 유사도가 기설정된 기준 문턱값 이하이면 상기 최소 스펙트럴 진폭을 구간 판별 문턱값으로 설정하고, 상기 코사인 유사도가 기설정된 기준 문턱값을 초과하면 상기 평균 스펙트럴 진폭을 구간 판별 문턱값으로 설정하는 단계; 상기 코사인 유사도가 설정된 상기 구간 판별 문턱값 이하이면, 해당 프레임의 음성 스펙트럴 진폭이 음성 구간인 것으로 판별하는 단계; 및 상기 음성 구간 판별 결과에 따라 조건부 음성 존재 확률을 계산하는 단계; 를 포함하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 방법
|
9 |
9
제7 항에 있어서, 상기 진폭 추정 이득값을 획득하는 단계는 상기 a priori SNR과 상기 a posteriori SNR을 이용하여, 가중 베타 지수승 STSA(short-time spectral amplitude) 추정 기반의 진폭 추정 이득값(G(K, l))을 계산하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 방법
|
10 |
10
삭제
|