맞춤기술찾기

이전대상기술

PTT 기반 음성 명료성 향상 장치 및 방법(APPARATUS AND METHOD FOR IMPROVING VOICE INTELLIGIBILITY BASED ON PTT)

  • 기술번호 : KST2018005508
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 PTT 기반 음성 명료성 향상 장치 및 방법을 공개한다. 본 발명은 PTT 단말이 사용되는 잡음 환경에서 획득된 음향 신호를 STFT 변환하여 음향 주파수 신호로 변환하고, 변환된 음향 주파수 신호에서 스펙트럴 진폭과 위상을 각각 부닐하여 개별적으로 향상시킨 후 재결합함으로써, 잡음이 제거된 명료한 음성 신호를 전송할 수 있도록 한다.
Int. CL G10L 21/0316 (2013.01.01) G10L 21/0216 (2013.01.01) G10L 19/02 (2006.01.01)
CPC G10L 21/0316(2013.01) G10L 21/0316(2013.01) G10L 21/0316(2013.01)
출원번호/일자 1020160143289 (2016.10.31)
출원인 광운대학교 산학협력단, 서울대학교산학협력단
등록번호/일자
공개번호/일자 10-2018-0047316 (2018.05.10) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2016.10.31)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 광운대학교 산학협력단 대한민국 서울특별시 노원구
2 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김형국 대한민국 서울특별시 동대문구
2 조혜승 대한민국 서울특별시 노원구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인우인 대한민국 서울특별시 강남구 역삼로 ***, *층(역삼동, 중평빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 광운대학교 산학협력단 서울특별시 노원구
2 서울대학교산학협력단 서울특별시 관악구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.10.31 수리 (Accepted) 1-1-2016-1060603-96
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2017.03.27 수리 (Accepted) 4-1-2017-5046666-19
3 의견제출통지서
Notification of reason for refusal
2017.10.30 발송처리완료 (Completion of Transmission) 9-5-2017-0752693-28
4 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2017.12.04 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2017-1207699-40
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2017.12.04 수리 (Accepted) 1-1-2017-1207698-05
6 등록결정서
Decision to grant
2018.05.21 발송처리완료 (Completion of Transmission) 9-5-2018-0341800-34
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.05.13 수리 (Accepted) 4-1-2019-5093546-10
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.05.23 수리 (Accepted) 4-1-2019-5101798-31
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.02 수리 (Accepted) 4-1-2019-5154561-59
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.11.25 수리 (Accepted) 4-1-2020-5265458-48
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
PTT 단말의 음향 감지부에서 인가된 음향 신호를 STFT 변환하여 음향 주파수 신호를 획득하는 STFT부; 상기 PTT 단말의 송신 버튼에 의해 활성화되는 동작 신호에 응답하여, 상기 음향 주파수 신호를 음성 주파수 신호와 잡음 주파수 신호로 구분하고, 상기 음성 주파수 신호와 이전 획득된 상기 잡음 주파수 신호 각각의 진폭과 위상을 분리하여, 음성 스펙트럴 진폭과 음성 스펙트럴 위상 및 잡음 스펙트럴 진폭과 잡음 스펙트럴 위상을 획득하는 진폭 위상 분리부; 상기 잡음 스펙트럴 진폭에서 획득되는 상기 음성 스펙트럴 진폭의 잡음 진폭 스펙트럼에 대한 a priori SNR 및 a posteriori SNR과 음성 존재 불확실성 계수로부터 진폭 추정 이득값을 획득하고, 상기 진폭 추정 이득값을 상기 음성 스펙트럴 진폭에 적용하여, 개선된 음성 스펙트럴 진폭을 획득하는 진폭 추정부; 상기 음성 스펙트럴 위상을 인가받아, 엔벨롭 위상과 선형 위상 및 여기 위상으로 분리하고, 분리된 상기 여기 위상의 순간 위상차인 여기 위상 왜곡을 시간 평활화하고, 상기 엔벨롭 위상과 상기 선형 위상과 재결합하여 개선된 음성 스펙트럴 위상을 획득하는 위상 추정부; 및 상기 개선된 음성 스펙트럴 진폭과 상기 개선된 음성 스펙트럴 위상을 결합하고, ISTFT를 수행하여 명료성이 개선된 음성 신호를 획득하는 ISTFT부; 를 포함하고, 상기 위상 추정부는, 상기 음성 스펙트럴 위상에 대해 ZZT(Zeros of Z-Transform)를 수행하여, 상기 음성 스펙트럴 위상에 포함된 상기 엔벨롭 위상으로 추정하는 엔벨롭 위상 추정부; 상기 음성 스펙트럴 위상에서 추정된 상기 엔벨롭 위상을 차감하여 음성 위상을 획득하는 음성 위상 분리부; 상기 음성 위상에 포함된 상기 선형 위상을 인접 프레임의 선형 위상과 현재 프레임의 기본 주파수를 이용하여 추정하고, 상기 음성 위상에서 추정된 상기 선형 위상을 차감하여 상기 여기 위상을 획득하는 선형 위상 추정부; 상기 여기 위상의 순간 위상 차인 여기 위상 왜곡을 계산하고, 상기 여기 위상 왜곡을 시간 평활화하여, 개선된 여기 위상 차를 획득하는 여기 위상 교정부; 및 추정된 상기 엔벨롭 위상과 추정된 상기 엔벨롭 위상 및 개성된 여기 위상 차를 재결합하여 개선된 음성 스펙트럴 위상을 획득하는 위상 결합부; 및 개선된 하모닉스 기반의 상기 음성 스펙트럴 위상을 시간-주파수 인덱스로 변환하여, STFT 도메인의 개선된 음성 스펙트럴 위상을 획득하는 스펙트럼 변환부; 를 포함하는 PTT 기반 음성 명료성 향상 장치
2 2
제1 항에 있어서, 상기 진폭 추정부는 상기 음성 스펙트럴 진폭과 상기 잡음 스펙트럴 진폭 사이의 코사인 유사도를 계산하여, 상기 음성 스펙트럴 진폭의 음성 구간을 판별하고, 상기 음성 구간 판별 결과에 따라 조건부 음성 존재 확률을 추정하는 음성 구간 판별부; 상기 조건부 음성 존재 확률을 기반으로 노이즈 플로어 평활화를 적용해 시변 평활화 변수를 획득하며, 상기 시변 평활화 변수를 이용하여, 이전 프레임의 상기 음성 스펙트럴 진폭에서 추정된 잡음 진폭 스펙트럼과 현재 프레임의 상기 음성 스펙트럴 진폭 사이에 시변 평활화를 수행함으로써, 현재 프레임의 상기 음성 스펙트럴 진폭에 포함된 상기 잡음 진폭 스펙트럼을 추정하는 잡음 추정부; 상기 잡음 추정부에서 추정된 상기 잡음 진폭 스펙트럼과 상기 음성 스펙트럴 진폭을 이용하여 상기 a posteriori SNR을 추정하고, 추정된 상기 a posteriori SNR 및 이전 획득된 개선된 음성 스펙트럴 진폭 및 기설정된 스무딩 파라미터로부터 상기 a priori SNR을 추정하는 SNR 추정부; 상기 코사인 유사도에 근거한 프레임별 음성 존재 확률로부터 음성 부재 확률을 계산하고, 상기 음성 부재 확률과 상기 a priori SNR 및 상기 a posteriori SNR을 이용하여 음성 존재 불확실성 계수를 계산하며, 상기 a priori SNR과 계산된 상기 음성 존재 불확실성 계수를 이용하여 상기 진폭 추정 이득값을 획득하는 이득값 계산부; 및 상기 진폭 추정 이득값을 상기 음성 스펙트럴 진폭에 적용하여, 상기 개선된 음성 스펙트럴 진폭을 획득하는 음성 진폭 추정부; 를 포함하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 장치
3 3
제2 항에 있어서, 상기 음성 구간 판별부는 상기 잡음 스펙트럴 진폭의 전체 주파수 빈에 대한 평균값인 평균 스펙트럴 진폭과 최소값인 최소 스펙트럴 진폭을 계산하고, 상기 평균 스펙트럴 진폭과 상기 음성 스펙트럴 진폭과 코사인 유사도를 계산하며, 계산된 상기 코사인 유사도가 기설정된 기준 문턱값 이하이면 상기 최소 스펙트럴 진폭을 구간 판별 문턱값으로 설정하고, 상기 코사인 유사도가 기설정된 기준 문턱값을 초과하면 상기 평균 스펙트럴 진폭을 구간 판별 문턱값으로 설정한 후, 상기 코사인 유사도가 설정된 상기 구간 판별 문턱값 이하이면, 해당 프레임의 음성 스펙트럴 진폭이 음성 구간인 것으로 판별하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 장치
4 4
제2 항에 있어서, 상기 이득값 계산부는 상기 a priori SNR과 상기 a posteriori SNR을 이용하여, 가중 베타 지수승 STSA(short-time spectral amplitude) 추정 기반의 진폭 추정 이득값을 계산하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 장치
5 5
삭제
6 6
PTT 단말에 구비되고, STFT부, 진폭 위상 분리부, 진폭 추정부, 위상 추정부 및 ISTFT부를 포함하는 음성 명료성 향상 장치의 음성 명료성 향상 방법에 있어서, 상기 STFT부가 PTT 단말음향 감지부에서 인가된 음향 신호를 STFT 변환하여 음향 주파수 신호를 획득하는 단계; 상기 진폭 위상 분리부가 상기 PTT 단말의 송신 버튼에 의해 활성화되는 동작 신호에 응답하여, 상기 음향 주파수 신호를 음성 주파수 신호와 잡음 주파수 신호로 구분하고, 상기 음성 주파수 신호와 이전 획득된 상기 잡음 주파수 신호 각각의 진폭과 위상을 분리하여, 음성 스펙트럴 진폭과 음성 스펙트럴 위상 및 잡음 스펙트럴 진폭과 잡음 스펙트럴 위상을 획득하는 단계; 상기 진폭 추정부가 상기 잡음 스펙트럴 진폭을 이용하여 획득되는 상기 음성 스펙트럴 진폭의 잡음 진폭 스펙트럼에 대한 a priori SNR 및 a posteriori SNR과 음성 존재 불확실성 계수로부터 진폭 추정 이득값을 획득하고, 상기 진폭 추정 이득값을 상기 음성 스펙트럴 진폭에 적용하여, 개선된 음성 스펙트럴 진폭을 획득하는 단계; 상기 위상 추정부가 상기 음성 스펙트럴 위상을 인가받아, 엔벨롭 위상과 선형 위상 및 여기 위상으로 분리하고, 분리된 상기 여기 위상의 순간 위상차인 여기 위상 왜곡을 시간 평활화하고, 상기 엔벨롭 위상과 상기 선형 위상과 재결합하여 개선된 음성 스펙트럴 위상을 획득하는 단계; 및 상기 ISTFT부가 상기 개선된 음성 스펙트럴 진폭과 상기 개선된 음성 스펙트럴 위상을 결합하고, ISTFT를 수행하여 명료성이 개선된 음성 신호를 획득하는 단계; 를 포함하고, 상기 개선된 음성 스펙트럴 위상을 획득하는 단계는 상기 음성 스펙트럴 위상에 대해 ZZT(Zeros of Z-Transform)를 수행하여, 상기 음성 스펙트럴 위상에 포함된 상기 엔벨롭 위상으로 추정하는 단계; 상기 음성 스펙트럴 위상에서 추정된 상기 엔벨롭 위상을 차감하여 음성 위상을 획득하는 단계; 상기 음성 위상에 포함된 선형 위상을 인접 프레임의 선형 위상과 현재 프레임의 기본 주파수를 이용하여 추정하는 단계; 상기 음성 위상에서 추정된 상기 선형 위상을 차감하여 상기 여기 위상을 획득하는 단계; 상기 여기 위상의 순간 위상 차인 여기 위상 왜곡을 계산하고, 상기 여기 위상 왜곡을 시간 평활화하여, 개선된 여기 위상 차를 획득하는 단계; 및 추정된 상기 엔벨롭 위상과 추정된 상기 엔벨롭 위상 및 개성된 여기 위상 차를 재결합하여 개선된 음성 스펙트럴 위상을 획득하는 단계; 및 개선된 하모닉스 기반의 상기 음성 스펙트럴 위상을 STFT 기반의 시간-주파수 인덱스로 변환하여, STFT 도메인의 개선된 음성 스펙트럴 위상을 획득하는 단계; 를 포함하는 PTT 기반 음성 명료성 향상 방법
7 7
제6 항에 있어서, 상기 음성 스펙트럴 진폭을 획득하는 단계는 상기 음성 스펙트럴 진폭과 상기 잡음 스펙트럴 진폭 사이의 코사인 유사도를 계산하여, 상기 음성 스펙트럴 진폭의 음성 구간을 판별하고, 상기 음성 구간 판별 결과에 따라 조건부 음성 존재 확률을 추정하는 단계; 상기 조건부 음성 존재 확률을 기반으로 노이즈 플로어 평활화를 적용해 시변 평활화 변수를 획득하며, 상기 시변 평활화 변수를 이용하여, 이전 프레임의 상기 음성 스펙트럴 진폭에서 추정된 잡음 진폭 스펙트럼과 현재 프레임의 상기 음성 스펙트럴 진폭 사이에 시변 평활화를 수행함으로써, 현재 프레임의 상기 음성 스펙트럴 진폭에 포함된 상기 잡음 진폭 스펙트럼을 추정하는 단계; 추정된 상기 잡음 진폭 스펙트럼과 상기 음성 스펙트럴 진폭을 이용하여 상기 a posteriori SNR을 추정하고, 추정된 상기 a posteriori SNR 및 이전 획득된 개선된 음성 스펙트럴 진폭 및 기설정된 스무딩 파라미터로부터 상기 a priori SNR을 추정하는 단계; 상기 코사인 유사도에 근거한 프레임별 음성 존재 확률로부터 음성 부재 확률을 계산하고, 상기 음성 부재 확률과 상기 a priori SNR 및 상기 a posteriori SNR을 이용하여 음성 존재 불확실성 계수를 계산하며, 상기 a priori SNR과 계산된 상기 음성 존재 불확실성 계수를 이용하여 상기 진폭 추정 이득값을 획득하는 단계; 및 상기 진폭 추정 이득값을 상기 음성 스펙트럴 진폭에 적용하여, 상기 개선된 음성 스펙트럴 진폭을 획득하는 단계; 를 포함하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 방법
8 8
제7 항에 있어서, 상기 조건부 음성 존재 확률을 추정하는 단계는 상기 잡음 스펙트럴 진폭의 전체 주파수 빈에 대한 평균값인 평균 스펙트럴 진폭과 최소값인 최소 스펙트럴 진폭을 계산하는 단계; 상기 평균 스펙트럴 진폭과 상기 음성 스펙트럴 진폭과 코사인 유사도를 계산하는 단계; 계산된 상기 코사인 유사도가 기설정된 기준 문턱값 이하이면 상기 최소 스펙트럴 진폭을 구간 판별 문턱값으로 설정하고, 상기 코사인 유사도가 기설정된 기준 문턱값을 초과하면 상기 평균 스펙트럴 진폭을 구간 판별 문턱값으로 설정하는 단계; 상기 코사인 유사도가 설정된 상기 구간 판별 문턱값 이하이면, 해당 프레임의 음성 스펙트럴 진폭이 음성 구간인 것으로 판별하는 단계; 및 상기 음성 구간 판별 결과에 따라 조건부 음성 존재 확률을 계산하는 단계; 를 포함하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 방법
9 9
제7 항에 있어서, 상기 진폭 추정 이득값을 획득하는 단계는 상기 a priori SNR과 상기 a posteriori SNR을 이용하여, 가중 베타 지수승 STSA(short-time spectral amplitude) 추정 기반의 진폭 추정 이득값(G(K, l))을 계산하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 방법
10 10
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 서울대학교 산학협력단 대학ICT연구센터 육성지원사업 실감 오케스트라 서비스를 위한 입체음향 취득/재현기술 개발
2 교육부 광운대학교 산학협력단 기본연구지원사업 사물인터넷기반 차세대 음악 에코시스템