기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

PTT 기반 음성 명료성 향상 장치 및 방법(APPARATUS AND METHOD FOR IMPROVING VOICE INTELLIGIBILITY BASED ON PTT)

기술번호 : KST2018005508
담당센터 : 서울동부기술혁신센터
전화번호 : 02-2155-3662

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	PTT 기반 음성 명료성 향상 장치 및 방법을 공개한다. 본 발명은 PTT 단말이 사용되는 잡음 환경에서 획득된 음향 신호를 STFT 변환하여 음향 주파수 신호로 변환하고, 변환된 음향 주파수 신호에서 스펙트럴 진폭과 위상을 각각 부닐하여 개별적으로 향상시킨 후 재결합함으로써, 잡음이 제거된 명료한 음성 신호를 전송할 수 있도록 한다.
Int. CL	G10L 21/0316 (2013.01.01) G10L 21/0216 (2013.01.01) G10L 19/02 (2006.01.01)
CPC	G10L 21/0316(2013.01) G10L 21/0316(2013.01) G10L 21/0316(2013.01)
출원번호/일자	1020160143289 (2016.10.31)
출원인	광운대학교 산학협력단, 서울대학교산학협력단
등록번호/일자
공개번호/일자	10-2018-0047316 (2018.05.10) 문서열기
공고번호/일자	문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	등록
심사진행상태	수리
심판사항
구분	신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2016.10.31)
심사청구항수	8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	광운대학교 산학협력단	대한민국	서울특별시 노원구
2	서울대학교산학협력단	대한민국	서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	김형국	대한민국	서울특별시 동대문구
2	조혜승	대한민국	서울특별시 노원구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	특허법인우인	대한민국	서울특별시 강남구 역삼로 **, 층(역삼동, 중평빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
1	광운대학교 산학협력단		서울특별시 노원구
2	서울대학교산학협력단		서울특별시 관악구

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2016.10.31	수리 (Accepted)	1-1-2016-1060603-96
2	출원인정보변경(경정)신고서 Notification of change of applicant's information	2017.03.27	수리 (Accepted)	4-1-2017-5046666-19
3	의견제출통지서 Notification of reason for refusal	2017.10.30	발송처리완료 (Completion of Transmission)	9-5-2017-0752693-28
4	[명세서등 보정]보정서 [Amendment to Description, etc.] Amendment	2017.12.04	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2017-1207699-40
5	[거절이유 등 통지에 따른 의견]의견(답변, 소명)서 [Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)	2017.12.04	수리 (Accepted)	1-1-2017-1207698-05
6	등록결정서 Decision to grant	2018.05.21	발송처리완료 (Completion of Transmission)	9-5-2018-0341800-34
7	출원인정보변경(경정)신고서 Notification of change of applicant's information	2019.05.13	수리 (Accepted)	4-1-2019-5093546-10
8	출원인정보변경(경정)신고서 Notification of change of applicant's information	2019.05.23	수리 (Accepted)	4-1-2019-5101798-31
9	출원인정보변경(경정)신고서 Notification of change of applicant's information	2019.08.02	수리 (Accepted)	4-1-2019-5154561-59
10	출원인정보변경(경정)신고서 Notification of change of applicant's information	2020.11.25	수리 (Accepted)	4-1-2020-5265458-48

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 PTT 단말의 음향 감지부에서 인가된 음향 신호를 STFT 변환하여 음향 주파수 신호를 획득하는 STFT부; 상기 PTT 단말의 송신 버튼에 의해 활성화되는 동작 신호에 응답하여, 상기 음향 주파수 신호를 음성 주파수 신호와 잡음 주파수 신호로 구분하고, 상기 음성 주파수 신호와 이전 획득된 상기 잡음 주파수 신호 각각의 진폭과 위상을 분리하여, 음성 스펙트럴 진폭과 음성 스펙트럴 위상 및 잡음 스펙트럴 진폭과 잡음 스펙트럴 위상을 획득하는 진폭 위상 분리부; 상기 잡음 스펙트럴 진폭에서 획득되는 상기 음성 스펙트럴 진폭의 잡음 진폭 스펙트럼에 대한 a priori SNR 및 a posteriori SNR과 음성 존재 불확실성 계수로부터 진폭 추정 이득값을 획득하고, 상기 진폭 추정 이득값을 상기 음성 스펙트럴 진폭에 적용하여, 개선된 음성 스펙트럴 진폭을 획득하는 진폭 추정부; 상기 음성 스펙트럴 위상을 인가받아, 엔벨롭 위상과 선형 위상 및 여기 위상으로 분리하고, 분리된 상기 여기 위상의 순간 위상차인 여기 위상 왜곡을 시간 평활화하고, 상기 엔벨롭 위상과 상기 선형 위상과 재결합하여 개선된 음성 스펙트럴 위상을 획득하는 위상 추정부; 및 상기 개선된 음성 스펙트럴 진폭과 상기 개선된 음성 스펙트럴 위상을 결합하고, ISTFT를 수행하여 명료성이 개선된 음성 신호를 획득하는 ISTFT부; 를 포함하고, 상기 위상 추정부는, 상기 음성 스펙트럴 위상에 대해 ZZT(Zeros of Z-Transform)를 수행하여, 상기 음성 스펙트럴 위상에 포함된 상기 엔벨롭 위상으로 추정하는 엔벨롭 위상 추정부; 상기 음성 스펙트럴 위상에서 추정된 상기 엔벨롭 위상을 차감하여 음성 위상을 획득하는 음성 위상 분리부; 상기 음성 위상에 포함된 상기 선형 위상을 인접 프레임의 선형 위상과 현재 프레임의 기본 주파수를 이용하여 추정하고, 상기 음성 위상에서 추정된 상기 선형 위상을 차감하여 상기 여기 위상을 획득하는 선형 위상 추정부; 상기 여기 위상의 순간 위상 차인 여기 위상 왜곡을 계산하고, 상기 여기 위상 왜곡을 시간 평활화하여, 개선된 여기 위상 차를 획득하는 여기 위상 교정부; 및 추정된 상기 엔벨롭 위상과 추정된 상기 엔벨롭 위상 및 개성된 여기 위상 차를 재결합하여 개선된 음성 스펙트럴 위상을 획득하는 위상 결합부; 및 개선된 하모닉스 기반의 상기 음성 스펙트럴 위상을 시간-주파수 인덱스로 변환하여, STFT 도메인의 개선된 음성 스펙트럴 위상을 획득하는 스펙트럼 변환부; 를 포함하는 PTT 기반 음성 명료성 향상 장치
2	2 제1 항에 있어서, 상기 진폭 추정부는 상기 음성 스펙트럴 진폭과 상기 잡음 스펙트럴 진폭 사이의 코사인 유사도를 계산하여, 상기 음성 스펙트럴 진폭의 음성 구간을 판별하고, 상기 음성 구간 판별 결과에 따라 조건부 음성 존재 확률을 추정하는 음성 구간 판별부; 상기 조건부 음성 존재 확률을 기반으로 노이즈 플로어 평활화를 적용해 시변 평활화 변수를 획득하며, 상기 시변 평활화 변수를 이용하여, 이전 프레임의 상기 음성 스펙트럴 진폭에서 추정된 잡음 진폭 스펙트럼과 현재 프레임의 상기 음성 스펙트럴 진폭 사이에 시변 평활화를 수행함으로써, 현재 프레임의 상기 음성 스펙트럴 진폭에 포함된 상기 잡음 진폭 스펙트럼을 추정하는 잡음 추정부; 상기 잡음 추정부에서 추정된 상기 잡음 진폭 스펙트럼과 상기 음성 스펙트럴 진폭을 이용하여 상기 a posteriori SNR을 추정하고, 추정된 상기 a posteriori SNR 및 이전 획득된 개선된 음성 스펙트럴 진폭 및 기설정된 스무딩 파라미터로부터 상기 a priori SNR을 추정하는 SNR 추정부; 상기 코사인 유사도에 근거한 프레임별 음성 존재 확률로부터 음성 부재 확률을 계산하고, 상기 음성 부재 확률과 상기 a priori SNR 및 상기 a posteriori SNR을 이용하여 음성 존재 불확실성 계수를 계산하며, 상기 a priori SNR과 계산된 상기 음성 존재 불확실성 계수를 이용하여 상기 진폭 추정 이득값을 획득하는 이득값 계산부; 및 상기 진폭 추정 이득값을 상기 음성 스펙트럴 진폭에 적용하여, 상기 개선된 음성 스펙트럴 진폭을 획득하는 음성 진폭 추정부; 를 포함하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 장치
3	3 제2 항에 있어서, 상기 음성 구간 판별부는 상기 잡음 스펙트럴 진폭의 전체 주파수 빈에 대한 평균값인 평균 스펙트럴 진폭과 최소값인 최소 스펙트럴 진폭을 계산하고, 상기 평균 스펙트럴 진폭과 상기 음성 스펙트럴 진폭과 코사인 유사도를 계산하며, 계산된 상기 코사인 유사도가 기설정된 기준 문턱값 이하이면 상기 최소 스펙트럴 진폭을 구간 판별 문턱값으로 설정하고, 상기 코사인 유사도가 기설정된 기준 문턱값을 초과하면 상기 평균 스펙트럴 진폭을 구간 판별 문턱값으로 설정한 후, 상기 코사인 유사도가 설정된 상기 구간 판별 문턱값 이하이면, 해당 프레임의 음성 스펙트럴 진폭이 음성 구간인 것으로 판별하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 장치
4	4 제2 항에 있어서, 상기 이득값 계산부는 상기 a priori SNR과 상기 a posteriori SNR을 이용하여, 가중 베타 지수승 STSA(short-time spectral amplitude) 추정 기반의 진폭 추정 이득값을 계산하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 장치
5	5 삭제
6	6 PTT 단말에 구비되고, STFT부, 진폭 위상 분리부, 진폭 추정부, 위상 추정부 및 ISTFT부를 포함하는 음성 명료성 향상 장치의 음성 명료성 향상 방법에 있어서, 상기 STFT부가 PTT 단말음향 감지부에서 인가된 음향 신호를 STFT 변환하여 음향 주파수 신호를 획득하는 단계; 상기 진폭 위상 분리부가 상기 PTT 단말의 송신 버튼에 의해 활성화되는 동작 신호에 응답하여, 상기 음향 주파수 신호를 음성 주파수 신호와 잡음 주파수 신호로 구분하고, 상기 음성 주파수 신호와 이전 획득된 상기 잡음 주파수 신호 각각의 진폭과 위상을 분리하여, 음성 스펙트럴 진폭과 음성 스펙트럴 위상 및 잡음 스펙트럴 진폭과 잡음 스펙트럴 위상을 획득하는 단계; 상기 진폭 추정부가 상기 잡음 스펙트럴 진폭을 이용하여 획득되는 상기 음성 스펙트럴 진폭의 잡음 진폭 스펙트럼에 대한 a priori SNR 및 a posteriori SNR과 음성 존재 불확실성 계수로부터 진폭 추정 이득값을 획득하고, 상기 진폭 추정 이득값을 상기 음성 스펙트럴 진폭에 적용하여, 개선된 음성 스펙트럴 진폭을 획득하는 단계; 상기 위상 추정부가 상기 음성 스펙트럴 위상을 인가받아, 엔벨롭 위상과 선형 위상 및 여기 위상으로 분리하고, 분리된 상기 여기 위상의 순간 위상차인 여기 위상 왜곡을 시간 평활화하고, 상기 엔벨롭 위상과 상기 선형 위상과 재결합하여 개선된 음성 스펙트럴 위상을 획득하는 단계; 및 상기 ISTFT부가 상기 개선된 음성 스펙트럴 진폭과 상기 개선된 음성 스펙트럴 위상을 결합하고, ISTFT를 수행하여 명료성이 개선된 음성 신호를 획득하는 단계; 를 포함하고, 상기 개선된 음성 스펙트럴 위상을 획득하는 단계는 상기 음성 스펙트럴 위상에 대해 ZZT(Zeros of Z-Transform)를 수행하여, 상기 음성 스펙트럴 위상에 포함된 상기 엔벨롭 위상으로 추정하는 단계; 상기 음성 스펙트럴 위상에서 추정된 상기 엔벨롭 위상을 차감하여 음성 위상을 획득하는 단계; 상기 음성 위상에 포함된 선형 위상을 인접 프레임의 선형 위상과 현재 프레임의 기본 주파수를 이용하여 추정하는 단계; 상기 음성 위상에서 추정된 상기 선형 위상을 차감하여 상기 여기 위상을 획득하는 단계; 상기 여기 위상의 순간 위상 차인 여기 위상 왜곡을 계산하고, 상기 여기 위상 왜곡을 시간 평활화하여, 개선된 여기 위상 차를 획득하는 단계; 및 추정된 상기 엔벨롭 위상과 추정된 상기 엔벨롭 위상 및 개성된 여기 위상 차를 재결합하여 개선된 음성 스펙트럴 위상을 획득하는 단계; 및 개선된 하모닉스 기반의 상기 음성 스펙트럴 위상을 STFT 기반의 시간-주파수 인덱스로 변환하여, STFT 도메인의 개선된 음성 스펙트럴 위상을 획득하는 단계; 를 포함하는 PTT 기반 음성 명료성 향상 방법
7	7 제6 항에 있어서, 상기 음성 스펙트럴 진폭을 획득하는 단계는 상기 음성 스펙트럴 진폭과 상기 잡음 스펙트럴 진폭 사이의 코사인 유사도를 계산하여, 상기 음성 스펙트럴 진폭의 음성 구간을 판별하고, 상기 음성 구간 판별 결과에 따라 조건부 음성 존재 확률을 추정하는 단계; 상기 조건부 음성 존재 확률을 기반으로 노이즈 플로어 평활화를 적용해 시변 평활화 변수를 획득하며, 상기 시변 평활화 변수를 이용하여, 이전 프레임의 상기 음성 스펙트럴 진폭에서 추정된 잡음 진폭 스펙트럼과 현재 프레임의 상기 음성 스펙트럴 진폭 사이에 시변 평활화를 수행함으로써, 현재 프레임의 상기 음성 스펙트럴 진폭에 포함된 상기 잡음 진폭 스펙트럼을 추정하는 단계; 추정된 상기 잡음 진폭 스펙트럼과 상기 음성 스펙트럴 진폭을 이용하여 상기 a posteriori SNR을 추정하고, 추정된 상기 a posteriori SNR 및 이전 획득된 개선된 음성 스펙트럴 진폭 및 기설정된 스무딩 파라미터로부터 상기 a priori SNR을 추정하는 단계; 상기 코사인 유사도에 근거한 프레임별 음성 존재 확률로부터 음성 부재 확률을 계산하고, 상기 음성 부재 확률과 상기 a priori SNR 및 상기 a posteriori SNR을 이용하여 음성 존재 불확실성 계수를 계산하며, 상기 a priori SNR과 계산된 상기 음성 존재 불확실성 계수를 이용하여 상기 진폭 추정 이득값을 획득하는 단계; 및 상기 진폭 추정 이득값을 상기 음성 스펙트럴 진폭에 적용하여, 상기 개선된 음성 스펙트럴 진폭을 획득하는 단계; 를 포함하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 방법
8	8 제7 항에 있어서, 상기 조건부 음성 존재 확률을 추정하는 단계는 상기 잡음 스펙트럴 진폭의 전체 주파수 빈에 대한 평균값인 평균 스펙트럴 진폭과 최소값인 최소 스펙트럴 진폭을 계산하는 단계; 상기 평균 스펙트럴 진폭과 상기 음성 스펙트럴 진폭과 코사인 유사도를 계산하는 단계; 계산된 상기 코사인 유사도가 기설정된 기준 문턱값 이하이면 상기 최소 스펙트럴 진폭을 구간 판별 문턱값으로 설정하고, 상기 코사인 유사도가 기설정된 기준 문턱값을 초과하면 상기 평균 스펙트럴 진폭을 구간 판별 문턱값으로 설정하는 단계; 상기 코사인 유사도가 설정된 상기 구간 판별 문턱값 이하이면, 해당 프레임의 음성 스펙트럴 진폭이 음성 구간인 것으로 판별하는 단계; 및 상기 음성 구간 판별 결과에 따라 조건부 음성 존재 확률을 계산하는 단계; 를 포함하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 방법
9	9 제7 항에 있어서, 상기 진폭 추정 이득값을 획득하는 단계는 상기 a priori SNR과 상기 a posteriori SNR을 이용하여, 가중 베타 지수승 STSA(short-time spectral amplitude) 추정 기반의 진폭 추정 이득값(G(K, l))을 계산하는 것을 특징으로 하는 PTT 기반 음성 명료성 향상 방법
10	10 삭제

순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번	연구부처	주관기관	연구사업	연구과제
1	미래창조과학부	서울대학교 산학협력단	대학ICT연구센터 육성지원사업	실감 오케스트라 서비스를 위한 입체음향 취득/재현기술 개발
2	교육부	광운대학교 산학협력단	기본연구지원사업	사물인터넷기반 차세대 음악 에코시스템

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2016.10.31	수리 (Accepted)	1-1-2016-1060603-96
2	출원인정보변경(경정)신고서	2017.03.27	수리 (Accepted)	4-1-2017-5046666-19
3	의견제출통지서	2017.10.30	발송처리완료 (Completion of Transmission)	9-5-2017-0752693-28
4	[명세서등 보정]보정서	2017.12.04	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2017-1207699-40
5	[거절이유 등 통지에 따른 의견]의견(답변, 소명)서	2017.12.04	수리 (Accepted)	1-1-2017-1207698-05
6	등록결정서	2018.05.21	발송처리완료 (Completion of Transmission)	9-5-2018-0341800-34
7	출원인정보변경(경정)신고서	2019.05.13	수리 (Accepted)	4-1-2019-5093546-10
8	출원인정보변경(경정)신고서	2019.05.23	수리 (Accepted)	4-1-2019-5101798-31
9	출원인정보변경(경정)신고서	2019.08.02	수리 (Accepted)	4-1-2019-5154561-59
10	출원인정보변경(경정)신고서	2020.11.25	수리 (Accepted)	4-1-2020-5265458-48


과제고유번호	1345255122
세부과제번호	2015R1D1A1A01059804
연구과제명	사물인터넷 기반 차세대 음악 에코시스템
성과구분	출원
부처명	교육부
연구관리전문기관명
연구주관기관명
성과제출연도	2016
연구기간	201611~201710
기여율	0.5
연구개발단계명	기초연구
6T분류명	IT(정보기술)


과제고유번호	1711035228
세부과제번호	H8501-16-1016
연구과제명	실감 오케스트라 서비스를 위한 입체음향 취득/재현기술 개발
성과구분	출원
부처명	미래창조과학부
연구관리전문기관명
연구주관기관명
성과제출연도	2016
연구기간	201601~201612
기여율	0.5
연구개발단계명	기초연구
6T분류명	CT(문화기술)

특허성과

[1020160178057]	오디오 신호 처리 방법 및 장치	새창보기
[1020160171869]	문자를 포함하는 영상의 평활화 방법 및 장치	새창보기
[1020160171359]	심화 신경망을 이용한 다채널 마이크 기반의 잔향시간 추정 방법 및 장치	새창보기
[1020160143289]	PTT 기반 음성 명료성 향상 장치 및 방법(APPARATUS AND METHOD FOR IMPROVING VOICE INTELLIGIBILITY BASED ON PTT)	새창보기

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2015135103][서울대학교]	다중 해싱에 기초한 오디오 핑거프린팅 시스템	새창보기
[KST2017009646][서울대학교]	신호 처리 방법 및 신호 처리 장치(METHOD OF TRANSMITTING DATA AND TRANSMISSION PROCESSING AGENT)	새창보기
[KST2019011899][서울대학교]	오디오 신호 처리 방법 및 장치	새창보기
[KST2019011709][서울대학교]	오디오 신호의 배음 성분 부스팅 방법 및 장치	새창보기
[KST2019003779][서울대학교]	소리 신호를 처리하는 반도체 장치 및 이를 포함하는 마이크 장치	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택