기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

개인 음색을 반영한 통계적 음성합성 시스템 및 방법

기술번호 : KST2015228293
담당센터 : 부산기술혁신센터
전화번호 : 051-606-6561

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명은 통계적 음성합성 시스템에서 말장애 환자의 음색 특성을 반영한 합성음을 생성하여 의사소통 개선이 가능하도록 한 개인 음색을 반영한 통계적 음성합성 시스템 및 방법에 관한 것으로, 말장애 환자로부터 단모음 음성을 수집하는 단모음 음성 수집부;상기 단모음 음성 수집부에서 수집된 단모음 음성과 통계적 음성합성 시스템의 음향 모델 중 해당 단모음 모델을 비교하여 포먼트 기반의 쌍선형 변환 화자적응 파라미터를 추출하는 화자적응 파라미터 추출부;상기 화자적응 파라미터 추출부에서 추출된 화자적응 파라미터를 적용하여 화자 특성을 반영하는 합성음을 생성하는 합성음 생성부;상기 합성음 생성부에서 생성된 합성음의 음색을 선택적으로 튜닝하는 합성음 튜닝부;를 포함하는 것이다.
Int. CL	G10L 15/02 (2006.01) G10L 15/28 (2006.01) G10L 15/14 (2006.01)
CPC	G10L 13/04(2013.01) G10L 13/04(2013.01) G10L 13/04(2013.01) G10L 13/04(2013.01)
출원번호/일자	1020140061532 (2014.05.22)
출원인	부산대학교 산학협력단
등록번호/일자	10-1567566-0000 (2015.11.02)
공개번호/일자
공고번호/일자	(20151106) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	등록
심사진행상태	수리
심판사항
구분	신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2014.05.22)
심사청구항수	8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	부산대학교 산학협력단	대한민국	부산광역시 금정구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	김형순	대한민국	부산광역시 금정구
2	반성민	대한민국	부산광역시 해운대구
3	최영호	대한민국	부산광역시 금정구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	정기택	대한민국	서울특별시 서초구 강남대로길 , *층 (반포동, 새로나빌딩)(스카이특허법률사무소)
2	오위환	대한민국	서울특별시 서초구 강남대로길 , *층 (반포동, 새로나빌딩)(스카이특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
1	부산대학교 산학협력단	대한민국	부산광역시 금정구

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2014.05.22	수리 (Accepted)	1-1-2014-0482215-67
2	의견제출통지서 Notification of reason for refusal	2015.03.23	발송처리완료 (Completion of Transmission)	9-5-2015-0192202-86
3	[지정기간연장]기간연장(단축, 경과구제)신청서 [Designated Period Extension] Application of Period Extension(Reduction, Progress relief)	2015.05.26	수리 (Accepted)	1-1-2015-0501358-13
4	[거절이유 등 통지에 따른 의견]의견(답변, 소명)서 [Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)	2015.06.22	수리 (Accepted)	1-1-2015-0602398-19
5	[명세서등 보정]보정서 [Amendment to Description, etc.] Amendment	2015.06.22	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2015-0602429-47
6	등록결정서 Decision to grant	2015.10.26	발송처리완료 (Completion of Transmission)	9-5-2015-0734451-06
7	출원인정보변경(경정)신고서 Notification of change of applicant's information	2016.01.13	수리 (Accepted)	4-1-2016-5004891-78
8	출원인정보변경(경정)신고서 Notification of change of applicant's information	2017.01.09	수리 (Accepted)	4-1-2017-5004005-98
9	출원인정보변경(경정)신고서 Notification of change of applicant's information	2017.01.10	수리 (Accepted)	4-1-2017-5004797-18

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 말장애 환자로부터 단모음 음성을 수집하는 단모음 음성 수집부;상기 단모음 음성 수집부에서 수집된 단모음 음성 데이터를 프레임 단위로 구분하는 프레임 단위 구분부와, 프레임 에너지가 가장 큰 프레임 및 그 전후 K개의 프레임들로 이루어진 2K + 1개의 프레임에 대해 제1 포먼트(F1), 제2 포먼트(F2), 제3 포먼트(F3) 주파수를 추출하는 포먼트 주파수 추출부와, 포먼트 주파수 추출부에서 추출된 각 프레임의 포먼트 주파수들의 중앙값(median)으로 결정하는 중앙값 결정부와, 말장애 환자의 특정 단모음으로부터 추출한 포먼트 주파수(F1,F2 및 F3)들을 이 단모음에 해당하는 음향모델의 포먼트 주파수(F1M,F2M 및 F3M)들의 쌍선형 변환(bilinear transform)으로 표현할 때 가중제곱오차합이 최소가 되는 쌍선형 변환 계수αSA를 화자적응 파라미터로 구하는 화자적응 파라미터 결정부를 포함하여, 포먼트 기반의 쌍선형 변환 화자적응 파라미터를 추출하는 화자적응 파라미터 추출부;상기 화자적응 파라미터 추출부에서 추출된 화자적응 파라미터를 적용하여 화자 특성을 반영하는 합성음을 생성하는 합성음 생성부;상기 합성음 생성부에서 생성된 합성음의 음색을 선택적으로 튜닝하는 합성음 튜닝부;를 포함하는 것을 특징으로 하는 개인 음색을 반영한 통계적 음성합성 시스템
2	2 삭제
3	3 말장애 환자로부터 단모음 음성을 수집하는 단계;수집된 단모음 음성 데이터를 프레임 단위로 구분하는 단계와, 프레임 에너지가 가장 큰 프레임 및 그 전후 K개의 프레임들로 이루어진 2K + 1개의 프레임에 대해 제1 포먼트(F1), 제2 포먼트(F2), 제3 포먼트(F3) 주파수를 추출하는 단계와, 추출된 각 프레임의 포먼트 주파수들의 중앙값(median)으로 결정하는 단계와, 말장애 환자의 특정 단모음으로부터 추출한 포먼트 주파수(F1,F2 및 F3)들을 이 단모음에 해당하는 음향모델의 포먼트 주파수(F1M,F2M 및 F3M)들의 쌍선형 변환(bilinear transform)으로 표현할 때 가중제곱오차합이 최소가 되는 쌍선형 변환 계수αSA를 화자적응 파라미터로 구하는 단계를 포함하고, 포먼트 기반의 쌍선형 변환 화자적응 파라미터를 추출하는 단계;추출된 화자적응 파라미터를 적용하여 화자 특성을 반영하는 합성음을 생성하는 단계;를 포함하는 것을 특징으로 하는 개인 음색을 반영한 통계적 음성합성 방법
4	4 제 3 항에 있어서, 상기 추출된 화자적응 파라미터를 적용하여 화자 특성을 반영하는 합성음을 생성하는 단계에서,생성된 합성음의 청취 결과를 기반으로 음색을 튜닝하는 단계를 선택적으로 더 수행하는 것을 특징으로 하는 개인 음색을 반영한 통계적 음성합성 방법
5	5 삭제
6	6 제 3 항에 있어서, 가중제곱오차합이 최소가 되는 쌍선형 변환 계수αSA를 화자적응 파라미터로 구하는 단계에서,주파수(Hz 단위) 영역에서의 쌍선형 변환식은이고,여기서 와 는 각각 쌍선형 변환 이전 및 이후의 주파수를 의미하며, α는 쌍선형 변환 파라미터인 것을 특징으로 하는 개인 음색을 반영한 통계적 음성합성 방법
7	7 제 6 항에 있어서, 주파수(Hz 단위) 영역에서의 쌍선형 변환식을 에 대해 정리한 함수 는이고,쌍선형 변환 함수 를 이용하여 말장애 환자의 특정 단모음으로부터 추출한 포먼트 주파수(F1,F2 및 F3)들과 이 단모음에 해당하는 음향모델의 포먼트 주파수(F1M,F2M 및 F3M)의 쌍선형 변환 값들과의 가중제곱오차합은,이고,여기서 가중치 는, 말장애 환자의 음성의 경우 일반인의 음성에 비해 포먼트 주파수 추출의 신뢰도가 떨어짐을 감안하여, 추정된 i번째 포먼트 주파수의 신뢰도를 고려한 가중치인 것을 특징으로 하는 개인 음색을 반영한 통계적 음성합성 방법
8	8 제 7 항에 있어서, 개별 포먼트 주파수의 신뢰도를 고려하는 가중치 계산은,이고,여기서 와 는 사용된 2K + 1개 프레임의 i번째 포먼트 주파수 들의 평균과 표준 편차값, 함수 g(x)는 x ≥ 0인 범위에 대해 단조증가 특성을 가지는 함수인 것을 특징으로 하는 개인 음색을 반영한 통계적 음성합성 방법
9	9 제 4 항에 있어서, 생성된 합성음의 청취 결과를 기반으로 음색을 튜닝하는 단계에서,합성음의 운율 특성 중, 음의 고저를 나타내는 억양 특성은 음향 모델의 log F0 파라미터로 표현하며, 합성음의 j번째 프레임에 대해 기존의 log F0 값을 LF0(j),음색변환된 log F0 값을 라고 하면, 음색 변환은,으로 이루어지고,여기서 LF0SA는 합성음의 억양 특성 변환을 위한 사용자 지정 파라미터이고, LF0SA 003e# 0이면 음이 높아지고, LF0SA 003c# 0이면 음이 낮아지게 되고, LF0SA 값을 조절하면서 합성음을 듣고 LF0SA 값을 선정하는 것을 특징으로 하는 개인 음색을 반영한 통계적 음성합성 방법
10	10 제 4 항에 있어서, 생성된 합성음의 청취 결과를 기반으로 음색을 튜닝하는 단계에서,구해진 화자적응 파라미터를 이용한 쌍선형 변환과 멜-스케일 주파수 변환을 위한 쌍선형 변환을 직렬 연결하여 단일 쌍선형 변환으로 표현하면,쌍선형 변환 파라미터 αF는,이고,여기서, αSA는 가중제곱오차합이 최소가 되는 쌍선형 변환 계수, αM은 멜-스케일 주파수 변환을 위한 쌍선형 변환 계수이고,쌍선형 변환 파라미터 αF를 이용한 스펙트럼 변환의 경우에도, 말장애 환자 본인이 추가적으로 스펙트럼 특성의 변경을 원할 경우, αF 값을 조절하면서 합성음을 들어보고 말장애 환자 본인에게 가장 만족스러운 αF 값을 선정하는 것을 특징으로 하는 개인 음색을 반영한 통계적 음성합성 방법

순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번	연구부처	주관기관	연구사업	연구과제
1	산업통상자원부	부산대학교 산학협력단	QoLT 기술개발사업	(RCMS)시각 및 언어 장애인을 위한 음성합성기 및 AAC소프트웨어 개발

본 등록정보는 참고용으로 법적증빙자료로 사용할 수 없습니다.
데이터 이관에 따른 소요기간(1일)으로 인하여 등록원부와 일부 차이가 발생할 수 있으며, 일부 정보(부기, 상세 주소 등)를 제공하지 않고 있습니다.
법적증빙자료로 활용하시거나 더 자세한 정보를 보시려면 등록원부를 발급받아 사용하시기 바랍니다.

이전대상기술 뷰 페이지 등록사항 > 특허 등록번호 표입니다.
특허 등록번호	10-1567566-0000

권리란

표시번호, 사항의 정보를 제공하는 이전대상기술 뷰 페이지 등록사항 > 권리란 표입니다.
표시번호	사항
1	출원 연월일 : 20140522 출원 번호 : 1020140061532 공고 연월일 : 20151106 공고 번호 : 특허결정(심결)연월일 : 20151026 청구범위의 항수 : 8 유별 : G10L 15/02 발명의 명칭 : 개인 음색을 반영한 통계적 음성합성 시스템 및 방법 존속기간(예정)만료일 :

특허권자란

순위번호, 사항의 정보를 제공하는 이전대상기술 뷰 페이지 등록사항 > 특허권자란 표입니다.
순위번호	사항
1	(권리자) 부산대학교 산학협력단 부산광역시 금정구...

등록료란

순위번호, 사항의 정보를 제공하는 이전대상기술 뷰 페이지 등록사항 > 등록료란 표입니다.
제 1 - 3 년분	금 액	178,500 원	2015년 11월 03일	납입
제 4 년분	금 액	108,000 원	2018년 11월 01일	납입
제 5 년분	금 액	108,000 원	2019년 10월 30일	납입
제 6 년분	금 액	108,000 원	2020년 10월 27일	납입

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2014.05.22	수리 (Accepted)	1-1-2014-0482215-67
2	의견제출통지서	2015.03.23	발송처리완료 (Completion of Transmission)	9-5-2015-0192202-86
3	[지정기간연장]기간연장(단축, 경과구제)신청서	2015.05.26	수리 (Accepted)	1-1-2015-0501358-13
4	[거절이유 등 통지에 따른 의견]의견(답변, 소명)서	2015.06.22	수리 (Accepted)	1-1-2015-0602398-19
5	[명세서등 보정]보정서	2015.06.22	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2015-0602429-47
6	등록결정서	2015.10.26	발송처리완료 (Completion of Transmission)	9-5-2015-0734451-06
7	출원인정보변경(경정)신고서	2016.01.13	수리 (Accepted)	4-1-2016-5004891-78
8	출원인정보변경(경정)신고서	2017.01.09	수리 (Accepted)	4-1-2017-5004005-98
9	출원인정보변경(경정)신고서	2017.01.10	수리 (Accepted)	4-1-2017-5004797-18


기술번호	KST2015228293
자료제공기관	기관
기술공급기관	부산대학교
기술명	개인 음색을 반영한 통계적 음성합성 시스템 및 방법
기술개요	본 발명은 통계적 음성합성 시스템에서 말장애 환자의 음색 특성을 반영한 합성음을 생성하여 의사소통 개선이 가능하도록 한 개인 음색을 반영한 통계적 음성합성 시스템 및 방법에 관한 것으로, 말장애 환자로부터 단모음 음성을 수집하는 단모음 음성 수집부;상기 단모음 음성 수집부에서 수집된 단모음 음성과 통계적 음성합성 시스템의 음향 모델 중 해당 단모음 모델을 비교하여 포먼트 기반의 쌍선형 변환 화자적응 파라미터를 추출하는 화자적응 파라미터 추출부;상기 화자적응 파라미터 추출부에서 추출된 화자적응 파라미터를 적용하여 화자 특성을 반영하는 합성음을 생성하는 합성음 생성부;상기 합성음 생성부에서 생성된 합성음의 음색을 선택적으로 튜닝하는 합성음 튜닝부;를 포함하는 것이다.
개발상태	개발
기술의 우수성
응용분야	32.전자부품,영상,음향및통신장비제조업？/？방송수신기및기타영상,음향기기제조업？/？방송수신기및기타영상,음향기기제조업？/？방송수신기및기타영상,음향기기제조업 ？
시장규모 및 동향
희망거래유형
사업화적용실적
도입시고려사항

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2015227905][부산대학교]	가중 자동회귀 이동평균 필터와 전역 켑스트럼 평균 및 분산 정규화를 이용한 특징 보상	새창보기
[KST2017004720][부산대학교]	개인 음색을 반영한 통계적 음성합성 시스템 및 방법	새창보기
[KST2014047640][부산대학교]	가중 자동회귀 이동평균 필터와 전역 켑스트럼 평균 및 분산 정규화를 이용한 특징 보상	새창보기
[KST2017004319][부산대학교]	가중 자동회귀 이동평균 필터와 전역 켑스트럼 평균 및 분산 정규화를 이용한 특징 보상	새창보기
[KST2015172176][부산대학교]	아이겐 환경 및 바이어스 벡터 동시 가중치 추정을 통한잡음 보상 방법	새창보기
[KST2014047641][부산대학교]	가중 자동회귀 이동평균 필터와 전역 켑스트럼 평균 및 분산 정규화를 이용한 특징 보상	새창보기
[KST2015171863][부산대학교]	쌍일차 모델을 이용한 화자 적응 시스템 및 방법	새창보기
[KST2015171872][부산대학교]	군집화된 ＥＶ를 이용한 고속 화자 적응 방법	새창보기
[KST2017004838][부산대학교]	강건성 테스트 장치, 음성 인식 장치, 및 이를 포함하는 차량, 및 강건성 테스트 방법	새창보기
[KST2023004211][부산대학교]	음소 및 문맥 정보를 고려한 화자 임베딩 추출 방법 및 장치	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택