기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

방송 음성 데이터를 이용한 영역 및 화자 의존 음성 합성장치, 음성 합성용 데이터베이스 구축방법 및 음성 합성서비스 시스템

기술번호 : KST2015079218
담당센터 : 대전기술혁신센터
전화번호 : 042-610-2279

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명은 대용량 코퍼스 기반 음성 합성기를 구현할 경우, 비교적 고비용이 소요되는 음성 녹음작업을 대체할 수 있는 방송 음성 데이터를 이용한 영역 및 화자 의존 음성 합성 장치, 이러한 음성 합성 장치에 사용되는 음성 합성용 데이터베이스를 구축하는 방법 및 음성 합성 서비스 시스템에 관한 것이다. 본 발명에서는 음성 합성용 데이터베이스를 위한 별도의 합성용 텍스트 설계, 화자 선정, 음성 녹음 작업 대신에 일반 방송 음성을 특정 영역 및 화자 별로 녹취한 음성 데이터를 사용하여 각각의 음성 합성용 데이터베이스를 자동화된 방법으로 구축한 후 이를 이용한 음성 합성 장치 및 음성 합성 서비스 시스템을 구현한다. 본 발명에 따르면, 서비스 영역에 의존한 음성 합성용 데이터베이스의 구축 및 확장이 용이해지며, 합성음의 자연성 및 친화도를 향상시킬 수 있다. 음성 합성, 영역(domain)/화자(speaker), 음성 합성 데이터베이스, 방송 음성 데이터
Int. CL	G10L 13/027 (2013.01)
CPC	G10L 13/027(2013.01) G10L 13/027(2013.01) G10L 13/027(2013.01)
출원번호/일자	1020030077017 (2003.10.31)
출원인	한국전자통신연구원
등록번호/일자
공개번호/일자	10-2005-0041749 (2005.05.04) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	거절
심사진행상태	수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2003.10.31)
심사청구항수	8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	한국전자통신연구원	대한민국	대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	최문옥	대한민국	충청북도청주시흥덕구
2	김상훈	대한민국	대전광역시유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	권태복	대한민국	서울시 강남구 테헤란로길 , 층 (역삼동, 청원빌딩)(아리특허법률사무소)
2	이화익	대한민국	서울시 강남구 테헤란로길* (역삼동,청원빌딩) 층,,*호(영인국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
최종권리자 정보가 없습니다

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	특허출원서 Patent Application	2003.10.31	수리 (Accepted)	1-1-2003-0412493-88
2	의견제출통지서 Notification of reason for refusal	2005.08.30	발송처리완료 (Completion of Transmission)	9-5-2005-0425827-54
3	거절결정서 Decision to Refuse a Patent	2005.12.27	발송처리완료 (Completion of Transmission)	9-5-2005-0661440-68
4	출원인정보변경(경정)신고서 Notification of change of applicant's information	2009.08.04	수리 (Accepted)	4-1-2009-5150899-36
5	출원인정보변경(경정)신고서 Notification of change of applicant's information	2015.02.02	수리 (Accepted)	4-1-2015-0006137-44

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 서비스 영역별로 고정된 화자의 방송 음성 데이터를 녹음하여 영역 및 화자별 방송 음성 데이터를 제공하는 방송 음성 녹음부; 상기 방송 음성 녹음부에서 제공되는 영역 및 화자별 방송 음성 데이터를 각 영역 및 화자별로 데이터베이스로 구축한 복수의 음성 합성용 데이터베이스; 상기 각 음성 합성용 데이터베이스에 저장된 방송 음성 데이터를 이용하여 소정의 음성 합성 알고리즘에 따라 음성 합성을 수행하는 합성기; 및 상기 합성기로부터의 합성음을 재생시키는 합성음 재생부를 포함하는 영역 및 화자 의존 음성 합성 장치
2	2 제1항에 있어서, 상기 각 음성 합성용 데이터베이스는 뉴스 영역, 일기예보영역 및 교통정보 영역을 포함하며, 상기 각 서비스 영역에서의 대표적인 화자의 방송 음성 데이터가 이용되는 영역 및 화자 의존 음성 합성 장치
3	3 특정 방송을 지정하여 녹음하는 과정을 통해 서비스 영역 및 화자별로 방송 음성 데이터를 수집하는 제1단계; 상기 제1단계에서 수집된 방송 음성 데이터에 대응하는 텍스트를 얻기 위하여 연속 음성 인식기를 이용한 텍스트 자동 전사 및 검증 과정을 수행하는 제2단계; 상기 단계에서 수집된 방송 음성 데이터와 전사된 텍스트를 받아들여 음성 인식기를 이용한 트라이폰 단위의 음소 레이블링과, 피치 추출 툴을 이용한 피치 레이블링을 수행하는 제3단계; 및 상기 제3단계의 음소 및 피치 레이블링 결과와 상기 제1단계의 방송 음성 데이터를 종합하여 영역 및 화자별로 의존하는 음성 합성용 데이터베이스를 구성하는 제4단계를 포함하는 영역 및 화자 의존 음성 합성용 데이터베이스 구축 방법
4	4 제3항에 있어서, 상기 제3단계는 상기 영역 및 화자별 방송 음성 데이터를 받아들여 연속 음성 인식 과정을 수행하며, 형태소, 어절과 같은 인식 단위 별로 텍스트 형태의 인식 결과와 인식 스코어를 산출하는 단계; 및 상기 산출된 인식 스코어가 소정의 임계치 이상일 경우에는 올바른 인식이 수행된 것으로 판단하여 인식된 텍스트를 방송 음성에 대응하는 텍스트로서 적용하고, 상기 산출된 인식 스코어가 소정의 임계치보다 작을 경우에는 해당 텍스트를 검증 대상 목록에 저장한 후 상기 텍스트에 대한 검증 및 오류 수정 과정을 수행하는 단계를 포함하는 영역 및 화자 의존 음성 합성용 데이터베이스 구축 방법
5	5 제4항에 있어서, 상기 검증 대상 목록은 상기 인식 스코어와 임계치의 비교를 통해 자동적으로 생성되는 영역 및 화자 의존 음성 합성용 데이터베이스 구축 방법
6	6 제3항에 있어서, 이미 완료된 인식 결과와 웹으로부터 해당 서비스 영역별 텍스트를 자동으로 수집하고, 상기 수집된 텍스트로부터 언어모델을 추출하여 상기 제2단계의 연속 음성 인식기에 적용하는 단계를 더 포함하는 영역 및 화자 의존 음성 합성용 데이터베이스 구축 방법
7	7 제3항에 있어서, 상기 입력된 방송 음성 데이터와 상기 전사 완료된 텍스트를 입력받아 해당 화자에 적응된 음향 모델을 생성한 후 이를 상기 제2단계의 연속 음성 인식기에 적용하는 단계를 더 포함하는 영역 및 화자 의존 음성 합성용 데이터베이스 구축 방법
8	8 뉴스 정보, 일기예보 정보 및 교통 정보를 서비스 영역으로서 각각 포함하는 복수의 웹 컨텐츠; 상기 각 서비스 영역의 정보를 실시간으로 갱신하기 위한 컨텐츠 갱신 처리부; 서비스 영역 및 화자별 방송 음성 데이터를 저장하고 있는 복수의 음성 합성용 데이터베이스; 인터넷 망을 통해 상기 복수의 웹 컨텐츠 및 컨텐츠 갱신 처리부와 연결됨과 동시에 상기 복수의 음성 합성용 데이터베이스와 연결되어, 상기 컨텐츠 갱신 처리부에 의해 제공되는 복수의 웹 컨텐츠를 이용하여 상기 영역 및 화자별 음성 합성용 데이터베이스를 구축하며, 유무선 정보 단말기를 통해 서비스 요청이 있을 경우에 상기 각 데이터베이스에 저장된 방송 음성 데이터를 이용하여 음성 합성 기능을 수행하고 그 결과를 상기 정보 단말기에 제공하는 음성 합성 서버를 포함하는 영역 및 화자 의존 음성 합성 서비스 시스템
9	8 뉴스 정보, 일기예보 정보 및 교통 정보를 서비스 영역으로서 각각 포함하는 복수의 웹 컨텐츠; 상기 각 서비스 영역의 정보를 실시간으로 갱신하기 위한 컨텐츠 갱신 처리부; 서비스 영역 및 화자별 방송 음성 데이터를 저장하고 있는 복수의 음성 합성용 데이터베이스; 인터넷 망을 통해 상기 복수의 웹 컨텐츠 및 컨텐츠 갱신 처리부와 연결됨과 동시에 상기 복수의 음성 합성용 데이터베이스와 연결되어, 상기 컨텐츠 갱신 처리부에 의해 제공되는 복수의 웹 컨텐츠를 이용하여 상기 영역 및 화자별 음성 합성용 데이터베이스를 구축하며, 유무선 정보 단말기를 통해 서비스 요청이 있을 경우에 상기 각 데이터베이스에 저장된 방송 음성 데이터를 이용하여 음성 합성 기능을 수행하고 그 결과를 상기 정보 단말기에 제공하는 음성 합성 서버를 포함하는 영역 및 화자 의존 음성 합성 서비스 시스템

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	특허출원서	2003.10.31	수리 (Accepted)	1-1-2003-0412493-88
2	의견제출통지서	2005.08.30	발송처리완료 (Completion of Transmission)	9-5-2005-0425827-54
3	거절결정서	2005.12.27	발송처리완료 (Completion of Transmission)	9-5-2005-0661440-68
4	출원인정보변경(경정)신고서	2009.08.04	수리 (Accepted)	4-1-2009-5150899-36
5	출원인정보변경(경정)신고서	2015.02.02	수리 (Accepted)	4-1-2015-0006137-44

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2015077076][한국전자통신연구원]	그래픽 사용자 인터페이스를 이용한 합성 음성 분석 방법	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택