맞춤기술찾기

이전대상기술

문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치 및 그 동작 방법

  • 기술번호 : KST2022003189
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치 및 그 동작 방법이 개시된다. 본 발명은 소정의 훈련 문장들로부터 획득된 음소별 평균 발음 소요 시간과 평균 묵음 지속 시간 및 어절별 묵음의 등장 비율을 기초로, 소정의 문장에 대한 음성 합성이 수행될 때, 상기 문장에 존재하는 어절들 중 묵음 구간을 갖는 것으로 예측되는 어절을 선택한 후 선택된 어절 후단에 묵음 구간을 삽입함으로써, 보다 자연스러운 합성 음성이 생성될 수 있도록 지원하는 기술에 대한 것이다.
Int. CL G10L 13/08 (2006.01.01) G10L 25/93 (2013.01.01) G10L 15/02 (2006.01.01) G10L 13/10 (2013.01.01)
CPC G10L 13/08(2013.01) G10L 25/93(2013.01) G10L 15/02(2013.01) G10L 2013/105(2013.01) G10L 2015/025(2013.01) G10L 2015/027(2013.01)
출원번호/일자 1020200119646 (2020.09.17)
출원인 주식회사 한글과컴퓨터, 한국과학기술원
등록번호/일자
공개번호/일자 10-2022-0037094 (2022.03.24) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.09.17)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 주식회사 한글과컴퓨터 대한민국 경기도 성남시 분당구
2 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김회린 대전광역시 유성구
2 서영주 대전광역시 유성구
3 최연주 대전광역시 유성구
4 정성희 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김효성 대한민국 서울특별시 영등포구 **로 **, *층 ***호(여의도동, 콤비빌딩)(효성국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.09.17 수리 (Accepted) 1-1-2020-0986787-34
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2021.01.26 수리 (Accepted) 4-1-2021-5023433-33
3 의견제출통지서
Notification of reason for refusal
2022.01.28 발송처리완료 (Completion of Transmission) 9-5-2022-0084812-03
4 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2022.03.15 1-1-2022-0276749-70
5 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2022.03.15 수리 (Accepted) 1-1-2022-0276754-09
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
사전 설정된 복수의 훈련 문장들 각각이 음성으로 발음되었을 때, 상기 복수의 훈련 문장들에 포함된 복수의 음소들 각각이 발음되는데 소요되는 평균 발음 소요 시간에 대한 측정값이 저장되어 있는 발음 소요 시간 정보 저장부;상기 복수의 훈련 문장들 각각이 음성으로 발음되었을 때, 음성이 존재하지 않는 묵음 구간 간의 평균 간격 시간에 대한 측정값이 저장되어 있는 묵음 시간 정보 저장부;상기 복수의 훈련 문장들에 포함된 복수의 어절들과, 상기 복수의 훈련 문장들 각각이 음성으로 발음되었을 때, 상기 복수의 어절들 각각이 발음된 직후에 묵음 구간이 등장한 비율에 대한 측정값이 서로 대응되어 저장되어 있는 비율 저장부;사용자에 의해 제1 문장에 대한 텍스트 음성 변환(Text to Speech: TTS) 명령이 인가되면, 상기 제1 문장으로부터 상기 제1 문장을 구성하는 복수의 제1 음소들과 상기 제1 문장을 구성하는 복수의 제1 어절들을 추출하는 정보 추출부;상기 발음 소요 시간 정보 저장부를 참조하여 상기 복수의 제1 음소들 각각에 대응되는 평균 발음 소요 시간에 대한 측정값을 확인한 후 상기 복수의 제1 어절들 각각에 대해, 각 어절에 포함된 음소들의 평균 발음 소요 시간에 대한 측정값을 합산하여 합산 값을 생성함으로써, 상기 복수의 제1 어절들 각각에 대해서 생성된 합산 값을 상기 복수의 제1 어절들 각각에 대응되는 어절 발음 시간으로 지정하는 지정부;상기 묵음 시간 정보 저장부를 참조하여 상기 평균 간격 시간에 대한 측정값을 확인하고, 상기 비율 저장부를 참조하여 상기 복수의 제1 어절들 각각에 대응되는 비율에 대한 측정값을 확인하며, 상기 복수의 제1 어절들 각각에 대응되는 어절 발음 시간을 기초로 상기 복수의 제1 어절들 간의 발음 지속 시간을 연산한 후 상기 평균 간격 시간과 상기 복수의 제1 어절들 각각에 대응되는 비율 및 상기 복수의 제1 어절들 간의 발음 지속 시간을 기초로 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 적어도 하나의 제2 어절을 선택하는 어절 선택부;상기 적어도 하나의 제2 어절이 선택되면, 상기 제1 문장에서 상기 적어도 하나의 제2 어절이 끝나는 지점에 사전 설정된 묵음 기호를 삽입하는 묵음 기호 삽입부; 및사전 설정된 음성 합성 모델을 기초로 상기 제1 문장에 대한 합성 음성을 생성하되, 상기 제1 문장에서 상기 묵음 기호가 삽입된 지점에 대해 사전 설정된 묵음 시간만큼에 대응되는 묵음 구간이 포함된 상기 합성 음성을 생성하는 음성 합성부를 포함하는 문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치
2 2
제1항에 있어서,상기 어절 선택부는하기의 (a) 내지 (e) 과정을 반복 수행함으로써, (d) 과정을 통해서 하나씩 선택되는 어절을 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 상기 적어도 하나의 제2 어절로 선택하는 것을 특징으로 하는 문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치
3 3
제2항에 있어서,상기 어절 선택부는상기 (d) 과정에서 상기 기준 어절과 상기 나머지 어절들 각각에 대해 하기의 수학식 1의 연산에 따른 연산 값을 산출한 후 상기 기준 어절과 상기 나머지 어절들 중 상기 연산 값이 최소인 어절을 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 어느 하나의 어절로 선택하는 것을 특징으로 하는 문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치
4 4
사전 설정된 복수의 훈련 문장들 각각이 음성으로 발음되었을 때, 상기 복수의 훈련 문장들에 포함된 복수의 음소들 각각이 발음되는데 소요되는 평균 발음 소요 시간에 대한 측정값이 저장되어 있는 발음 소요 시간 정보 저장부를 유지하는 단계;상기 복수의 훈련 문장들 각각이 음성으로 발음되었을 때, 음성이 존재하지 않는 묵음 구간 간의 평균 간격 시간에 대한 측정값이 저장되어 있는 묵음 시간 정보 저장부를 유지하는 단계;상기 복수의 훈련 문장들에 포함된 복수의 어절들과, 상기 복수의 훈련 문장들 각각이 음성으로 발음되었을 때, 상기 복수의 어절들 각각이 발음된 직후에 묵음 구간이 등장한 비율에 대한 측정값이 서로 대응되어 저장되어 있는 비율 저장부를 유지하는 단계;사용자에 의해 제1 문장에 대한 텍스트 음성 변환(Text to Speech: TTS) 명령이 인가되면, 상기 제1 문장으로부터 상기 제1 문장을 구성하는 복수의 제1 음소들과 상기 제1 문장을 구성하는 복수의 제1 어절들을 추출하는 단계;상기 발음 소요 시간 정보 저장부를 참조하여 상기 복수의 제1 음소들 각각에 대응되는 평균 발음 소요 시간에 대한 측정값을 확인한 후 상기 복수의 제1 어절들 각각에 대해, 각 어절에 포함된 음소들의 평균 발음 소요 시간에 대한 측정값을 합산하여 합산 값을 생성함으로써, 상기 복수의 제1 어절들 각각에 대해서 생성된 합산 값을 상기 복수의 제1 어절들 각각에 대응되는 어절 발음 시간으로 지정하는 단계;상기 묵음 시간 정보 저장부를 참조하여 상기 평균 간격 시간에 대한 측정값을 확인하고, 상기 비율 저장부를 참조하여 상기 복수의 제1 어절들 각각에 대응되는 비율에 대한 측정값을 확인하며, 상기 복수의 제1 어절들 각각에 대응되는 어절 발음 시간을 기초로 상기 복수의 제1 어절들 간의 발음 지속 시간을 연산한 후 상기 평균 간격 시간과 상기 복수의 제1 어절들 각각에 대응되는 비율 및 상기 복수의 제1 어절들 간의 발음 지속 시간을 기초로 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 적어도 하나의 제2 어절을 선택하는 단계;상기 적어도 하나의 제2 어절이 선택되면, 상기 제1 문장에서 상기 적어도 하나의 제2 어절이 끝나는 지점에 사전 설정된 묵음 기호를 삽입하는 단계; 및사전 설정된 음성 합성 모델을 기초로 상기 제1 문장에 대한 합성 음성을 생성하되, 상기 제1 문장에서 상기 묵음 기호가 삽입된 지점에 대해 사전 설정된 묵음 시간만큼에 대응되는 묵음 구간이 포함된 상기 합성 음성을 생성하는 단계를 포함하는 문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치의 동작 방법
5 5
제4항에 있어서,상기 적어도 하나의 제2 어절을 선택하는 단계는하기의 (a) 내지 (e) 과정을 반복 수행함으로써, (d) 과정을 통해서 하나씩 선택되는 어절을 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 상기 적어도 하나의 제2 어절로 선택하는 것을 특징으로 하는 문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치의 동작 방법
6 6
제5항에 있어서,상기 적어도 하나의 제2 어절을 선택하는 단계는상기 (d) 과정에서 상기 기준 어절과 상기 나머지 어절들 각각에 대해 하기의 수학식 1의 연산에 따른 연산 값을 산출한 후 상기 기준 어절과 상기 나머지 어절들 중 상기 연산 값이 최소인 어절을 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 어느 하나의 어절로 선택하는 것을 특징으로 하는 문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치의 동작 방법
7 7
제4항 내지 제6항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램을 기록한 컴퓨터 판독 가능 기록 매체
8 8
제4항 내지 제6항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.