맞춤기술찾기

이전대상기술

한국어텍스트/음성변환방법

  • 기술번호 : KST2015096493
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 한국어 텍스트/ 음성 변환 방법에 관한 것으로, 규칙을 이용한 언어 처리 모듈, 운율 처리 모듈을 통하여 합성음의 자연성을 높이고, 합성음 생성 모듈에서는 TD-PSOLA 합성기를 이용하여 합성음의 명료도를 높인 한국어 텍스트/ 음성 변환 방법을 제공하기 위하여, 한국어의 음운 구조 형태와 음소 연결의 제약을 분석하여 합성단위를 분류하는 제 1 단계; 음소 단위로 합성단위를 쉽게 억세스하고, 음소의 지속 시간 변경 및 피치 제어를 실시간에 처리하기 위한 구조로 합성단위 데이타베이스를 작성하는 제 2 단계; 상기 합성단위 데이타베이스에서 음절의 각 세그먼트에 필요한 데이타를 음소, 반음절 형태소로 가져오는 제 3 단계; 및 텍스트 문장에 대하여 전처리를 수행한 후에 어절 분석을 하고 파싱 과정을 수행한 다음에 글자/음운 변환을 수행하고, 문장 구조에 따라 적합한 운율 규칙을 적용하고, 발음 기호와 운율 정보를 합성단위 DB에서 검색하여 합성단위들을 제 4 단계를 포함하여 합성음의 자연성의 유창성의 향상을 높이고, 구현이 용이하고 합성음의 명료도를 크게 향상시킬 수 있는 효과가 있다.
Int. CL G06F 17/20 (2006.01) G10L 13/00 (2006.01)
CPC G10L 13/08(2013.01) G10L 13/08(2013.01)
출원번호/일자 1019950014828 (1995.06.05)
출원인 한국전자통신연구원, 주식회사 케이티
등록번호/일자 10-0146549-0000 (1998.05.12)
공개번호/일자 10-1997-0002706 (1997.01.28) 문서열기
공고번호/일자 (19980915) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 발송처리완료
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (1995.06.05)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
2 주식회사 케이티 대한민국 경기도 성남시 분당구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이정철 대한민국 대전시중구
2 최운천 대한민국 대전시유성구
3 김상훈 대한민국 대전시유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 신성특허법인(유한) 대한민국 서울특별시 송파구 중대로 ***, ID타워 ***호 (가락동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전시유성구
2 주식회사 케이티 대한민국 경기도 성남시 분당구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
1995.06.05 수리 (Accepted) 1-1-1995-0064285-89
2 대리인선임신고서
Notification of assignment of agent
1995.06.05 수리 (Accepted) 1-1-1995-0064286-24
3 출원심사청구서
Request for Examination
1995.06.05 수리 (Accepted) 1-1-1995-0064287-70
4 출원인정보변경 (경정)신고서
Notification of change of applicant's information
1997.04.08 수리 (Accepted) 1-1-1995-0064288-15
5 대리인사임신고서
Notification of resignation of agent
1997.09.08 수리 (Accepted) 1-1-1995-0064289-61
6 등록사정서
Decision to grant
1998.03.24 발송처리완료 (Completion of Transmission) 1-5-1995-0033115-14
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
1999.01.20 수리 (Accepted) 4-1-1999-0010652-29
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2000.01.14 수리 (Accepted) 4-1-2000-0005008-66
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2001.04.19 수리 (Accepted) 4-1-2001-0046046-20
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2002.04.09 수리 (Accepted) 4-1-2002-0032774-13
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2002.08.08 수리 (Accepted) 4-1-2002-0065009-76
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.03.13 수리 (Accepted) 4-1-2009-5047686-24
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
14 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.04.19 수리 (Accepted) 4-1-2010-5068437-23
15 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.01.10 수리 (Accepted) 4-1-2012-5005621-98
16 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.03.21 수리 (Accepted) 4-1-2012-5058926-38
17 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.06.08 수리 (Accepted) 4-1-2012-5122434-12
18 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.07.31 수리 (Accepted) 4-1-2013-5106568-91
19 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.02.11 수리 (Accepted) 4-1-2014-5018159-78
20 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1

한국어 문자를 입력받는 문자 입력 수단(11); 상기 문자 입력 수단(11)으로 부터 한국어 문자를 입력받아 실장된 본 발명의 알고리즘에 따라 각 구성 요소를 제어하는 중앙 제어 수단(12); 합성 알고리즘에 사용되느 CDU 합성단위 DB로서 기억 장치에 저장되어 있으며, 상기 중앙 처리 수단(12)으로 필요한 데이타를 전송하는 합성단위 데이타베이스(13); 및 합성이 끝난 디지탈 데이타를 아날로그 신호로 변환하여 외부로 출력하는 디지탈/아날로그 변환 수단(14)을 구비하는 장치에 적용되는 방법에 있어서, 한국어의 음운 구조 형태와 음소 연결의 제약을 분석하여 합성단위를 분류하는 제 1 단계; 음소 단위로 합성단위를 쉽게 억세스(access)하고, 음소의 지속 시간 변경 및 피치(pitch)제어를 실시간에 처리하기 위한 구조로 합성단위 데이타베이스를 작성하는 제 2 단계; 상기 합성단위 데이타베이스에서 음절의 각 세그먼트에 필요한 데이타베이스를 음소, 반음절 형태소로 가져오는 제 3 단계; 및 언어 처리 모듈에서는 입력된 텍스트 문장에 대하여 전처리를 수행한 후에 어절 분석을 하고 파싱 과정을 수행한 다음에 글자/음운 변환을 수행하고, 운율 처리 모듈에서는 상기 언어 처리 모듈의 처리 결과를 받아서 문장 구조에 따라 적합한 운율 규칙을 적용하고, 합성음 생성 모듈에서는 상기 언어 처리 모듈과 운율 처리 모듈의 처리 결과를 받아서 발음 기호와 운율 정보를 합성 단위 DB에서 검색하여 합성단위들을 합성하는 제 4 단계(41 내지 48)를 포함하는 것을 특징으로 하는 한국어 텍스트/ 음성 변환 방법

2 2

제 1 항에 있어서, 상기 제 1 단계에서 분류 합성단위는, 1204개인 것을 특징으로 하는 한국어 텍스트/ 음성 변환 방법

3 3

제 1 항에 있어서, 상기 제 2 단계의 합성단위 데이타베이스(DB)는, 합성단위의 PCM(Pulse Code Modulation) 데이타를 순서대로 저장하고 있는 음성 데이타 화일(23); 상기 음성 데이타 화일(23)에 저장된 음성 신호인 피치 마크(pitch mark)들의 위치와 각 피치값을 샘플수의 형태로 저장하고 있는 피치 마크 화일(22); 및 각각의 합성단위에 대하여 합성단위 번호, 상기 음성 데이타 화일(23) 내에서의 시작점/끝점, 세그먼트 개수, 각 세그먼트의 상기 피치 마크 화일(22) 내에서의 시작점, 피치 마크 개수 정보를 저장하고 있는 합성단위 주소 데이타화일(21)을 구비하는 것을 특징으로 하는 한국어 텍스트/ 음성 변환 방법

4 4

제 1 항에 있어서, 상기 제 3 단계는, 각 음절을 초성 C1, 모음 전반부 V1, 모음 후반부 V2, 종성 C2, C3의 5개의 단위로 분리하여 각각에 적합한 데이타를 합성단위 DB로부터 음소, 반음절 형태소로 가져오는 것을 특징으로 하는 한국어 텍스트/ 음성 변환 방법

5 5

제 4 항에 있어서, 합성단위 DB 내에서의 데이타 선정은, 선행 음절의 모음 Vp, 종성 Cp, 대상 음절의 초성 C1, 모음 V, 종성 C2, 후속 음절의 초성 Cn, 모음 Vn의 조건, 즉, C1 유형이면 어절의 첫음절일때는 C1 = CV이고, Cp = C1 = 'ㄹ' 일때는 C1 = e1LV이고, 기타는 C1 = eCV이며 , V1 유형이면 초성이 있을때는 V1 = C1이고 ,모음으로 시작되는 어절의 첫음절일때는 단음절이거나 받침없는 이중모음은 V1 = V, 이중모음에 종성이 'ㅇ'일 때는 V1 = V, 기타는 V1 = -1(다음과정에서 결정)이고, 선행 음절에 종성이 있을 때는 V1= eCV이고, 선행 음절이 단모음으로 끝날 때는 V1 = VV이고, 선행 음절이 'j' 계열 모음으로 끝날때는 V1 = ejV이고 , 선행 음절이 'w' 계열 모음으로 끝날때는 V1 = ewV이며, V2 유형이면 종성이 없고 어절의 끝일 때는 V2 = V1이고 , 종성이 없고 후속 음절에 초성이 있을때는 V2 = VCe이고, 종성이 없고 후속 음절이 단모음일 때는 V2 = VV이고, 종성이 없고 후속 음절이 'j' 계열모음일 때는 V2 =Vje이고, 종성이 없고 후속 음절이 'w' 계열모음일때는 V2 = Vwe이며, 종성이 있고, 어절의 끝일 때는 V2 = VC이고, 종성이 있고 폐쇄받침일 때는 V2=VC이고, 종성이 있고, Cp =ㄹ, C1 =ㄹ일때는 V2 = VL1e이고, 종성이 있고 후속 음절이 모음으로 시작할때는 V2 : VCe이고, 종성이 있고 유성 종성과 후속 음절의 초성이 있을때는 V2 = VCDa이며, C2 유형이면 종성이 있을때는 C2 = V2이며, C3 유형이면 유성 종성과 후속 음절의 초성이 있을때는 C3 =aCCw이며, 최종적으로 V1 =-1일때는 V1 = V2가 되도록 구성한 것을 특징으로 하는 한국어 텍스트/ 음성 변환 방법

6 6

제 1 항에 있어서, 상기 제 4 단계(41 내지 48)는, 언어 처리 모듈에서는 먼저 입력된 텍스트 문장을 약어, 문장 기호, 특정 용어에 대해 한국어로 해석하는 전처리 과정을 수행한 후에 어휘 사전에 그룹으로 분류, 등록된 한국어의 조사, 활용형 어미, 부사, 접속사 등을 이용하여 입력 문장의 각 어절에 문법적 기능을 추정, 할당하는 어절 분석을 한 다음에 한국어 문법을 이용하여 입력 문장의 구문 구조를 추정하는 파싱 과정을 수행하고 예외 발음 사전을 검색하여 등록된 단어는 상기 예외 발음 사전에 따라 처리하고 상기 예외 발음 사전에 등록되지 않은 단어 사전 검색과 한국어 발음 규칙에 따라 입력 문장을 소리나는 대로 바꾸는 글자/음운 변환 과정을 수행하는 제 5 단계(41 내지 45); 운율 처리 모듈에서는 언어 처리 모듈의 처리 결과를 받아서 문장 구조에 따라 적합한 운율 규칙을 적용함으로써 합성음의 빠르기, 억양, 뛰어 읽기 등의 자연성 및 유창함과 관계된 정보를 생성하는 제 6 단계(46); 및 합성음 생성 모듈에서는 위의 처리 과정을 거쳐 구한 발음 기호와 운율 정보를 합성단위 DB에서 검색하여 합성 단위들을 TD-PSOLA 방식으로 조절, 가공 및 결합하여 합성음을 생성하여 사용자에게 음성으로 출력하는 제 7 단계(47,48)를 포함하는 것을 특징으로 하는 한국어 텍스트/ 음성 변환 방법

7 7

제 6 항에 있어서, 상기 제 6 단계(46)는, 지속 시간을 어절의 지속 시간, 음절의 지속 시간, 음소의 지속시간 순서로 계산하는 제 8 단계(61 내지 63); 및 문형에 따른 피치의 기본 패턴 구문 구조와 관련된 변화 정도(완만/ 급격), 변화의 시작점과 영향이 미치는 영역 분석, 기능적 분류 및 분석에 따라 피치 제어 규칙을 작성하는 제 9 단계(64,65,66)를 포함하는 것을 특징으로 하는 한국어 텍스트/ 음성 변환 방법

8 8

제 7 항에 있어서, 상기 제 8 단계(61 내지 63)는, 어절의 지속 시간 WDdur을 구한 후에 어절내 각 음절의 지속 시간 SYLdur을 구하는 제 10 단계(71,72); 문장, 절, 구 경계점 이전 음절의 지속 시간 신축을 조절한 후에 각 음절의 초기 신축률 PRCNTO을 구하는 제 11 단계(73,74); 및 각 음소에 대하여 해당하는 규칙을 순차적으로 적용하고, 각 규칙에 할당된 지속 시간 변화율 PRcnti를 이용하여 음운 환경에 따른 음소 지속 시간의 신축률 PRCNT를 구한 후에 음소의 지속 시간 변화율과 그 음소의 고유 지속 시간 INHdur, 최소 지속 시간 MINdur을 이용하여 음소의 지속시간 PHONdur을 계산하는 제 12 단계(75,76)를 포함하는 것을 특징으로 하는 한국어 텍스트/ 음성 변환 방법

지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.