맞춤기술찾기

이전대상기술

타 언어권 화자 음성에 대한 음성 인식시스템의 성능향상을 위한 발음 특성에 기반한 음향모델 변환 방법 및이를 이용한 장치

  • 기술번호 : KST2015173994
  • 담당센터 : 광주기술혁신센터
  • 전화번호 : 062-360-4654
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 타 언어권 화자 음성에 대한 인식성능 향상을 위하여 음향모델 변환 기법의 제공에 있다. 음향모델을 적응시키기 위하여 먼저 타 언어권 화자 음성을 분석하여 변이 발음을 조사한다. 그 후 타 언어권 화자 음성의 변이 발음을 바탕으로 음향모델의 학습과정 중 상태공유단계에서 음향모델을 변환한다. 음향모델을 변환하는 본 발명과 기존의 음향모델 적응기법을 결합함으로써 보다 좋은 인식성능 향상을 얻을 수 있다. 본 발명은 타 언어권 화자 음성에 대한 인식성능 향상뿐 아니라, 원어민 화자 음성에 대한 인식성능의 저하를 줄이는 효과를 보인다.음성인식, 타 언어권 화자 음성 인식, 데이터 기반 발음 분석, 결정 트리, 음향모델 변환, 음향모델 적응, 상태 공유
Int. CL G10L 15/02 (2006.01) G10L 15/22 (2006.01) G10L 15/06 (2006.01) G10L 15/14 (2006.01)
CPC
출원번호/일자 1020060029321 (2006.03.31)
출원인 광주과학기술원
등록번호/일자 10-0815115-0000 (2008.03.13)
공개번호/일자 10-2007-0098094 (2007.10.05) 문서열기
공고번호/일자 (20080320) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2006.03.31)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 광주과학기술원 대한민국 광주광역시 북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김홍국 대한민국 경기도 수원시 영통구
2 오유리 대한민국 대구광역시 수성구
3 윤재삼 대한민국 경기도 광명시 광

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 황이남 대한민국 서울시 송파구 법원로 ***, ****호 (문정동, 대명벨리온지식산업센터)(아시아나국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 광주과학기술원 대한민국 광주광역시 북구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2006.03.31 수리 (Accepted) 1-1-2006-0226862-73
2 선행기술조사의뢰서
Request for Prior Art Search
2007.01.15 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2007.02.09 수리 (Accepted) 9-1-2007-0009343-08
4 의견제출통지서
Notification of reason for refusal
2007.05.09 발송처리완료 (Completion of Transmission) 9-5-2007-0252864-00
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2007.07.09 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2007-0499684-12
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2007.07.09 수리 (Accepted) 1-1-2007-0499685-57
7 의견제출통지서
Notification of reason for refusal
2007.09.21 발송처리완료 (Completion of Transmission) 9-5-2007-0517595-16
8 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2007.11.16 수리 (Accepted) 1-1-2007-0824561-30
9 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2007.11.16 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2007-0824557-57
10 등록결정서
Decision to grant
2008.02.29 발송처리완료 (Completion of Transmission) 9-5-2008-0116124-10
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.09.15 수리 (Accepted) 4-1-2011-5187089-85
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
타 언어권 화자 음성에 대한 발음 분석을 통하여 타 언어권 화자의 변이 발음을 조사하는 발음 변이 분석 단계; 및원어민 화자에 의한 학습용 음성데이터를 이용하여 단음 기반 음향모델을 생성한 후, 트라이폰기반 음향모델을 생성하는 단계;상기 생성된 트라이폰기반 음향모델을 타 언어권 화자에 대한 발음변이여부 존재에 따라 공유하는 단계; 및상기 공유된 트라이폰기반 음향모델의 혼합 밀도를 증가시키는 단계를 포함하는 음향모델 변환 기법
2 2
제 1항에 있어서, 상기 발음 변이 분석단계는원어민 화자 음성으로 학습된 음성인식시스템을 생성하는 단계;상기 음성인식시스템에 타 언어권 화자음성을 인식시킨 후 단음 오인식 행렬을 생성하는 단계; 및상기 단음 오인식 행렬을 분석하여 발음 변이를 얻는 단계를 포함하는 것을 특징으로 하는 음향모델 변환 기법
3 3
제 2항에 있어서, 원어민 화자 음성으로 학습된 상기 음성인식시스템을 생성하는 단계는원어민 화자에 의한 학습용 데이터를 이용하여 단음기반 음향모델을 생성하는 단계;트라이폰기반 음향모델로 확장한 후 원어민 화자에 의한 학습용 데이터로 음향모델을 학습시키는 단계;상태공유기법을 사용하여 트라이폰기반 음향모델의 수를 줄이는 단계; 및 상기 공유된 트라이폰기반 음향모델의 혼합 밀도를 증가시키는 단계를 포함하는 것을 특징으로 하는 음향모델 변환 기법
4 4
제 3항에 있어서, 상기 트라이폰기반 음향모델로 확장한 후 원어민 화자에 의한 학습용 데이터로 음향모델을 학습시키는 단계는트라이폰(a-b+c)의 중심 단음(b)와 같은 모든 트라이폰기반 음향모델들이 결정트리의 부모노드에 위치하는 단계;상기 부모노드에 놓인 트라이폰기반 음향모델들이 결정질문을 통하여 각각 해당하는 종말단 노드에 위치하는 단계; 및상기 종말단 노드에 위치한 트라이폰기반 음향모델들이 하나의 대표음향모델로 공유되는 단계를 포함하는 것을 특징으로 하는 음향모델 변환 기법
5 5
제 2항에 있어서, 상기 단음 오인식 행렬은 열 목차는 인식되어야 할 발음이고, 행 목차는 타언어권 화자 음성에 의한 인식된 발음인 것을 특징으로 하는 음향모델 변환 기법
6 6
제 2항에 있어서, 상기 단음 오인식 행렬을 분석하여 발음 변이를 얻는 방법은 상기 오인식 행렬의 요소들 중 큰 값을 가지는 요소를 취하는 것을 특징으로 하는 음향모델 변환 기법
7 7
삭제
8 8
제 1항에 있어서,상기 타 언어권 화자에 의한 발음 변이가 존재하지 않는 경우에는 상기 원어민 화자 음성으로 학습된 음성인식시스템을 생성하는 단계에서 사용한 상태공유과정을 이용하는 것을 특징으로 하는 음향모델 변환 기법
9 9
제 1항에 있어서,상기 타 언어권 화자에 의한 발음 변이가 존재하는 경우에는 상태 공유시키려는 단음을 중심 단음(b)으로 가지는 모든 트라이폰기반 음향모델들뿐만 아니라, 상태 공유시키려는 단음에 대한 타 언어권 화자에 의한 변이 발음(b')을 중심 단음(b')으로 가지는 모든 트라이폰기반 음향모델들을 부모노드에 위치시키는 단계; 및상기 부모노드에 놓인 트라이폰기반 음향모델들은 결정질문을 통하여 각각 해당하는 종말단 노드에 놓이고, 하나의 대표 음향모델로 공유되는 단계를 포함하는 것을 특징으로 하는 음향모델 변환 기법
10 10
삭제
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US08515753 US 미국 FAMILY
2 US20090119105 US 미국 FAMILY
3 WO2007114605 WO 세계지적재산권기구(WIPO) FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2009119105 US 미국 DOCDBFAMILY
2 US8515753 US 미국 DOCDBFAMILY
3 WO2007114605 WO 세계지적재산권기구(WIPO) DOCDBFAMILY
국가 R&D 정보가 없습니다.