맞춤기술찾기

이전대상기술

화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 방법 및 시스템

  • 기술번호 : KST2019011849
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 방법에 관한 것으로서, 보다 구체적으로는, (1) 복수 개의 음성 파일들로 구성된 학습 데이터를 사용하여 서로 다른 2 이상의 화자 각각에 대하여 종속적인 가우시안 혼합 모델(Gaussian mixture model, GMM)을 학습하고, 상기 학습 데이터를 사용하여 I-벡터 추출기를 학습하는 단계; (2) 상기 단계 (1)에서 학습된 화자 종속적 가우시안 혼합 모델들을 이용하여 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 계산하는 단계; 및 (3) 상기 단계 (2)에서 계산된 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 상기 단계 (1)에서 학습된 I-벡터 추출기에 가중치로 적용하여 화자 정보가 부각된 강인한 I-벡터를 추출하는 단계를 포함하는 것을 그 구성상의 특징으로 한다.또한, 본 발명은 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 시스템에 관한 것으로서, 보다 구체적으로는, 복수 개의 음성 파일들로 구성된 학습 데이터를 사용하여 서로 다른 2 이상의 화자 각각에 대하여 종속적인 가우시안 혼합 모델(Gaussian mixture model, GMM)을 학습하고, 상기 학습 데이터를 사용하여 I-벡터 추출기를 학습하는 학습부; 상기 학습부에서 학습된 화자 종속적 가우시안 혼합 모델들을 이용하여 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 계산하는 계산부; 및 상기 계산부에서 계산된 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 상기 학습부에서 학습된 I-벡터 추출기에 가중치로 적용하여 화자 정보가 부각된 강인한 I-벡터를 추출하는 화자 정보 부각 I-벡터 추출부를 포함하는 것을 그 구성상의 특징으로 한다.본 발명에서 제안하고 있는 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 방법 및 시스템에 따르면, 각 가우시안 성분에 대한 화자와 학습 데이터 프레임들의 평균 화자 상호 정보량을 계산한 후 계산된 평균 화자 상호 정보량을 모든 프레임 및 전체 화자에 대하여 평균을 취하여 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 계산하고, 이를 가중치로서, I-벡터 추출기의 블락(block) 행렬에 곱하는 방식으로 적용시킴으로써, I-벡터 추출기를 통해 추출되는 I-벡터에 화자에 대한 정보가 많은 가우시안 성분의 영향이 부각될 수 있도록 하여, 보다 높은 성능을 갖는 특징 벡터인 강인한 I-벡터를 추출할 수 있다.또한, 본 발명에 따르면, I-벡터 추출기에 가중치를 적용하여 I-벡터의 화자 관련 정보를 부각시킴으로써, 화자 이외의 잡음, 마이크 상태 등의 요소로 인한 변이성에 강인한 특징을 추출할 수 있어, 입력된 음성 길이가 짧거나 잡음이 많은 환경에서도 화자의 특징을 효과적으로 추출하여 화자 인식의 성능을 높일 수 있다.
Int. CL G10L 17/02 (2013.01.01)
CPC G10L 17/02(2013.01) G10L 17/02(2013.01) G10L 17/02(2013.01) G10L 17/02(2013.01)
출원번호/일자 1020160123219 (2016.09.26)
출원인 서울대학교산학협력단
등록번호/일자 10-1843079-0000 (2018.03.22)
공개번호/일자
공고번호/일자 (20180514) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2016.09.26)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김남수 대한민국 서울특별시 서초구
2 강우현 대한민국 서울특별시 강남구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김건우 대한민국 서울특별시 금천구 가산디지털*로 ***, 에이동 ***호 특허그룹덕원 (가산동, 우림 라이온스밸리)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 서울특별시 관악구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.09.26 수리 (Accepted) 1-1-2016-0930669-82
2 의견제출통지서
Notification of reason for refusal
2017.08.21 발송처리완료 (Completion of Transmission) 9-5-2017-0579203-11
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2017.10.18 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2017-1024884-09
4 등록결정서
Decision to grant
2018.02.19 발송처리완료 (Completion of Transmission) 9-5-2018-0119113-89
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.05.13 수리 (Accepted) 4-1-2019-5093546-10
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.05.23 수리 (Accepted) 4-1-2019-5101798-31
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.02 수리 (Accepted) 4-1-2019-5154561-59
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.11.25 수리 (Accepted) 4-1-2020-5265458-48
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 방법으로서,(1) 복수 개의 음성 파일들로 구성된 학습 데이터를 사용하여 서로 다른 2 이상의 화자 각각에 대하여 종속적인 가우시안 혼합 모델(Gaussian mixture model, GMM)을 학습하고, 상기 학습 데이터를 사용하여 I-벡터 추출기를 학습하는 단계;(2) 상기 단계 (1)에서 학습된 화자 종속적 가우시안 혼합 모델들을 이용하여 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 계산하는 단계; 및(3) 상기 단계 (2)에서 계산된 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 상기 단계 (1)에서 학습된 I-벡터 추출기에 가중치로 적용하여 화자 정보가 부각된 강인한 I-벡터를 추출하는 단계를 포함하되,상기 단계 (1)에서는,상기 I-벡터 추출기를 학습하여 상기 I-벡터 추출기의 블락(block) 행렬을 도출하는 것을 특징으로 하는, 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 방법
2 2
제1항에 있어서, 상기 단계 (1)은,상기 학습 데이터를 사용하여 화자 독립적 모델인 일반 배경 모델(Universal background model, UBM)을 학습하고, 상기 학습된 화자 독립적 일반 배경 모델을 기준으로 특정 화자 데이터로의 적응화를 통해 상기 특정 화자 각각에 대하여 종속적인 가우시안 혼합 모델을 도출하는 것을 특징으로 하는, 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 방법
3 3
삭제
4 4
제1항에 있어서, 상기 단계 (3)에서는,상기 단계 (2)에서 계산된 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 상기 단계 (1)에서 상기 I-벡터 추출기를 학습하여 도출된 상기 I-벡터 추출기의 블락(block) 행렬에 곱해주는 것을 특징으로 하는, 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 방법
5 5
제1항에 있어서, 상기 단계 (2)는,(2-1) 상기 단계 (1)에서 학습된 화자 종속적 가우시안 혼합 모델들을 이용하여 상기 서로 다른 2 이상의 화자 각각 및 상기 학습 데이터의 프레임별 평균 화자 상호 정보량(Normalized pointwise mutual information, NPMI)을 계산하는 단계; 및(2-2) 상기 단계 (2-1)에서 계산된 상기 평균 화자 상호 정보량(NPMI)을 상기 학습 데이터의 전체 프레임 및 전체 화자에 대하여 평균을 취해 상기 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 계산하는 단계를 포함하는 것을 특징으로 하는, 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 방법
6 6
제5항에 있어서, 상기 단계 (2-1)은,하기의 수학식을 통해 상기 서로 다른 2 이상의 화자 각각 및 상기 학습 데이터의 프레임별 평균 화자 상호 정보량(NPMI)을 계산하는 것을 특징으로 하는, 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 방법
7 7
제6항에 있어서, 상기 단계 (2-2)는,하기의 수학식을 통해 상기 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 계산하는 것을 특징으로 하는, 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 방법
8 8
화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 시스템으로서,복수 개의 음성 파일들로 구성된 학습 데이터를 사용하여 서로 다른 2 이상의 화자 각각에 대하여 종속적인 가우시안 혼합 모델(Gaussian mixture model, GMM)을 학습하고, 상기 학습 데이터를 사용하여 I-벡터 추출기를 학습하는 학습부(100);상기 학습부(100)에서 학습된 화자 종속적 가우시안 혼합 모델들을 이용하여 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 계산하는 계산부(200); 및상기 계산부(200)에서 계산된 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 상기 학습부(100)에서 학습된 I-벡터 추출기에 가중치로 적용하여 화자 정보가 부각된 강인한 I-벡터를 추출하는 화자 정보 부각 I-벡터 추출부(300)를 포함하되,상기 학습부(100)는,상기 I-벡터 추출기를 학습하여 상기 I-벡터 추출기의 블락(block) 행렬을 도출하는 것을 특징으로 하는, 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 시스템
9 9
제8항에 있어서, 상기 학습부(100)는,상기 학습 데이터를 사용하여 화자 독립적 모델인 일반 배경 모델(Universal background model, UBM)을 학습하고, 상기 학습된 화자 독립적 일반 배경 모델을 기준으로 특정 화자 데이터로의 적응화를 통해 상기 특정 화자 각각에 대하여 종속적인 가우시안 혼합 모델을 도출하는 것을 특징으로 하는, 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 시스템
10 10
삭제
11 11
제8항에 있어서, 상기 화자 정보 부각 I-벡터 추출부(300)는,상기 계산부(200)에서 계산된 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 상기 학습부(100)에서 상기 I-벡터 추출기를 학습하여 도출된 상기 I-벡터 추출기의 블락(block) 행렬에 곱해주는 것을 특징으로 하는, 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 시스템
12 12
제8항에 있어서, 상기 계산부(200)는,상기 학습부(100)에서 학습된 화자 종속적 가우시안 혼합 모델들을 이용하여 상기 서로 다른 2 이상의 화자 각각 및 상기 학습 데이터의 프레임별 평균 화자 상호 정보량(Normalized pointwise mutual information, NPMI)을 계산하는 NPMI 계산부(210); 및상기 NPMI 계산부(210)에서 계산된 상기 평균 화자 상호 정보량(NPMI)을 상기 학습 데이터의 전체 프레임 및 전체 화자에 대하여 평균을 취해 상기 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 계산하는 가중치 계산부(230)를 포함하는 것을 특징으로 하는, 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 시스템
13 13
제12항에 있어서, 상기 NPMI 계산부(210)는,하기의 수학식을 통해 상기 서로 다른 2 이상의 화자 각각 및 상기 학습 데이터의 프레임별 평균 화자 상호 정보량(NPMI)을 계산하는 것을 특징으로 하는, 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 시스템
14 14
제13항에 있어서, 상기 가중치 계산부(230)는,하기의 수학식을 통해 상기 각 가우시안 성분이 갖는 평균 화자 상호 정보량을 계산하는 것을 특징으로 하는, 화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조곽학부 서울대학교 산학협력단 기초연구사업/중견연구자지원사업 통합 사운드 씬 인지 기술