맞춤기술찾기

이전대상기술

잡음 환경에 강인한 화자 인식을 위한 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 방법 및 장치

  • 기술번호 : KST2020014445
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 잡음 환경에 강인한 화자 인식을 위한 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 방법 및 장치가 제시된다. 일 실시예에 따른 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 방법은, 심화 신경망 기반의 특징 강화 모델을 학습하는 단계; 심화 신경망 기반의 화자 특징벡터 추출 모델을 학습하는 단계; 상기 특징 강화 모델의 출력 레이어와 상기 화자 특징벡터 추출 모델의 입력 레이어를 서로 연결하는 단계; 및 연결된 상기 특징 강화 모델 및 상기 화자 특징벡터 추출 모델을 하나의 모델로 간주하고 추가로 학습하는 결합 학습을 진행하는 단계를 포함하여 이루어질 수 있다.
Int. CL G10L 17/02 (2013.01.01) G10L 17/04 (2013.01.01) G10L 15/20 (2006.01.01) G10L 17/18 (2013.01.01)
CPC G10L 17/02(2013.01) G10L 17/02(2013.01) G10L 17/02(2013.01) G10L 17/02(2013.01)
출원번호/일자 1020190037685 (2019.04.01)
출원인 한양대학교 산학협력단
등록번호/일자
공개번호/일자 10-2020-0116225 (2020.10.12) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2019.04.01)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 대한민국 서울특별시 성동구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 장준혁 서울특별시 강남구
2 양준영 서울특별시 성동구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2019.04.01 수리 (Accepted) 1-1-2019-0330296-52
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.05 수리 (Accepted) 4-1-2019-5155816-75
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.06 수리 (Accepted) 4-1-2019-5156285-09
4 선행기술조사의뢰서
Request for Prior Art Search
2019.10.02 수리 (Accepted) 9-1-9999-9999999-89
5 선행기술조사보고서
Report of Prior Art Search
2019.12.04 발송처리완료 (Completion of Transmission) 9-6-2020-0064620-74
6 의견제출통지서
Notification of reason for refusal
2020.05.26 발송처리완료 (Completion of Transmission) 9-5-2020-0360846-72
7 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2020.07.06 수리 (Accepted) 1-1-2020-0699354-24
8 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2020.07.06 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2020-0699355-70
9 최후의견제출통지서
Notification of reason for final refusal
2020.11.18 발송처리완료 (Completion of Transmission) 9-5-2020-0801265-22
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
심화 신경망 기반의 특징 강화 모델을 학습하는 단계; 심화 신경망 기반의 화자 특징벡터 추출 모델을 학습하는 단계; 상기 특징 강화 모델의 출력 레이어와 상기 화자 특징벡터 추출 모델의 입력 레이어를 서로 연결하는 단계; 및 연결된 상기 특징 강화 모델 및 상기 화자 특징벡터 추출 모델을 하나의 모델로 간주하고 추가로 학습하는 결합 학습을 진행하는 단계를 포함하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 방법
2 2
제1항에 있어서,상기 심화 신경망 기반의 특징 강화 모델을 학습하는 단계는, 열화된 음성 데이터와 깨끗한 음성 데이터로부터 음향 특징(acoustic feature)을 추출하는 단계; 상기 음향 특징들을 상기 특징 강화 모델의 입력에 사용하는 단계; 및 상기 특징 강화 모델을 통과시켜 출력되는 강화된 음향 특징들이 기 준비된 깨끗한 음향 특징들과 유사한 값을 보이도록 평균 제곱 오차(Mean Squared Error, MSE)를 최소화하는 방향으로 제1 손실 함수를 이용하여 학습하는 단계를 포함하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 방법
3 3
제1항에 있어서,상기 심화 신경망 기반의 화자 특징벡터 추출 모델을 학습하는 단계는, 학습 데이터셋 전체를 학습한 상기 특징 강화 모델을 통과시켜 강화된 음향 특징들을 생성하는 단계; 상기 강화된 음향 특징들을 상기 화자 특징벡터 추출 모델의 입력에 사용하는 단계; 및 상기 화자 특징벡터 추출 모델을 통과시켜 임의의 길이를 갖는 발화에서 추출한 음향 특징 열로부터 발화자를 분류하도록 제2 손실 함수를 이용하여 학습하는 단계를 포함하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 방법
4 4
제1항에 있어서,상기 심화 신경망 기반의 화자 특징벡터 추출 모델을 학습하는 단계는, 상기 심화 신경망 기반의 화자 특징벡터 추출 모델로 x-벡터 모델을 사용하여 학습하는 것을 특징으로 하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 방법
5 5
제4항에 있어서,상기 심화 신경망 기반의 화자 특징벡터 추출 모델을 학습하는 단계는, 상기 x-벡터 모델은 시간 순서대로 나열된 프레임 단위의 음향 특징 열에 대해 5 개의 시간-지연 신경망(Time-Delay Neural Network, TDNN) 레이어를 사용하여 비선형 연산을 통해 발화자와 관련된 정보를 추출하는 단계; 통계적 특징 추출 레이어에서 상기 음향 특징 열에 대해 시간 축으로 평균과 표준편차를 계산하여 이어 붙여 임의의 길이를 갖는 발화로부터 고정된 길이의 벡터를 추출하는 단계; 및 계산된 상기 평균과 표준편차 벡터는 2 개의 은닉 레이어를 추가로 거친 뒤, 출력 레이어에서 학습 데이터셋 내의 발화자를 분류하도록 크로스-엔트로피(cross-entropy) 제2 손실 함수를 이용하여 학습하는 단계를 포함하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 방법
6 6
제5항에 있어서,상기 심화 신경망 기반의 화자 특징벡터 추출 모델을 학습하는 단계는, 학습을 끝마치고 난 후, 상기 통계적 특징 추출 레이어 바로 다음에 위치해 있는 상기 은닉 레이어의 활성함수를 거치기 전 출력값을 화자 특징벡터인 x-벡터로 사용하는 것을 특징으로 하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 방법
7 7
제1항에 있어서, 상기 특징 강화 모델 및 상기 화자 특징벡터 추출 모델을 하나의 모델로 간주하고 추가로 학습하는 결합 학습을 진행하는 단계는, 서로 다른 손실 함수를 사용하여 학습된 개별 상기 특징 강화 모델 및 상기 화자 특징벡터 추출 모델을 하나로 연결한 다음, 하나의 손실 함수로 연결된 두 개의 상기 특징 강화 모델 및 상기 화자 특징벡터 추출 모델을 결합 학습을 통해 전체적으로 최적화하는 것을 특징으로 하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 방법
8 8
제5항에 있어서, 상기 특징 강화 모델 및 상기 화자 특징벡터 추출 모델을 하나의 모델로 간주하고 추가로 학습하는 결합 학습을 진행하는 단계는, 발화자의 사후확률이 높아지도록 학습하기 위해 상기 화자 특징벡터 추출 모델의 발화자 인덱스에 해당되는 출력값으로부터 특정 상수값에 해당하는 마진을 차감하는 방식으로 상기 제2 손실 함수를 변형시켜 결합 학습하는 것을 특징으로 하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 방법
9 9
심화 신경망 기반의 특징 강화 모델을 학습하는 특징 강화 모델 학습부; 심화 신경망 기반의 화자 특징벡터 추출 모델을 학습하는 화자 특징벡터 추출 모델 학습부; 상기 특징 강화 모델의 출력 레이어와 상기 화자 특징벡터 추출 모델의 입력 레이어를 서로 연결하는 결합 모델링부; 및 연결된 상기 특징 강화 모델 및 상기 화자 특징벡터 추출 모델을 하나의 모델로 간주하고 추가로 학습하는 결합 학습을 진행하는 결합 학습부를 포함하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 장치
10 10
제9항에 있어서,상기 특징 강화 모델 학습부는, 열화된 음성 데이터와 깨끗한 음성 데이터로부터 음향 특징(acoustic feature)을 추출하고, 상기 음향 특징들을 상기 특징 강화 모델의 입력에 사용하며, 상기 특징 강화 모델을 통과시켜 출력되는 강화된 음향 특징들이 기 준비된 깨끗한 음향 특징들과 유사한 값을 보이도록 평균 제곱 오차(Mean Squared Error, MSE)를 최소화하는 방향으로 제1 손실 함수를 이용하여 학습하는 것을 특징으로 하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 장치
11 11
제9항에 있어서,상기 화자 특징벡터 추출 모델 학습부는, 학습 데이터셋 전체를 학습한 상기 특징 강화 모델을 통과시켜 강화된 음향 특징들을 생성하고, 상기 강화된 음향 특징들을 상기 화자 특징벡터 추출 모델의 입력에 사용하며, 상기 화자 특징벡터 추출 모델을 통과시켜 임의의 길이를 갖는 발화에서 추출한 음향 특징 열로부터 발화자를 분류하도록 제2 손실 함수를 이용하여 학습하는 것을 특징으로 하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 장치
12 12
제9항에 있어서,상기 화자 특징벡터 추출 모델 학습부는, 상기 심화 신경망 기반의 화자 특징벡터 추출 모델로 x-벡터 모델을 사용하여 학습하며, 상기 x-벡터 모델은 시간 순서대로 나열된 프레임 단위의 음향 특징 열에 대해 5 개의 시간-지연 신경망(Time-Delay Neural Network, TDNN) 레이어를 사용하여 비선형 연산을 통해 발화자와 관련된 정보를 추출하고, 통계적 특징 추출 레이어에서 상기 음향 특징 열에 대해 시간 축으로 평균과 표준편차를 계산하여 이어 붙여 임의의 길이를 갖는 발화로부터 고정된 길이의 벡터를 추출하며, 계산된 상기 평균과 표준편차 벡터는 2 개의 은닉 레이어를 추가로 거친 뒤, 출력 레이어에서 학습 데이터셋 내의 발화자를 분류하도록 크로스-엔트로피(cross-entropy) 제2 손실 함수를 이용하여 학습하는 것을 특징으로 하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 장치
13 13
제12항에 있어서,상기 화자 특징벡터 추출 모델 학습부는, 학습을 끝마치고 난 후, 상기 통계적 특징 추출 레이어 바로 다음에 위치해 있는 상기 은닉 레이어의 활성함수를 거치기 전 출력값을 화자 특징벡터인 x-벡터로 사용하는 것을 특징으로 하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 장치
14 14
제9항에 있어서, 상기 결합 학습부는, 서로 다른 손실 함수를 사용하여 학습된 개별 상기 특징 강화 모델 및 상기 화자 특징벡터 추출 모델을 하나로 연결한 다음, 하나의 손실 함수로 연결된 두 개의 상기 특징 강화 모델 및 상기 화자 특징벡터 추출 모델을 결합 학습을 통해 전체적으로 최적화하는 것을 특징으로 하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 장치
15 15
제12항에 있어서, 상기 결합 학습부는, 발화자의 사후확률이 높아지도록 학습하기 위해 상기 화자 특징벡터 추출 모델의 발화자 인덱스에 해당되는 출력값으로부터 특정 상수값에 해당하는 마진을 차감하는 방식으로 상기 제2 손실 함수를 변형시켜 결합 학습하는 것을 특징으로 하는, 심화 신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한양대학교 산학협력단 정보통신산업진흥원 부설 정보통신기술진흥센터 / 정보통신방송 연구개발사업 / 방송통신산업기술개발사업(이지바로) AI스피커 음성비서를 위한 지능형 음성신호처리 기술개발