맞춤기술찾기

이전대상기술

선택적으로 원거리 발화를 보상하는 심층 신경망 기반 화자 특징 강화를 위한 장치 및 이를 위한 방법

  • 기술번호 : KST2022013988
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명의 원거리 발화를 선택적으로 보상하는 심층 신경망 기반 화자 특징 강화를 위한 장치는 화자 및 발화거리가 알려지지 않은 음성벡터가 입력되면, 상기 음성벡터의 잡음 또는 잔향의 양에 따라 0 내지 1 사이의 값을 가지는 거리반비례지수를 산출하는 잡음잔향검출망과, 상기 음성벡터 및 상기 거리반비례지수를 곱하여 거리반비례음성벡터를 출력하는 곱셈기와, 상기 음성벡터의 발화거리가 기 설정된 원거리에 근접할수록 기 설정된 근거리에서 입력된 음성 신호의 특징을 추출한 근거리음성벡터에 가까운 값을 가지며, 상기 음성벡터의 발화거리가 기 설정된 근거리에 근접할수록 0 벡터에 가까운 값을 가지는 모사근거리음성벡터를 도출하는 원거리보상망과, 상기 거리반비례음성벡터와 상기 모사근거리음성벡터를 더하여 보상음성벡터를 도출하는 덧셈기를 포함한다.
Int. CL G10L 17/18 (2013.01.01) G10L 21/0208 (2013.01.01) G10L 15/07 (2013.01.01)
CPC G10L 17/18(2013.01) G10L 21/0208(2013.01) G10L 15/07(2013.01) G10L 2021/02082(2013.01)
출원번호/일자 1020200040811 (2020.04.03)
출원인 서울시립대학교 산학협력단
등록번호/일자 10-2340359-0000 (2021.12.13)
공개번호/일자 10-2021-0123554 (2021.10.14) 문서열기
공고번호/일자 (20211215) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.04.03)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울시립대학교 산학협력단 대한민국 서울특별시 동대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 정지원 경기도 용인시 수지구
2 유하진 서울특별시 동대문구
3 김주호 서울특별시 동대문구
4 심혜진 서울특별시 동대문구
5 김승빈 서울특별시 동대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 천지 대한민국 서울특별시 강남구 논현로**길 **, *층(역삼동, 신한빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서울시립대학교 산학협력단 서울특별시 동대문구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.04.03 수리 (Accepted) 1-1-2020-0349323-55
2 선행기술조사의뢰서
Request for Prior Art Search
2021.04.16 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2021.06.17 발송처리완료 (Completion of Transmission) 9-6-2021-0112712-71
4 의견제출통지서
Notification of reason for refusal
2021.06.24 발송처리완료 (Completion of Transmission) 9-5-2021-0501861-11
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2021.08.18 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2021-0952377-22
6 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2021.08.18 수리 (Accepted) 1-1-2021-0952376-87
7 등록결정서
Decision to grant
2021.12.10 발송처리완료 (Completion of Transmission) 9-5-2021-0970515-06
8 특허고객번호 정보변경(경정)신고서·정정신고서
2022.01.25 수리 (Accepted) 4-1-2022-5020718-60
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
원거리 발화를 선택적으로 보상하는 심층 신경망 기반 화자 특징 강화를 위한 장치에 있어서, 화자 및 발화거리가 알려지지 않은 음성벡터가 입력되면, 상기 음성벡터의 잡음 또는 잔향의 양에 따라 0 내지 1 사이의 값을 가지는 거리반비례지수를 산출하는 잡음잔향검출망; 상기 음성벡터 및 상기 거리반비례지수를 곱하여 거리반비례음성벡터를 출력하는 곱셈기; 상기 음성벡터의 발화거리가 기 설정된 원거리에 근접할수록 기 설정된 근거리에서 입력된 음성 신호의 특징을 추출한 근거리음성벡터에 가까운 값을 가지며, 상기 음성벡터의 발화거리가 기 설정된 근거리에 근접할수록 0 벡터에 가까운 값을 가지는 모사근거리음성벡터를 도출하는 원거리보상망; 상기 거리반비례음성벡터와 상기 모사근거리음성벡터를 더하여 보상음성벡터를 도출하는 덧셈기; 및 상기 도출된 보상음성벡터에 대한 가중치가 적용되는 복수의 연산을 통해 상기 화자의 특징을 나타내는 화자특징벡터를 도출하는 화자특징층; 을 포함하는 것을 특징으로 하는 화자 특징 강화를 위한 장치
2 2
제1항에 있어서, 상기 잡음잔향검출망은 상기 입력된 음성벡터의 잡음 또는 잔향의 양이 많을수록 0에 가까운 값을 가지며 상기 입력된 음성벡터의 잡음 또는 잔향의 양이 적을수록 1에 가까운 값을 가지는 거리반비례지수를 산출하는 것을 특징으로 하는 화자 특징 강화를 위한 장치
3 3
제1항에 있어서, 상기 보상음성벡터는 상기 입력된 음성벡터의 발화거리가 기 설정된 원거리에 근접할수록 기 설정된 근거리에서 입력된 음성 신호의 특징을 추출한 근거리음성벡터에 가까운 값을 가지며, 상기 입력된 음성벡터의 발화거리가 기 설정된 근거리에 근접할수록 상기 입력된 음성벡터와 동일한 값을 가지는 것을 특징으로 하는 화자 특징 강화를 위한 장치
4 4
원거리 발화를 선택적으로 보상하는 심층 신경망 기반 화자 특징 강화를 위한 장치에 있어서, 화자 및 발화거리가 알려진 학습용 음성벡터에 대해 복수의 계층의 가중치가 적용되는 복수의 연산을 수행하여 상기 학습용 음성벡터의 발화거리가 기 설정된 원거리에 근접할수록 기 설정된 근거리에서 입력된 음성 신호의 특징을 추출한 근거리음성벡터에 가까운 값을 가지며, 상기 입력된 음성벡터의 발화거리가 기 설정된 근거리에 근접할수록 상기 입력된 학습용 음성벡터와 동일한 값을 가지는 보상음성벡터를 산출하고, 산출된 보상음성벡터로부터 화자의 특징을 추출한 화자특징벡터를 산출하고, 산출된 화자특징벡터로부터 상기 학습용 음성벡터의 화자가 기 설정된 화자일 확률을 나타내는 화자인식벡터를 도출하는 심층신경망; 및 상기 학습용 음성벡터의 화자가 기 설정된 근거리에서 발화한 음성의 특징을 추출한 근거리음성벡터와 상기 화자특징벡터와의 평균 제곱 오차 및 상기 화자를 나타내는 화자 레이블과 상기 화자인식벡터와의 교차엔트로피 오차가 최소가 되도록 상기 심층신경망의 가중치를 최적화하는 학습부;를 포함하는 것을 특징으로 하는 화자 특징 강화를 위한 장치
5 5
제4항에 있어서, 상기 심층신경망은 상기 학습용 음성벡터의 잡음 또는 잔향의 양에 반비례하여 0 내지 1 사이의 실수인 거리반비례지수를 산출하는 잡음잔향검출망을 포함하며, 상기 학습부는 상기 학습용 음성벡터의 발화거리를 나타내는 발화거리 레이블과 상기 거리반비례지수와의 이진 교차엔트로피 오차, 상기 학습용 음성벡터의 화자가 기 설정된 근거리에서 발화한 음성의 특징을 추출한 근거리음성벡터와 상기 보상음성벡터와의 평균 제곱 오차 및 상기 화자를 나타내는 화자 레이블과 상기 화자인식벡터와의 교차엔트로피 오차가 최소가 되도록 상기 심층신경망의 가중치를 최적화하는 것을 특징으로 하는 화자 특징 강화를 위한 장치
6 6
제5항에 있어서, 상기 발화거리 레이블은 상기 학습용 음성벡터의 발화거리가 기 설정된 원거리인 경우 0이며, 상기 학습용 음성벡터의 발화거리가 기 설정된 근거리인 경우 1인 것을 특징으로 하는 화자 특징 강화를 위한 장치
7 7
제4항에 있어서, 상기 심층신경망은 발화거리가 알려지지 않은 음성벡터가 입력되면, 상기 음성벡터의 잡음 또는 잔향의 양에 따라 0 내지 1 사이의 실수인 거리반비례지수를 산출하는 잡음잔향검출망과, 상기 음성벡터와 상기 거리반비례지수를 곱한 거리반비례음성벡터를 산출하는 곱셈기와, 상기 음성벡터의 발화거리가 기 설정된 원거리에 근접할수록 기 설정된 근거리에서 입력된 음성 신호의 특징을 추출한 근거리음성벡터에 가까운 값을 가지며, 상기 음성벡터의 발화거리가 기 설정된 근거리에 근접할수록 0 벡터에 가까운 값을 가지는 모사근거리음성벡터를 도출하는 원거리보상망과, 상기 거리반비례음성벡터 및 상기 모사근거리음성벡터를 더하여 거리보상음성벡터를 도출하는 덧셈기와, 상기 거리보상음성벡터로부터 화자의 특징을 추출하여 화자특징벡터를 도출하는 화자특징층을 포함하는 것을 특징으로 하는 화자 특징 강화를 위한 장치
8 8
원거리 발화를 선택적으로 보상하는 심층 신경망 기반 화자 특징 강화를 위한 방법에 있어서, 잡음잔향검출망이 발화거리가 알려지지 않은 음성벡터의 잡음 또는 잔향의 양에 반비례하여 0 내지 1 사이의 값인 거리반비례지수를 산출하는 단계; 곱셈기가 상기 음성벡터와 상기 거리반비례지수를 곱한 거리반비례음성벡터를 산출하는 단계; 원거리보상망이 상기 음성벡터의 발화거리가 기 설정된 원거리에 근접할수록 기 설정된 근거리에서 입력된 음성 신호의 특징을 추출한 근거리음성벡터에 가까운 값을 가지는 모사근거리음성벡터를 산출하는 단계; 덧셈기가 상기 거리반비례음성벡터 및 상기 모사근거리음성벡터를 더하여 보상음성벡터를 도출하는 단계; 및 화자특징층이 상기 도출된 보상음성벡터에 대한 가중치가 적용되는 연산을 통해 화자 식별을 위한 특징을 나타내는 화자특징벡터를 도출하는 단계;를 포함하는 것을 특징으로 하는 화자 특징 강화를 위한 방법
9 9
제8항에 있어서, 상기 거리반비례지수를 산출하는 단계는 상기 잡음잔향검출망이 상기 입력된 음성벡터의 잡음 또는 잔향의 양이 많을수록 0에 가까운 값을 가지며 상기 입력된 음성벡터의 잡음 또는 잔향의 양이 적을수록 1에 가까운 값을 가지는 거리반비례지수를 산출하는 것을 특징으로 하는 화자 특징 강화를 위한 방법
10 10
제8항에 있어서, 상기 보상음성벡터는 상기 입력된 음성벡터의 발화거리가 기 설정된 원거리에 근접할수록 기 설정된 근거리에서 입력된 음성 신호의 특징을 추출한 근거리음성벡터에 가까운 값을 가지며, 상기 입력된 음성벡터의 발화거리가 기 설정된 근거리에 근접할수록 상기 입력된 음성벡터의 값과 동일한 값을 가지는 것을 특징으로 하는 화자 특징 강화를 위한 방법
11 11
제8항에 있어서, 상기 거리반비례지수를 산출하는 단계 전, 상기 잡음잔향검출망이 화자 및 발화거리가 알려진 학습용 음성벡터의 잡음 또는 잔향의 양에 반비례하여 0 내지 1 사이의 실수인 거리반비례지수를 도출하는 단계; 상기 곱셈기가 상기 학습용 음성벡터 및 상기 거리반비례지수를 곱하여 거리반비례음성벡터를 산출하는 단계; 상기 원거리보상망이 상기 학습용 음성벡터의 발화거리에 따라 근거리음성벡터를 모사하는 모사근거리음성벡터를 산출하는 단계; 상기 덧셈기가 상기 거리반비례음성벡터 및 상기 모사근거리음성벡터를 더하여 거리보상음성벡터를 도출하는 단계; 상기 화자특징층이 상기 거리보상음성벡터에 대해 가중치가 적용되는 연산을 수행하여 화자특징벡터를 도출하는 단계; 및 화자식별층이 상기 화자특징벡터로부터 상기 학습용 음성벡터의 화자가 기 설정된 화자일 확률을 나타내는 화자인식벡터를 도출하는 단계;학습부가 상기 학습용 음성벡터의 화자가 기 설정된 근거리에서 발화한 음성의 특징을 추출한 근거리음성벡터와 상기 보상음성벡터와의 평균 제곱 오차 및 상기 화자를 나타내는 화자 레이블과 상기 화자인식벡터와의 교차엔트로피 오차가 최소가 되도록 상기 잡음잔향검출망, 상기 원거리보상망 및 상기 화자특징층의 가중치를 최적화하는 단계;를 더 포함하는 것을 특징으로 하는 화자 특징 강화를 위한 방법
12 12
제8항에 있어서, 상기 거리반비례지수를 산출하는 단계 전, 상기 잡음잔향검출망이 화자 및 발화거리가 알려진 학습용 음성벡터의 잡음 또는 잔향의 양에 반비례하여 0 내지 1 사이의 실수인 거리반비례지수를 산출하는 단계; 상기 곱셈기가 상기 학습용 음성벡터 및 상기 학습용 음성벡터의 발화거리를 나타내는 발화거리 레이블을 곱하여 거리반비례음성벡터를 산출하는 단계; 상기 원거리보상망이 상기 학습용 음성벡터의 발화거리에 따라 근거리음성벡터를 모사하는 모사근거리음성벡터를 산출하는 단계; 상기 덧셈기가 상기 거리반비례음성벡터 및 상기 모사근거리음성벡터를 더하여 거리보상음성벡터를 도출하는 단계; 상기 화자특징층이 상기 거리보상음성벡터에 대해 가중치가 적용되는 연산을 수행하여 화자특징벡터를 도출하는 단계; 화자식별층이 상기 화자특징벡터로부터 상기 학습용 음성벡터의 화자가 기 설정된 화자일 확률을 나타내는 화자인식벡터를 도출하는 단계; 및 학습부가 상기 학습용 음성벡터의 발화거리를 나타내는 발화거리 레이블과 상기 거리반비례지수와의 이진 교차엔트로피 오차, 상기 학습용 음성벡터의 화자가 기 설정된 근거리에서 발화한 음성의 특징을 추출한 근거리음성벡터와 상기 보상음성벡터와의 평균 제곱 오차 및 상기 화자를 나타내는 화자 레이블과 상기 화자인식벡터와의 교차엔트로피 오차가 최소가 되도록 상기 잡음잔향검출망, 상기 원거리보상망 및 상기 화자특징층의 가중치를 최적화하는 단계;를 더 포함하는 것을 특징으로 하는 화자 특징 강화를 위한 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 산업통상자원부 한양대학교산학협력단 로봇산업핵심기술개발(R&D) 로봇용 free-running 임베디드 자연어 대화음성인식을 위한 원천 기술 개발