맞춤기술찾기

이전대상기술

강화학습 기반의 음성 향상 방법 및 시스템

  • 기술번호 : KST2019017344
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 강화학습 기반의 음성 향상 방법 및 시스템이 제시된다. 일 실시예에 따른 강화학습 기반의 음성 향상 방법은, 훈련 데이터셋으로부터 시간-주파수 이득값을 추출하고, 행동 가치(action-value) 함수를 선행 학습시키는 초기화 단계; 및 보상(reward)을 통해 학습한 상기 행동 가치 함수를 이용하여 강화학습하여 최적의 시간-주파수 이득값 선택 정책을 획득하고, 상기 최적의 시간-주파수 이득값 선택 정책에 따른 시간-주파수 이득값을 이용하여 음성신호를 향상시키는 훈련 단계를 포함하여 이루어질 수 있다.
Int. CL G10L 21/02 (2006.01.01) G10L 15/20 (2006.01.01) G10L 25/30 (2013.01.01)
CPC G10L 21/02(2013.01) G10L 21/02(2013.01) G10L 21/02(2013.01) G10L 21/02(2013.01)
출원번호/일자 1020180051602 (2018.05.04)
출원인 한양대학교 산학협력단
등록번호/일자 10-2017173-0000 (2019.08.27)
공개번호/일자
공고번호/일자 (20190902) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.05.04)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 대한민국 서울특별시 성동구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 장준혁 서울특별시 성동구
2 박태준 서울특별시 성동구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 서울특별시 성동구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.05.04 수리 (Accepted) 1-1-2018-0441984-92
2 의견제출통지서
Notification of reason for refusal
2019.04.08 발송처리완료 (Completion of Transmission) 9-5-2019-0254347-78
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.05.21 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0518821-87
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.05.21 수리 (Accepted) 1-1-2019-0518820-31
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.05 수리 (Accepted) 4-1-2019-5155816-75
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.06 수리 (Accepted) 4-1-2019-5156285-09
7 등록결정서
Decision to grant
2019.08.20 발송처리완료 (Completion of Transmission) 9-5-2019-0600316-35
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
훈련 데이터셋으로부터 시간-주파수 이득값을 추출하고, 행동 가치(action-value) 함수를 선행 학습시키는 초기화 단계; 및 보상(reward)을 통해 학습한 상기 행동 가치 함수를 이용하여 강화학습하여 최적의 시간-주파수 이득값 선택 정책을 획득하고, 상기 최적의 시간-주파수 이득값 선택 정책에 따른 시간-주파수 이득값을 이용하여 음성신호를 향상시키는 훈련 단계를 포함하고, 상기 보상은, PESQ(Perceptual Evaluation of Speech Quality), LLR(Log Likelihood Ratio) 및 WSS(Weighted Spectral Slope)로 구성된 복합 측정(composite measure)을 기반으로 설계되어 상기 강화학습에 적용하는 것을 특징으로 하는, 강화학습 기반의 음성 향상 방법
2 2
제1항에 있어서, 상기 보상은, 음성 인식률과 상관관계가 있는 복합 측정(composite measure)을 기반으로 설계되어 상기 강화학습에 적용하는 것을 특징으로 하는, 강화학습 기반의 음성 향상 방법
3 3
삭제
4 4
제1항에 있어서, 상기 초기화 단계는, 상기 훈련 데이터셋으로부터 시간-주파수 이득값을 추출하는 단계; 추출된 상기 시간-주파수 이득값을 이용하여 K-평균(K-means) 군집화하는 단계; 상기 K-평균 군집화 결과 값을 이용하여 시간-주파수 이득값 템플릿을 생성하는 단계; 및 상기 훈련 데이터셋으로부터 MMSE 기반으로 행동 가치(action-value) 함수를 선행 학습시키는 단계를 포함하는, 강화학습 기반의 음성 향상 방법
5 5
제4항에 있어서, 상기 훈련 단계는, 상기 보상을 통해 학습한 상기 행동 가치(action-value) 함수를 이용하여 강화학습하여 최적의 시간-주파수 이득값 선택 정책을 획득하는 단계; 상기 최적의 시간-주파수 이득값 선택 정책에 따른 상기 시간-주파수 이득값 템플릿의 해당 시간-주파수 이득값을 이용하여 음성신호를 향상시키는 단계; 및 향상된 상기 음성신호의 복합 측정(composite measure)을 통해 상기 보상을 계산하는 단계를 포함하는, 강화학습 기반의 음성 향상 방법
6 6
제5항에 있어서, 상기 훈련 단계는, 계산된 상기 보상을 이용한 상기 강화학습을 통해 상기 최적의 시간-주파수 이득값 선택 정책의 업데이트를 반복하는 단계 를 더 포함하는, 강화학습 기반의 음성 향상 방법
7 7
훈련 데이터셋으로부터 시간-주파수 이득값을 추출하고, 행동 가치(action-value) 함수를 선행 학습시키는 초기화 단계; 및 보상(reward)을 통해 학습한 상기 행동 가치 함수를 이용하여 강화학습하여 최적의 시간-주파수 이득값 선택 정책을 획득하고, 상기 최적의 시간-주파수 이득값 선택 정책에 따른 시간-주파수 이득값을 이용하여 음성신호를 향상시키는 훈련 단계를 포함하고, 로그 파워 스펙트럼(Log Power Spectrum, LPS)을 학습된 강화학습 기반의 심화신경망의 입력으로 인가하는 단계; 상기 학습된 강화학습 기반의 심화신경망을 기반으로 최적의 Q 값을 도출하는 단계; 및 상기 Q 값이 가리키는 상기 최적의 시간-주파수 이득값을 도출하여 향상된 음성신호를 획득하는 단계 를 더 포함하는, 강화학습 기반의 음성 향상 방법
8 8
훈련 데이터셋으로부터 시간-주파수 이득값을 추출하고, 행동 가치(action-value) 함수를 선행 학습시키는 초기화부; 및 보상(reward)을 통해 학습한 상기 행동 가치 함수를 이용하여 강화학습하여 최적의 시간-주파수 이득값 선택 정책을 획득하고, 상기 최적의 시간-주파수 이득값 선택 정책에 따른 시간-주파수 이득값을 이용하여 음성신호를 향상시키는 훈련부를 포함하고, 상기 보상은, PESQ(Perceptual Evaluation of Speech Quality), LLR(Log Likelihood Ratio) 및 WSS(Weighted Spectral Slope)로 구성된 복합 측정(composite measure)을 기반으로 설계되어 상기 강화학습에 적용하는 것을 특징으로 하는, 강화학습 기반의 음성 향상 시스템
9 9
제8항에 있어서, 상기 보상은, 음성 인식률과 상관관계가 있는 복합 측정(composite measure)을 기반으로 설계되어 상기 강화학습에 적용하는 것을 특징으로 하는, 강화학습 기반의 음성 향상 시스템
10 10
삭제
11 11
제8항에 있어서, 상기 초기화부는, 상기 훈련 데이터셋으로부터 시간-주파수 이득값을 추출하는 이득값 추출부; 추출된 상기 시간-주파수 이득값을 이용하여 K-평균(K-means) 군집화하는 군집화부; 상기 K-평균 군집화 결과 값을 이용하여 시간-주파수 이득값 템플릿을 생성하는 이득값 템플릿부; 및 상기 훈련 데이터셋으로부터 MMSE 기반으로 행동 가치(action-value) 함수를 선행 학습시키는 선행 학습부를 포함하는, 강화학습 기반의 음성 향상 시스템
12 12
제11항에 있어서, 상기 훈련부는, 상기 보상을 통해 학습한 상기 행동 가치(action-value) 함수를 이용하여 강화학습하여 최적의 시간-주파수 이득값 선택 정책을 획득하는 강화학습부; 상기 최적의 시간-주파수 이득값 선택 정책에 따른 상기 시간-주파수 이득값 템플릿의 해당 시간-주파수 이득값을 이용하여 음성신호를 향상시키는 음성신호 향상부; 및 향상된 상기 음성신호의 복합 측정(composite measure)을 통해 상기 보상을 계산하는 보상 산정부를 포함하는, 강화학습 기반의 음성 향상 시스템
13 13
제12항에 있어서, 상기 훈련부는, 계산된 상기 보상을 이용한 상기 강화학습을 통해 상기 최적의 시간-주파수 이득값 선택 정책의 업데이트를 반복하는 것을 특징으로 하는, 강화학습 기반의 음성 향상 시스템
14 14
훈련 데이터셋으로부터 시간-주파수 이득값을 추출하고, 행동 가치(action-value) 함수를 선행 학습시키는 초기화부; 및 보상(reward)을 통해 학습한 상기 행동 가치 함수를 이용하여 강화학습하여 최적의 시간-주파수 이득값 선택 정책을 획득하고, 상기 최적의 시간-주파수 이득값 선택 정책에 따른 시간-주파수 이득값을 이용하여 음성신호를 향상시키는 훈련부를 포함하고, 로그 파워 스펙트럼(Log Power Spectrum, LPS)을 학습된 강화학습 기반의 심화신경망의 입력으로 인가하는 입력부; 상기 학습된 강화학습 기반의 심화신경망을 기반으로 최적의 Q 값을 도출하는 심화신경망; 및 상기 Q 값이 가리키는 상기 최적의 시간-주파수 이득값을 도출하여 향상된 음성신호를 획득하는 출력부 를 더 포함하는, 강화학습 기반의 음성 향상 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부(2017Y) 한양대학교 산학협력단 정보통신산업진흥원 부설 정보통신기술진흥센터 / 정보통신방송 연구개발사업 / 방송통신산업기술개발사업(이지바로) AI스피커 음성비서를 위한 지능형 음성신호처리 기술개발