맞춤기술찾기

이전대상기술

심층신경망 기반 음성 인식 시스템을 위한 발화 검증 방법

  • 기술번호 : KST2018014423
  • 담당센터 :
  • 전화번호 :
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 개시는 심층신경망 기반 음성 인식 시스템에서의 발화 검증 방법 및 이를 위한 장치에 관한 것이다. 이를 위한 발화검증 방법은, 입력된 음성 신호로부터, 상기 음성 신호의 특징부를 추출하는 단계, 상기 추출된 특징부에 대한 디코딩을 수행하는 단계, 상기 디코딩의 수행 결과 출력된 문맥종속 음성 인식 결과로부터 제1 반스코어를 계산하는 단계, 상기 제1 반스코어로부터 문맥종속 기반 신뢰도를 계산하는 단계, 상기 문맥종속 음성 인식 결과로부터 제2 반스코어를 계산하는 단계, 상기 제2 반스코어로부터 문맥독립 기반 신뢰도를 계산하는 단계, 및 상기 문맥종속 기반 신뢰도 및 상기 문맥독립 기반 신뢰도를 기초로, 상기 음성 신호의 수락 여부를 결정하는 단계를 포함할 수 있다.
Int. CL G10L 17/12 (2013.01.01) G10L 15/04 (2006.01.01) G10L 17/18 (2013.01.01)
CPC G10L 17/12(2013.01) G10L 17/12(2013.01) G10L 17/12(2013.01)
출원번호/일자 1020170051144 (2017.04.20)
출원인 한국전자통신연구원
등록번호/일자 10-2125549-0000 (2020.06.16)
공개번호/일자 10-2018-0117942 (2018.10.30) 문서열기
공고번호/일자 (20200622) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 발송처리완료
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.09.21)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 강점자 대한민국 대전광역시 서구
2 박전규 대한민국 대전광역시 유성구
3 오유리 대한민국 대전광역시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 성병기 대한민국 서울특별시 서초구 사임당로 **, **층 (서초동, 재우빌딩)(마루특허법률사무소)
2 최윤서 대한민국 서울특별시 강남구 도곡로 *** (역삼동, 미진빌딩), *층(윤특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2017.04.20 수리 (Accepted) 1-1-2017-0389415-91
2 [심사청구]심사청구(우선심사신청)서
[Request for Examination] Request for Examination (Request for Preferential Examination)
2018.09.21 수리 (Accepted) 1-1-2018-0946855-66
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2018.09.21 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2018-0946854-10
4 의견제출통지서
Notification of reason for refusal
2019.07.10 발송처리완료 (Completion of Transmission) 9-5-2019-0498023-46
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.08.30 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0894331-35
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.08.30 수리 (Accepted) 1-1-2019-0894329-43
7 거절결정서
Decision to Refuse a Patent
2020.01.29 발송처리완료 (Completion of Transmission) 9-5-2020-0067280-90
8 [명세서등 보정]보정서(재심사)
Amendment to Description, etc(Reexamination)
2020.02.28 보정승인 (Acceptance of amendment) 1-1-2020-0215874-36
9 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2020.02.28 수리 (Accepted) 1-1-2020-0215873-91
10 등록결정서
Decision to Grant Registration
2020.04.02 발송처리완료 (Completion of Transmission) 9-5-2020-0241511-80
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
삭제
2 2
음성 신호를 입력 받는 단계;상기 입력된 음성 신호의 특징을 추출하는 단계;상기 추출된 특징에 대해 심층 신경망 기반의 다중 디코딩을 수행하여 문맥 종속 음성 인식 결과를 출력하는 단계; 및상기 문맥 종속 음성 인식 결과를 이용하여 음성 신호의 수락 여부를 결정하는 단계를 포함하고,상기 문맥 종속 음성 인식 결과를 출력하는 단계는,문맥 종속 로그 확률값 및 문맥 독립 로그 확률값 중 적어도 하나를 산출하는 단계를 포함하고,상기 음성 신호의 수락 여부를 결정하는 단계는 반모델(antimodel) 스코어에 기초하여 이루어지고,상기 반모델 스코어는 제1 반모델 스코어 및 제2 반모델 스코어를 포함하고,상기 제1 반모델 스코어는 문맥 종속 반 음소 레벨 로그 확률값이고,상기 제2 반모델 스코어는 문맥 독립 반 음소 레벨 로그 확률값이고,상기 문맥 종속 반 음소 레벨 로그 확률값은,상기 문맥 종속 음성 인식 결과 중 현재 음소열 이외의 음소열들의 로그 확률값을 합하고, 상기 합한 확률 값을 프레임 수로 나눔으로써 획득되는 발화검증 방법
3 3
제2항에 있어서,상기 다중 디코딩은,심층신경망 기반으로 훈련된 음향 모델, n-gram 언어모델 및 문맥 독립 음향 모델 중 적어도 하나를 이용하여 수행되는 발화검증 방법
4 4
제2항에 있어서,상기 반모델 스코어는 상기 출력된 문맥 종속 음성 인식 결과를 이용하여 계산되는 발화검증 방법
5 5
삭제
6 6
삭제
7 7
제2항에 있어서,상기 문맥 독립 반 음소 레벨 로그 확률값은,상기 문맥 종속 음성 인식 결과 중 현재 음소열의 가운데 음소를 기준으로, 현재 문맥 독립 음소를 제외한 나머지 음소에 대한 로그 합률값을 합하고, 상기 합한 확률값을 프레임 수로 나눔으로서 획득되는 발화검증 방법
8 8
제2항에 있어서,상기 음성 신호의 수락 여부를 결정하는 단계는,상기 제1 반모델 스코어를 이용하여 문맥종속 기반 신뢰도를 계산하는 단계;상기 제2 반모델 스코어를 이용하여 문맥독립 기반 신뢰도를 계산하는 단계; 및상기 계산된 문맥종속 기반 신뢰도 및 문맥독립 기반 신뢰도를 이용하여 상기 음성 신호의 수락 여부를 결정하는 단계를 포함하는 발화검증 방법
9 9
제8항에 있어서,상기 문맥종속 기반 신뢰도는 음성 신호의 부존재와 관련된 H0 모델로서 문맥종속 모델을 이용하고, 음성 신호의 존재와 관련된 H1 모델로서 문맥종속 반 음소 모델을 이용함으로써 획득되고,상기 문맥독립 기반 신뢰도는 상기 H0 모델로서 문맥종속 모델을 이용하고, 상기 H1 모델로서 문맥독립 반 음소 모델을 이용함으로써 획득되는 발화검증 방법
10 10
입력된 음성 신호로부터 상기 음성 신호의 특징을 추출하는 특징 추출부;상기 추출된 특징에 대해 심층 신경망 기반의 다중 디코딩을 수행하여 문맥 종속 음성 인식 결과를 출력하는 디코딩부; 및상기 문맥 종속 음성 인식 결과를 이용하여 음성 신호의 수락 여부를 결정하는 발화 검증부를 포함하고,상기 디코딩부는,문맥 종속 로그 확률값 및 문맥 독립 로그 확률값 중 적어도 하나를 산출하고,상기 발화 검증부는,반모델(antimodel) 스코어에 기초하여 상기 음성 신호의 수락 여부를 결정하고,상기 반모델 스코어는 제1 반모델 스코어 및 제2 반모델 스코어를 포함하고,상기 제1 반모델 스코어는 문맥 종속 반 음소 레벨 로그 확률값이고,상기 제2 반모델 스코어는 문맥 독립 반 음소 레벨 로그 확률값이고,상기 문맥 종속 반 음소 레벨 로그 확률값은,상기 문맥 종속 음성 인식 결과 중 현재 음소열 이외의 음소열들의 로그 확률값을 합하고, 상기 합한 확률값을 프레임 수로 나눔으로써 획득되는 발화검증 장치
11 11
제10항에 있어서,상기 다중 디코딩은,심층신경망 기반으로 훈련된 음향 모델, n-gram 언어모델 및 문맥 독립 음향 모델 중 적어도 하나를 이용하여 수행되는 발화검증 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 ETRI SW컴퓨팅산업원천기술개발사업 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발