맞춤기술찾기

이전대상기술

자연어 대화체 음성을 인식하는 장치 및 방법(APPARATUS AND METHOD FOR RECOGNIZING NATURAL LANGUAGE DIALOGUE SPEECH)

  • 기술번호 : KST2018005859
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명에 따른 자연어 대화체 음성 인식 방법은 사용자의 발화에 대응되는 음성 신호를 수신하는 단계; 미리 훈련된 음향 모델 및 언어 모델에 기초하여 상기 음성 신호로부터 래티스를 추출하는 단계; 상기 음성 신호 중 불명확한 발성으로 인식되는 구간을 추정하는 단계; 상기 음향 모델 및 언어 모델에 기초하여 상기 불명확한 발성으로 추정된 구간의 재인식을 수행하는 단계 및 상기 재인식 결과로부터 추출된 래티스를 상기 음성 신호로부터 추출된 래티스와 결합하는 단계를 포함한다.
Int. CL G10L 15/02 (2006.01.01) G10L 15/183 (2013.01.01) G10L 25/93 (2013.01.01)
CPC G10L 15/02(2013.01) G10L 15/02(2013.01) G10L 15/02(2013.01)
출원번호/일자 1020160148423 (2016.11.08)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2018-0051301 (2018.05.16) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.03.06)
심사청구항수 9

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박기영 대한민국 대전광역시 유성구
2 박전규 대한민국 대전광역시 유성구
3 정호영 대한민국 대전광역시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인지명 대한민국 서울특별시 강남구 남부순환로**** 차우빌딩*층

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.11.08 수리 (Accepted) 1-1-2016-1092728-88
2 [심사청구]심사청구(우선심사신청)서
[Request for Examination] Request for Examination (Request for Preferential Examination)
2018.03.06 수리 (Accepted) 1-1-2018-0224111-82
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2018.03.06 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2018-0224110-36
4 의견제출통지서
Notification of reason for refusal
2019.06.19 발송처리완료 (Completion of Transmission) 9-5-2019-0440063-70
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.08.19 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0850644-01
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.08.19 수리 (Accepted) 1-1-2019-0850645-46
7 등록결정서
Decision to grant
2019.10.31 발송처리완료 (Completion of Transmission) 9-5-2019-0791710-45
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
자연어 대화체 음성 인식 방법에 있어서,사용자의 발화에 대응되는 음성 신호를 수신하는 단계;미리 훈련된 음향 모델 및 언어 모델에 기초하여 상기 음성 신호로부터 래티스를 추출하는 단계;상기 음성 신호의 크기, 신호 대 잡음비 및 발화 속도 중 하나 이상을 분석하거나 또는 상기 음향 모델을 이용한 단어별 우도 및 신뢰도에 기초한 인식 스코어를 산출하여 상기 음성 신호 중 불명확한 발성으로 인식되는 구간을 추정하는 단계;상기 음향 모델 및 언어 모델에 기초하여 상기 불명확한 발성으로 추정된 구간의 재인식을 수행하는 단계 및상기 재인식 결과로부터 추출된 래티스를 상기 음성 신호로부터 추출된 래티스와 결합하는 단계를 포함하는 음성 인식 방법
2 2
삭제
3 3
제 1 항에 있어서,상기 음성 신호로부터 래티스를 추출하는 단계는,상기 음성 신호로부터 프레임 별로 특징 벡터를 추출하고, 상기 추출된 특징 벡터에 대해 음성 인식 디코딩을 수행하여 상기 래티스를 추출하는 것인 음성 인식 방법
4 4
제 3 항에 있어서,상기 음성 신호로부터 추출된 래티스는 음성 신호의 프레임 및 상기 음성 신호의 프레임을 연결하는 아크로 표현된 유한 상태 변환모델(Finite State Transducer)로 제공되는 것인 음성 인식 방법
5 5
제 4 항에 있어서,상기 각 아크에는 심볼 및 천이 확률이 할당되고, 상기 천이 확률은 음향 모델 및 언어 모델에 각각 대응되는 천이 확률을 포함하는 것인 음성 인식 방법
6 6
제 3 항에 있어서,상기 음성 신호 중 불명확한 발성으로 인식되는 구간을 추정하는 단계는,상기 프레임 별로 상기 음성 신호의 크기를 산출하는 단계;상기 산출된 음성 신호의 크기의 변화값이 기 설정된 크기 이상을 가지는 프레임을 추출하는 단계 및상기 추출된 프레임을 상기 불명확한 발성으로 인식되는 구간으로 추정하는 단계를 포함하는 것인 음성 인식 방법
7 7
제 3 항에 있어서,상기 음성 신호 중 불명확한 발성으로 인식되는 구간을 추정하는 단계는,상기 프레임 별로 상기 음성 신호의 크기를 산출하는 단계;상기 사용자의 발화의 시작점으로부터 일정 프레임에서의 묵음 구간의 에너지를 추정하는 단계;상기 추정된 에너지의 값과 상기 프레임 별 음성 신호의 크기의 비율을 산출하는 단계 및상기 산출된 비율의 추이를 분석하여 상기 불명확한 발성으로 인식되는 구간을 추정하는 단계를 포함하는 것인 음성 인식 방법
8 8
제 3 항에 있어서,상기 음성 신호 중 불명확한 발성으로 인식되는 구간을 추정하는 단계는,상기 프레임 별로 단위 시간당 모음의 개수를 산출하는 단계;상기 산출된 모음의 개수를 분석하여 발화 속도를 추정하는 단계 및상기 프레임 별 추정된 발화 속도와 전체 발화 속도를 비교하여, 기 설정된 임계값 이상 또는 기 설정된 임계값 이하의 발화 속도를 가지는 구간을 상기 불명확한 발성으로 인식되는 구간으로 추정하는 단계를 포함하는 것인 음성 인식 방법
9 9
제 5 항에 있어서,상기 재인식 결과로부터 추출된 래티스를 이용하여 리스코어링하는 단계 및상기 리스코어링된 결과에 기초하여 음성 인식 결과를 출력하는 단계를 더 포함하는 것인 음성 인식 방법
10 10
제 9 항에 있어서,상기 리스코어링된 결과에 기초하여 음성 인식 결과를 출력하는 단계는,상기 아크를 따라 진행하여 상기 천이 확률을 모두 더한 결과 최소가 되는 어휘 시퀀스를 상기 음성인식 결과로 출력하되, 추가적으로 재인식된 결과로부터 상기 음향 모델 및 언어 모델에 대응되는 천이 확률을 새로이 산출하고, 다시 상기 음성인식 결과를 산출하는 것인 음성 인식 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 한국전자통신연구원 SW컴퓨팅산업원천기술개발 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발