맞춤기술찾기

이전대상기술

적응 반음소 모델을 이용한 음성인식 서비스 방법

  • 기술번호 : KST2015080405
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 적응 반음소 모델을 이용한 음성인식 서비스 방법에 관한 것으로, 특히 음향 모델과 반음소 모델을 훈련하는 제 100 단계(S100); 유사한 서비스 환경에서 음성 신호를 수집하는 제 200 단계(S200); 개발용 및 훈련용 음성 신호 집합으로 훈련된 반음소 모델을 사용하여 반음소 모델을 적응시키는 제 300 단계(S300); 적응된 반음소 모델을 사용하여 실제 음성인식 서비스를 수행하는 제 400 단계(S400); 실제 음성인식 서비스를 통해 사용된 음성신호를 수집하는 제 500 단계(S500); 상기 실제 서비스 음성신호 집합을 사용하여 반음소 모델을 적응시키는 제 600 단계(S600); 및 새로운 실제 서비스 환경에 적응된 반음소 모델을 사용하여 실제 음성인식 서비스를 수행하는 제 700 단계(S700)로 이루어진 것을 특징으로 하며, 이러한 본 발명은 발화검증의 성능이 향상시키고, 음성인식 시스템의 출력 결과에 대한 신뢰도를 향상시키는 뛰어난 효과가 있다. 음성인식 시스템, 발화검증, 적응 반음소 모델, 로그-유사도 비율,
Int. CL G10L 15/02 (2006.01)
CPC G10L 15/08(2013.01) G10L 15/08(2013.01) G10L 15/08(2013.01)
출원번호/일자 1020040106607 (2004.12.15)
출원인 한국전자통신연구원
등록번호/일자 10-0655490-0000 (2006.12.01)
공개번호/일자 10-2006-0067714 (2006.06.20) 문서열기
공고번호/일자 (20061208) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2004.12.15)
심사청구항수 7

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 전형배 대한민국 대전시 서구
2 김상훈 대한민국 대전시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 권태복 대한민국 서울시 강남구 테헤란로*길 **, *층 (역삼동, 청원빌딩)(아리특허법률사무소)
2 이화익 대한민국 서울시 강남구 테헤란로*길** (역삼동,청원빌딩) *층,***,***호(영인국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2004.12.15 수리 (Accepted) 1-1-2004-0592306-70
2 의견제출통지서
Notification of reason for refusal
2006.05.24 발송처리완료 (Completion of Transmission) 9-5-2006-0295691-15
3 명세서등보정서
Amendment to Description, etc.
2006.07.24 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2006-0527394-33
4 의견서
Written Opinion
2006.07.24 수리 (Accepted) 1-1-2006-0527403-67
5 등록결정서
Decision to grant
2006.11.29 발송처리완료 (Completion of Transmission) 9-5-2006-0708582-13
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
음성인식 시스템을 이용한 음성인식 서비스 방법에 있어서, 훈련용 음성신호 집합으로부터 탐색에 사용할 음향 모델을 훈련하고, 발화검증에 사용할 반음소 모델을 훈련하는 제 100 단계; 서비스 환경과 유사한 환경에서 음성 신호를 수집하여 개발용 음성 신호 집합을 구축하는 제 200 단계; 구축된 개발용 음성 신호 집합에 대해 음성인식을 수행하는 제 310 단계, 상기 음성인식 결과를 음성 신호 정답 목록과 비교하여 정인식인지, 아니면 오인식인지의 여부를 판단하는 제 320 단계, 상기 제 320 단계에서 정인식이면 다시 상기 제 310 단계로 진행하는 한편, 오인식이면 그 음성인식 결과 중 오류 음소 구간을 찾아 적응에 필요한 관측 정보를 누적하는 제 330 단계, 누적 과정이 적응에 사용할 모든 음성 신호에 대해서 수행되었는지 확인하여, 모든 음성신호에 대한 누적이 완료되었는지의 여부를 판단하는 제 340 단계 및 상기 제 340 단계에서 누적이 완료되지 않으면 다시 상기 제 310 단계로 진행하는 한편, 완료되면 누적된 관측 정보를 사용하여 맵(MAP) 방법에 의한 반음소 모델 적응을 수행하는 제 350 단계로 이루어지고, 상기 개발용 음성 신호 집합과 상기 훈련용 음성신호 집합으로 훈련된 반음소 모델을 사용하여 반음소 모델을 적응시키는 제 300 단계; 적응된 반음소 모델을 사용하여 실제 음성인식 서비스를 수행하는 제 400 단계; 실제 음성인식 서비스를 통해 사용된 음성신호를 수집하여 실제 서비스 음성 신호 집합을 구축하는 제 500 단계; 구축된 실제 서비스 음성 신호 집합에 대해 음성인식을 수행하는 제 610 단계, 상기 음성인식 결과를 음성 신호 정답 목록과 비교하여 정인식인지, 아니면 오인식인지의 여부를 판단하는 제 620 단계, 상기 제 620 단계에서 정인식이면 다시 상기 제 610 단계로 진행하는 한편, 오인식이면 그 음성인식 결과 중 오류 음소 구간을 찾아 적응에 필요한 관측 정보를 누적하는 제 630 단계, 누적 과정이 적응에 사용할 모든 음성 신호에 대해서 수행되었는지 확인하여, 모든 음성신호에 대한 누적이 완료되었는지의 여부를 판단하는 제 640 단계 및 상기 제 640 단계에서 누적이 완료되지 않으면 다시 상기 제 610 단계로 진행하는 한편, 완료되면 누적된 관측 정보를 사용하여 맵(MAP) 방법에 의한 반음소 모델 적응을 수행하는 제 650 단계로 이루어지고, 상기 실제 서비스 음성신호 집합을 사용하여 반음소 모델을 적응시키는 제 600 단계; 및 새로운 실제 서비스 환경에 적응된 반음소 모델을 사용하여 실제 음성인식 서비스를 수행하는 제 700 단계로 이루어진 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
2 2
삭제
3 3
제 1항에 있어서, 상기 제 350 단계의 맵(MAP) 방법은, 하기의 [수학식 2]를 이용하여 반음소 모델을 적응하는 방식인 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
4 4
제 1항에 있어서, 상기 제 400 단계는, 음성 신호가 입력되면 끝점 검출을 수행한 후 음성인식에 유용한 특징 벡터를 추출하는 제 410 단계; 상기 추출된 특징 벡터에 대해 인식대상 어휘로 구성된 탐색공간에서 가장 유사한 어휘를 탐색하는 제 420 단계; 및 상기 탐색 과정을 통해 전달된 인식 결과 어휘와 해당 어휘를 구성하는 음소들의 유사도값을 전달받아 적응 반음소 모델을 통해 발화검증을 수행하는 제 430 단계로 이루어진 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
5 5
제 4항에 있어서, 상기 제 430 단계는, 상기 탐색 과정을 통해 인식 결과 어휘와 해당 어휘를 구성하는 음소들의 유사도값을 전달받는 제 431 단계; 적응 반음소 모델에 대한 인식 결과 어휘의 유사도를 계산하는 제 432 단계; 인식 결과 어휘의 탐색에 사용된 문맥종속(CD) 음향모델에 대한 유사도와 적응 반음소 모델에 대한 유사도의 로그-유사도 비율을 계산하는 제 433 단계; 발화검증 과정의 신뢰도인 로그-유사도 비율(LLR)을 임계값과 비교하여 LLR값이 임계값보다 크면 인식 결과를 수락하는 한편, LLR값이 임계값보다 작으면 인식 결과를 거절하는 제 434 단계; 및 상기 발화검증의 수락 또는 거절 결과에 따라 인식 결과 어휘를 출력하거나, 또는 사용자에게 재발성을 요구하는 제 435 단계로 이루어진 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
6 6
삭제
7 7
제 1항에 있어서, 상기 제 650 단계의 맵(MAP) 방법은, 하기의 [수학식 2]를 이용하여 반음소 모델을 적응하는 방식인 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
8 8
제 1항에 있어서, 상기 제 700 단계는, 음성 신호가 입력되면 끝점 검출을 수행한 후 음성인식에 유용한 특징 벡터를 추출하는 제 710 단계; 상기 추출된 특징 벡터에 대해 인식대상 어휘로 구성된 탐색공간에서 가장 유사한 어휘를 탐색하는 제 720 단계; 및 상기 탐색 과정을 통해 전달된 인식 결과 어휘와 해당 어휘를 구성하는 음소들의 유사도값을 전달받아, 새로운 실제 서비스 환경에 적응된 반음소 모델을 사용하여 발화검증을 수행하는 제 730 단계로 이루어진 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
9 9
제 8항에 있어서, 상기 제 730 단계는, 상기 탐색 과정을 통해 인식 결과 어휘와 해당 어휘를 구성하는 음소들의 유사도값을 전달받는 제 731 단계; 새로운 실제 서비스 환경에 적응된 반음소 모델에 대한 인식 결과 어휘의 유사도를 계산하는 제 732 단계; 인식 결과 어휘의 탐색에 사용된 문맥종속(CD) 음향모델에 대한 유사도와 적응 반음소 모델에 대한 유사도의 로그-유사도 비율을 계산하는 제 733 단계; 발화검증 과정의 신뢰도인 로그-유사도 비율(LLR)을 임계값과 비교하여 LLR값이 임계값보다 크면 인식 결과를 수락하는 한편, LLR값이 임계값보다 작으면 인식 결과를 거절하는 제 734 단계; 및 상기 발화검증의 수락 또는 거절 결과에 따라 인식 결과 어휘를 출력하거나, 또는 사용자에게 재발성을 요구하는 제 735 단계로 이루어진 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
10 9
제 8항에 있어서, 상기 제 730 단계는, 상기 탐색 과정을 통해 인식 결과 어휘와 해당 어휘를 구성하는 음소들의 유사도값을 전달받는 제 731 단계; 새로운 실제 서비스 환경에 적응된 반음소 모델에 대한 인식 결과 어휘의 유사도를 계산하는 제 732 단계; 인식 결과 어휘의 탐색에 사용된 문맥종속(CD) 음향모델에 대한 유사도와 적응 반음소 모델에 대한 유사도의 로그-유사도 비율을 계산하는 제 733 단계; 발화검증 과정의 신뢰도인 로그-유사도 비율(LLR)을 임계값과 비교하여 LLR값이 임계값보다 크면 인식 결과를 수락하는 한편, LLR값이 임계값보다 작으면 인식 결과를 거절하는 제 734 단계; 및 상기 발화검증의 수락 또는 거절 결과에 따라 인식 결과 어휘를 출력하거나, 또는 사용자에게 재발성을 요구하는 제 735 단계로 이루어진 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.