맞춤기술찾기

이전대상기술

N-gram 네트워크를 이용하는 한국어 연속음성인식의언어모델 적응장치 및 그 방법

  • 기술번호 : KST2015080569
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 연속음성인식 과정에서 현재 인식 과정 중에 있는 음성의 주제 정보를 추정하고 이 정보를 이용하여 대규모 코퍼스에서 얻어진 N-gram 간의 의미적, 구문적 거리를 표시한 N-gram 네트워크를 검색하여 언어모델 적응을 수행하도록 하는 N-gram 네트워크를 이용하는 한국어 연속음성인식을 위한 언어모델 적응장치 및 그 방법에 관한 것이다. 이와 같은 본 발명은 대규모 텍스트 코퍼스 DB에 저장된 대규모 텍스트 코퍼스에 존재하는 문서간에 유사도를 이용하여 N-gram 네트워크를 생성하는 네트워크 생성 모듈과, 상기 네트워크 생성 모듈에서 생성된 N-gram 네트워크를 저장하는 N-gram 네트워크 DB와, 음성 인식 중간 결과를 추출하여, 음향학적 안정 단어를 검출한 후, 현재 인식중인 음성의 영역 정보를 추출하고, 이 안정 단어가 포함한 N-gram을 추출하는 정보 추출 모듈과, 상기 정보 추출 모듈에서 추출된 N-gram들을 상기 N-gram 네트워크 DB에서 검색하는 검색 모듈과, 상기 검색 모듈에서 검색된 N-gram을 이용하여 실시간으로 언어 모델을 갱신하여 이 갱신된 언어 모델을 음성인식에 적용하는 실시간 언어 모델 병합 모듈로 구성된다. 음성인식, 연속음성인식, 언어모델, 언어모델 적응, Speech Recognition, Continuous Speech Recognition, N-gram network, N-gram
Int. CL G10L 15/183 (2013.01) G10L 15/065 (2013.01)
CPC G10L 15/065(2013.01) G10L 15/065(2013.01) G10L 15/065(2013.01) G10L 15/065(2013.01)
출원번호/일자 1020050037093 (2005.05.03)
출원인 한국전자통신연구원
등록번호/일자 10-0704508-0000 (2007.04.02)
공개번호/일자 10-2006-0067096 (2006.06.19) 문서열기
공고번호/일자 (20070409) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020040105505   |   2004.12.14
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2005.05.03)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 최준기 대한민국 서울시 서초구
2 이영직 대한민국 대전시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 권태복 대한민국 서울시 강남구 테헤란로*길 **, *층 (역삼동, 청원빌딩)(아리특허법률사무소)
2 이화익 대한민국 서울시 강남구 테헤란로*길** (역삼동,청원빌딩) *층,***,***호(영인국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2005.05.03 수리 (Accepted) 1-1-2005-0233416-53
2 의견제출통지서
Notification of reason for refusal
2006.08.10 발송처리완료 (Completion of Transmission) 9-5-2006-0461941-29
3 지정기간연장신청서
Request for Extension of Designated Period
2006.10.10 수리 (Accepted) 1-1-2006-0731158-50
4 명세서등보정서
Amendment to Description, etc.
2006.11.10 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2006-0824098-67
5 의견서
Written Opinion
2006.11.10 수리 (Accepted) 1-1-2006-0824099-13
6 등록결정서
Decision to grant
2007.03.27 발송처리완료 (Completion of Transmission) 9-5-2007-0161198-98
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
기본 언어모델과 N-gram 네트워크를 생성하기 위한 대규모 텍스트 코퍼스를 저장하는 제1 저장 수단과;상기 대규모 텍스트 코퍼스에 존재하는 문서 간에 유사도를 이용하여 문서 간 클러스터링을 수행하는 문서 클러스터링부와, 상기 문서 클러스터링부에서 클러스터링된 문서 클러스터 별로 N-gram을 추출하는 문서 클러스터별 N-gram 추출부와, 상기 N-gram 추출부에서 추출된 N-gram을 결합하여 N-gram 네트워크를 생성하는 N-gram 결합부로 구성되어, 상기 제1 저장 수단에 저장된 대규모 텍스트 코퍼스에 존재하는 문서간에 유사도를 이용하여 N-gram 네트워크를 생성하는 네트워크 생성 수단과;상기 네트워크 생성 수단에서 생성된 N-gram 네트워크를 저장하는 제2 저장 수단과;음성 인식 중간 결과를 추출하여, 음향학적 안정 단어를 검출한 후, 현재 인식중인 음성의 영역 정보를 추출하고, 이 안정 단어가 포함한 N-gram을 추출하는 정보 추출 수단과;상기 정보 추출 수단에서 추출된 N-gram들을 상기 제2 저장 수단에서 N-gram 네트워크를 검색할 때, 상기 음향학적으로 안정된 단어가 포함된 N-gram부터 검색하고, 이 N-gram 간의 영역간 유사도를 이용하여 영역이 유사한 N-gram과 연결정보가 유사한 N-gram을 검색하여 적응 N-gram 세트를 작성하는 검색 수단과;상기 검색 수단에서 검색된 N-gram을 이용하여 실시간으로 언어 모델을 갱신하여 이 갱신된 언어 모델을 음성인식에 적용하는 실시간 언어 모델 병합 수단을 포함하여 구성되는 것을 특징으로 하는 N-gram 네트워크을 이용하는 한국어 연속 음성 인식의 언어 모델 적응 장치
2 2
삭제
3 3
제 1 항에 있어서, 상기 검색 수단은 unigram이나 bigram을 이용하여 검색된 N-gram들이 현재 인식중인 음성의 영역정보와 얼마나 유사한 지, 현재 문장들이 얼마나 공통적인 영역정보를 가지고 있는 지, 그리고 현재 인식중인 문장이 얼마나 균일한 영역 정보를 가지고 있는 지를 판단하는 것을 특징으로 하는 N-gram 네트워크을 이용하는 한국어 연속 음성 인식의 언어 모델 적응 장치
4 4
삭제
5 5
제 1 항에 있어서, 상기 실시간 언어모델 병합 수단은 음향 모델의 신뢰도가 낮은 구간에는 가급적 긴 언어모델과 강한 영역 가중치를 부여하고, 음향모델의 신뢰도가 높은 구간이나 단어는 짧은 언어모델을 적용하여, 언어 모델을 재계산하는 것을 특징으로 하는 N-gram 네트워크을 이용하는 한국어 연속 음성 인식의 언어 모델 적응 장치
6 6
N-gram 네트워크로 이루어진 적응 텍스트 코퍼스를 저장하는 대규모 텍스트 코퍼스 DB를 구축하는 제1 단계와;상기 대규모 텍스트 코퍼스에 존재하는 문서 간에 유사도를 이용하여 문서 간 클러스터링을 수행하는 제1 과정과, 상기 제1 과정에서 클러스터링된 문서 클러스터 별로 N-gram을 추출하는 제2 과정과, 상기 제2 과정에서 추출된 N-gram을 결합하여 N-gram 네트워크를 생성하는 제3 과정으로 구성되어, 상기 대규모 텍스트 코퍼스에 존재하는 문서간에 유사도를 이용하여 N-gram 네트워크를 생성하는 제2 단계와;상기 제2 단계에서 생성된 N-gram 네트워크를 저장하는 N-gram 네트워크 DB를 구축하는 제3 단계와;음성 인식 중간 결과를 추출하여, 음향학적 안정 단어를 검출한 후, 현재 인식중인 음성의 영역 정보를 추출하고, 이 안정 단어가 포함한 N-gram을 추출하는 제4 단계와;상기 제4 단계에서 추출된 N-gram들을 상기 구축된 N-gram 네트워크 DB에서 N-gram 네트워크를 검색할 때, 상기 음향학적으로 안정된 단어가 포함된 N-gram부터 검색하고, 이 N-gram 간의 영역간 유사도를 이용하여 영역이 유사한 N-gram과 연결정보가 유사한 N-gram을 검색하여 적응 N-gram 세트를 작성하는 제5 단계와;상기 제5 단계에서 검색된 N-gram을 이용하여 실시간으로 언어 모델을 갱신하여 이 갱신된 언어 모델을 음성인식에 적용하는 제6 단계를 포함하여 이루어지는 것을 특징으로 하는 N-gram 네트워크을 이용하는 한국어 연속 음성 인식의 언어 모델 적응 방법
7 7
삭제
8 8
제 6 항에 있어서, 상기 제5 단계는 unigram이나 bigram을 이용하여 검색된 N-gram들이 현재 인식중인 음성의 영역정보와 얼마나 유사한 지, 현재 문장들이 얼마나 공통적인 영역정보를 가지고 있는 지, 그리고 현재 인식중인 문장이 얼마나 균일한 영역 정보를 가지고 있는 지를 판단하는 것을 특징으로 하는 N-gram 네트워크을 이용하는 한국어 연속 음성 인식의 언어 모델 적응 방법
9 9
삭제
10 10
제 6 항에 있어서, 상기 제6 단계는 음향 모델의 신뢰도가 낮은 구간에는 가급적 긴 언어모델과 강한 영역 가중치를 부여하고, 음향모델의 신뢰도가 높은 구간이나 단어는 짧은 언어모델을 적용하여, 언어 모델을 재계산하는 것을 특징으로 하는 N-gram 네트워크을 이용하는 한국어 연속 음성 인식의 언어 모델 적응 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.