맞춤기술찾기

이전대상기술

연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치 및 방법

  • 기술번호 : KST2016001001
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 기술에 관한 것으로, 신규 고유명사와 분류어를 수집하고, 수집된 단어들을 이용하여 텍스트 코퍼스로부터 후보 문장을 선정하며, 후보 문장으로부터 후보 문틀을 추출하고, 후보 문틀의 엔그램을 생성한 후, 각 후보 문틀을 통계적인 계산식을 이용하여 점수화 및 순위화를 수행하고, 상위의 문틀을 고유명사에 적용한 후 엔그램을 확장하여 언어모델에 반영하는 것을 특징으로 한다. 본 발명에 의하면, 음성인식을 위한 언어모델에 없는 신규 고유명사를 문장의 다양한 표현을 반영한 엔그램 형태로 추가할 수 있기 때문에 단순히 고유명사 만으로 추가하는 방법보다 고유 명사의 높은 음성인식 성능을 얻을 수 있다.
Int. CL G10L 15/28 (2006.01) G10L 15/06 (2006.01) G10L 15/08 (2006.01)
CPC G10L 15/063(2013.01) G10L 15/063(2013.01) G10L 15/063(2013.01) G10L 15/063(2013.01)
출원번호/일자 1020110079586 (2011.08.10)
출원인 한국전자통신연구원
등록번호/일자 10-1388569-0000 (2014.04.17)
공개번호/일자 10-2013-0017260 (2013.02.20) 문서열기
공고번호/일자 (20140423) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2013.04.01)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 왕지현 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2011.08.10 수리 (Accepted) 1-1-2011-0618341-09
2 [출원서등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2011.08.16 수리 (Accepted) 1-1-2011-0628214-98
3 [심사청구]심사청구(우선심사신청)서
[Request for Examination] Request for Examination (Request for Preferential Examination)
2013.04.01 수리 (Accepted) 1-1-2013-0283410-62
4 선행기술조사의뢰서
Request for Prior Art Search
2014.03.06 수리 (Accepted) 9-1-9999-9999999-89
5 선행기술조사보고서
Report of Prior Art Search
2014.04.08 수리 (Accepted) 9-1-2014-0027116-04
6 등록결정서
Decision to grant
2014.04.14 발송처리완료 (Completion of Transmission) 9-5-2014-0255320-31
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
언어모델의 고유 명사 추가 장치에서 신규 고유명사와 분류어를 수집하는 수집부와,상기 신규 고유 명사 및 분류어를 텍스트 스코프에서 검색하여 매칭된 문장들을 후보 문장으로 선정하는 후보 문장 선정부와,상기 후보 문장으로부터 후보 문틀을 추출하는 후보 문틀 추출부와,상기 후보 문틀에서 엔그램 형식의 후보 문틀을 추출하는 엔그램의 후보 문틀 생성부와,상기 엔그램 형식의 후보 문틀 각각에 대한 점수 산정을 통해 높은 점수 별로 순위화하는 순위화부와,순위화 된 엔그램 형식의 후보 문틀에 수집된 고유 명사를 대입하여 엔그램 확장을 수행하는 엔그램 확장부와,상기 엔그램 확장을 통해 생성된 엔그램을 언어모델에 빈도와 함께 추가하는 반영부를 포함하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치
2 2
제1항에 있어서,상기 수집부는,훈련용 텍스트 코퍼스에서 출현하지 않는 고유 명사를 수집하고, 상기 고유 명사로부터 개념적으로 구분되는 카테고리를 분류어로 할당하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치
3 3
제1항에 있어서,상기 후보 문틀 추출부는,상기 후보 문장에서 상기 고유 명사를 포함한 일정한 길이의 지역 문맥을 문틀의 형식으로 추출하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치
4 4
제1항에 있어서,상기 순위화부는,상기 엔그램 형식의 후보 문틀 마다 고유 명사를 포함하는 문틀의 개수 및 전체 코퍼스에서 문틀의 개수를 토대로 문틀의 적합성을 측정하고, 고유 명사를 포함하는 문틀의 개수 및 문틀의 상태도수를 토대로 문틀의 엔트로피를 산출하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치
5 5
제1항에 있어서,상기 엔그램 확장부는,적어도 하나의 상위 점수 문틀을 선정하고, 수집한 각각의 고유 명사를 문틀의 해당 위치에 대입하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치
6 6
언어모델의 고유 명사 추가 장치에서 신규 고유명사와 분류어를 수집하는 과정과,수집된 상기 신규 고유 명사 및 분류어를 텍스트 스코프에서 검색하여 매칭된 문장들을 후보 문장으로 선정하는 과정과,선정된 상기 후보 문장으로부터 후보 문틀을 추출하는 과정과,추출된 상기 후보 문틀에서 엔그램 형식의 후보 문틀을 추출하는 과정과,추출된 상기 엔그램 형식의 후보 문틀 각각에 대한 점수 산정을 통해 높은 점수 별로 순위화하는 과정과,순위화 된 엔그램 형식의 문틀에 수집된 고유 명사를 대입하여 엔그램 확장을 수행하는 과정과,상기 엔그램 확장을 통해 생성된 엔그램을 언어모델에 빈도와 함께 추가하는 과정을 포함하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 방법
7 7
제 6항에 있어서,상기 수집하는 과정은,훈련용 텍스트 코퍼스에서 출현하지 않는 고유 명사를 수집하고, 상기 고유 명사로부터 개념적으로 구분되는 카테고리를 분류어로 할당하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 방법
8 8
제 6항에 있어서, 상기 후보 문틀을 추출하는 과정은,상기 후보 문장에서 상기 고유 명사를 포함한 일정한 길이의 지역 문맥을 문틀의 형식으로 추출하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 방법
9 9
제 6항에 있어서,상기 점수 별로 순위화하는 과정은,상기 엔그램 형식의 후보 문틀 마다 고유 명사를 포함하는 문틀의 개수 및 전체 코퍼스에서 문틀의 개수를 토대로 문틀의 적합성을 측정하는 과정과, 고유 명사를 포함하는 문틀의 개수 및 문틀의 상태도수를 토대로 문틀의 엔트로피를 산출하는 과정을 포함하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 방법
10 10
제 6항에 있어서,상기 엔그램 확장을 수행하는 과정은,적어도 하나의 상위 점수 문틀을 선정하고, 수집한 각각의 고유 명사를 문틀의 해당 위치에 대입하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 지식경제부 한국전자통신연구원 정보통신산업원천기술개발사업 휴대형 한/영 자동통역 기술개발