맞춤기술찾기

이전대상기술

음성 인식 방법 및 장치

  • 기술번호 : KST2015099277
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 음성 인식 방법 및 장치에 관한 것으로, 음소 인식된 음소열에 대한 신뢰도를 계산하고 이를 이용하여 음성 인식 성능을 향상시키기 위한 방법 및 장치를 제공한다. 이를 위하여, 본 발명에 따른 음성 인식 방법은, 음성으로 입력된 문자열에 포함된 음소 간의 경계를 결정함으로써 각 음소 구간을 검출하는 단계; 상기 검출된 각 음소 구간이 나타내는 음소가 미리 정의된 음소 모델에 속하는 각 음소일 확률에 따른 신뢰도를 계산하는 단계; 상기 계산된 신뢰도 및 미리 훈련하여 저장된 음소 인식 확률 분포를 기반으로 상기 문자열에 대한 음소 정렬 비용을 계산하는 단계; 및 상기 계산된 음소 정렬 비용을 기반으로 음소 정렬을 수행함으로써 상기 입력된 문자열을 음성 인식하는 단계를 포함함으로써, 음소 인식된 음소열에 대한 신뢰도를 계산하고 이를 이용하여 음성 인식 성능을 향상시킬 수 있는 이점이 있다.
Int. CL G10L 15/02 (2013.01) G10L 15/06 (2013.01) G10L 15/04 (2013.01)
CPC
출원번호/일자 1020070095540 (2007.09.19)
출원인 한국전자통신연구원
등록번호/일자 10-0925479-0000 (2009.10.30)
공개번호/일자 10-2009-0030166 (2009.03.24) 문서열기
공고번호/일자 (20091106) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2007.09.19)
심사청구항수 24

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 전형배 대한민국 대전 서구
2 황규웅 대한민국 대전 서구
3 김승희 대한민국 대전 유성구
4 정훈 대한민국 강원 홍천군
5 박준 대한민국 대전 유성구
6 이윤근 대한민국 대전 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 신영무 대한민국 서울특별시 강남구 영동대로 ***(대치동) KT&G타워 *층(에스앤엘파트너스)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2007.09.19 수리 (Accepted) 1-1-2007-0680355-08
2 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2008.02.13 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2008-0106530-18
3 선행기술조사의뢰서
Request for Prior Art Search
2008.06.11 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2008.07.15 수리 (Accepted) 9-1-2008-0045174-56
5 의견제출통지서
Notification of reason for refusal
2009.04.17 발송처리완료 (Completion of Transmission) 9-5-2009-0162998-44
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2009.06.17 수리 (Accepted) 1-1-2009-0365582-79
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2009.06.17 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2009-0365598-09
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
9 등록결정서
Decision to grant
2009.10.29 발송처리완료 (Completion of Transmission) 9-5-2009-0445413-73
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
음성으로 입력된 문자열에 포함된 음소 간의 경계를 결정함으로써 각 음소 구간을 검출하는 단계; 상기 검출된 각 음소 구간이 나타내는 음소가 미리 정의된 음소 모델에 속하는 각 음소일 확률에 따른 신뢰도를 계산하는 단계; 상기 계산된 신뢰도 및 미리 훈련하여 저장된 음소 인식 확률 분포를 기반으로 상기 문자열에 대한 음소 정렬 비용을 계산하는 단계; 및 상기 계산된 음소 정렬 비용을 기반으로 음소 정렬을 수행함으로써 상기 입력된 문자열을 음성 인식하는 단계 를 포함하는 음성 인식 방법
2 2
제 1항에 있어서, 상기 신뢰도를 계산하는 단계는, 상기 각 음소 구간의 패턴과 상기 미리 정의된 음소 모델에 속한 각 음소의 패턴을 비교하여 유사도를 계산하고, 상기 계산된 유사도를 이용하여 상기 신뢰도를 계산하는 단계 를 포함하는 음성 인식 방법
3 3
제 2항에 있어서, 상기 신뢰도(feature[q][i])는, 하기의 수학식에 의하여 계산되는 음성 인식 방법
4 4
제 2항에 있어서, 상기 신뢰도(feature[q][i])는, 하기의 수학식에 의하여 계산되는 음성 인식 방법
5 5
제 3항 또는 제 4항에 있어서, 상기 음소 정렬 비용(cost(feature[q]|WP))은, 하기의 수학식에 의하여 계산되는 음성 인식 방법
6 6
제 2항에 있어서, 상기 신뢰도(feature[q][i])는, 하기의 수학식에 의하여 계산되는 음성 인식 방법
7 7
제 2항에 있어서, 상기 신뢰도(feature[q][i])는, 하기의 수학식에 의하여 계산되는 음성 인식 방법
8 8
제 6항 또는 제 7항에 있어서, 상기 음소 정렬 비용(cost(feature[q]|WP))은, 하기의 수학식에 의하여 계산되는 음성 인식 방법
9 9
제 1항에 있어서, 상기 음소 구간 검출의 정확도, 잡음 환경, 상기 음소 인식 확률 분포 계산의 평가 환경 및 훈련 환경의 불일치 중 적어도 하나를 반영하여 상기 음소 정렬 비용을 스무딩(smoothing)하는 단계 를 포함하는 음성 인식 방법
10 10
제 3항 또는 제4항에 있어서, 상기 음소 정렬 비용(cost(feature[q]|WP))은, 하기의 수학식에 의하여 계산되는 음성 인식 방법
11 11
제 6항 또는 제7항에 있어서, 상기 음소 정렬 비용(cost(feature[q]|WP))은, 하기의 수학식에 의하여 계산되는 음성 인식 방법
12 12
제 1항에 있어서, 상기 음소 인식 확률 분포를 구하기 위한 음소열을 음성으로 입력받고, 상기 음성 입력된 음소열에 포함된 음소가 미리 정의된 다수 개의 음소 중 어떤 음소로 인식되는지에 대한 판단 결과를 누적하여 상기 음소 인식 확률 분포를 구하는 단계 를 더 포함하는 음성 인식 방법
13 13
제 12항에 있어서, 상기 음성 입력된 음소열에 포함된 음소가 미리 정의된 다수 개의 음소 중 어떤 음소로 인식되는지에 대한 판단을 하는 단계는, 정답 음소열에 대하여 상기 음성 입력된 음소열을 정렬하는 데 드는 비용을 계산하고, 상기 비용이 가장 적게 드는 음소로 인식되는 것으로 판단하는 단계 를 포함하는 음성 인식 방법
14 14
음성 입력된 문자열에 포함된 음소 간의 경계를 결정함으로써 각 음소 구간을 검출하는 음소 구간 검출부; 상기 검출된 각 음소 구간이 나타내는 음소가 미리 정의된 음소 모델에 속하는 각 음소일 확률에 따른 신뢰도를 계산하는 신뢰도 결정부; 음성 입력된 음소가 어떤 음소로 인식되는지에 대하여 미리 훈련하여 구한 음소 인식 확률 분포를 저장하는 신뢰도 기반 음소 오류 모델; 및 상기 계산된 신뢰도 및 상기 음소 인식 확률 분포를 기반으로 상기 문자열에 대한 음소 정렬 비용을 계산하고, 상기 계산된 음소 정렬 비용을 기반으로 음소 정렬을 수행함으로써 상기 문자열을 음성 인식하는 단어 인식부 를 포함하는 음성 인식 장치
15 15
제 14항에 있어서, 상기 신뢰도 결정부는, 상기 각 음소 구간이 나타내는 음소와 상기 음소 모델에 속하는 각 음소의 유사도를 계산하고, 상기 계산된 유사도를 이용하여 상기 신뢰도를 계산하는 음성 인식 장치
16 16
제 15항에 있어서, 상기 단어 인식부는, 상기 신뢰도(feature[q][i])를 하기의 수학식에 의하여 계산하는 음성 인식 장치
17 17
제 15항에 있어서, 상기 단어 인식부는, 상기 신뢰도(feature[q][i])를 하기의 수학식에 의하여 계산하는 음성 인식 장치
18 18
제 16항 또는 제 17항에 있어서, 상기 단어 인식부는, 상기 음소 정렬 비용(cost(feature[q]|WP))를 하기의 수학식에 의하여 계산하는 음성 인식 장치
19 19
제 14항에 있어서, 상기 신뢰도 결정부는, 상기 신뢰도(feature[q][i])를 하기의 수학식에 의하여 계산하는 음성 인식 장치
20 20
제 14항에 있어서, 상기 신뢰도 결정부는, 상기 신뢰도(feature[q][i])를 하기의 수학식에 의하여 계산하는 음성 인식 장치
21 21
제 19항 또는 제 20항에 있어서, 상기 단어 인식부는, 상기 음소 정렬 비용(cost(feature[q]|WP))을 하기의 수학식에 의하여 계산하는 음성 인식 장치
22 22
제 14항에 있어서, 상기 단어 인식부는, 상기 음소 구간 검출부의 성능, 잡음 환경, 상기 신뢰도 기반 음소 오류 모델의 평가 환경 및 훈련 환경의 불일치 중 어느 하나를 반영하여 상기 음소 정렬 비용을 스무딩(smoothing)하는 음성 인식 장치
23 23
제 16항 또는 제17항에 있어서, 상기 단어 인식부는, 상기 음소 정렬 비용(cost(feature[q]|WP))을 하기의 수학식에 의하여 계산하는 음성 인식 장치
24 24
제 19항 또는 제20항에 있어서, 상기 단어 인식부는, 상기 음소 정렬 비용(cost(feature[q]|WP))을 하기의 수학식에 의하여 계산하는 음성 인식 장치
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US20090076817 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2009076817 US 미국 DOCDBFAMILY
국가 R&D 정보가 없습니다.