맞춤기술찾기

이전대상기술

음성인식시스템에서의 발음사전 자동생성 방법

  • 기술번호 : KST2015076797
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 1. 청구범위에 기재된 발명이 속한 기술분야본 발명은 음성인식시스템에서의 발음사전 자동생성 방법에 관한 것임.2. 발명이 해결하려고 하는 기술적 과제본 발명은, 음성인식시스템에서 대규모로 구축되어 있는 발음사전의 발음패턴을 음성학적 지식의 개입없이 신경망으로 학습하고, 학습된 신경망으로 발음사전을 정확히 생성시킬 수 없는 자소나 단어를 예외 자소 발음사전 및 예외 단어 발음사전을 이용하여 입력된 단어의 발음열을 보다 정확하게 생성하므로써, 단계별 처리에 따른 메모리 및 계산량을 감축시키기 위한 발음사전 자동생성 방법을 제공하고자 함.3. 발명의 해결방법의 요지 본 발명은, 신경망을 이용하여 다층 퍼셉트론을 학습시켜 예외 단어 발음사전 데이터베이스, 예외 자소 발음사전 데이터베이스, 각 자소별 음소출력 MLP 파라메터 데이터베이스를 구성하는 제 1 단계; 및 전처리된 입력 단어에 대해, 예외 단어 발음사전 데이터베이스, 예외 자소 발음사전 데이터베이스, MLP 파라메터 데이터베이스를 검사하여 해당 단어의 발음열을 후처리한 후에 출력하는 제 2 단계를 포함함.4. 발명의 중요한 용도본 발명은 음성인식시스템 등에 이용됨.
Int. CL G10L 15/06 (2013.01) G10L 15/16 (2013.01)
CPC
출원번호/일자 1019980048201 (1998.11.11)
출원인 한국전자통신연구원
등록번호/일자 10-0277694-0000 (2000.10.12)
공개번호/일자 10-2000-0031935 (2000.06.05) 문서열기
공고번호/일자 (20010115) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (1998.11.11)
심사청구항수 7

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김회린 대한민국 대전광역시 유성구
2 이영직 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 신성특허법인(유한) 대한민국 서울특별시 송파구 중대로 ***, ID타워 ***호 (가락동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 대리인선임신고서
Notification of assignment of agent
1998.11.11 수리 (Accepted) 1-1-1998-0370648-18
2 특허출원서
Patent Application
1998.11.11 수리 (Accepted) 1-1-1998-0392209-93
3 출원심사청구서
Request for Examination
1998.11.11 수리 (Accepted) 1-1-1998-0370649-53
4 등록사정서
Decision to grant
2000.09.27 발송처리완료 (Completion of Transmission) 9-5-2000-0241038-04
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2001.04.19 수리 (Accepted) 4-1-2001-0046046-20
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2002.08.08 수리 (Accepted) 4-1-2002-0065009-76
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1

음성인식시스템에 적용되는 발음사전 생성 방법에 있어서,

신경망을 이용하여 각 자소별로 대응되는 음소를 직접 매핑시키는 다층 퍼셉트론을 학습시켜 예외 단어 발음사전 데이터베이스, 예외 자소 발음사전 데이터베이스, 각 자소별 음소출력 다층 퍼셉트론(MLP) 파라메터 데이터베이스를 구성하는 제 1 단계; 및

전처리된 입력 단어에 대해, 상기 예외 단어 발음사전 데이터베이스, 상기 예외 자소 발음사전 데이터베이스, 상기 다층 퍼셉트론 파라메터 데이터베이스를 검사하여 해당 단어의 발음열을 후처리한 후에 출력하는 제 2 단계

를 포함하여 이루어진 발음사전 생성 방법

2 2

제 1 항에 있어서,

상기 제 1 단계는,

단어의 각 자소와 음소 사이의 유사도를 지식 및 사례를 토대로 정의하여 다이내믹 타임 와핑(DTW) 알고리즘에 의해 단어별로 각 자소와 음소 사이의 대응관계를 설정하는 제 3 단계;

구해진 각 자소-음소 매핑 데이터를 가지고 각 자소별 다층 퍼셉트론을 역전사(Back-Propagation) 방식으로 학습시켜 자소별 음소출력 다층 퍼셉트론 네트워크를 구성하는 제 4 단계;

이전 발음사전을 입력하여 구현된 다층 퍼셉트론의 자소별 발음출력과 이전 발음사전이 일치하지 않으면서 항상 한가지 결과를 출력하는지를 분석하는 제 5 단계;

상기 제 5 단계의 분석결과, 구현된 다층 퍼셉트론의 자소별 발음출력과 이전 발음사전이 일치하지 않으면서 항상 한가지 결과를 출력하면, 이를 상기 예외 자소 발음사전 데이터베이스에 등록하여 상기 예외 자소 발음사전 데이터베이스를 구성하고, 그렇지 않으면 각 단어의 발음열 출력이 이전 발음사전과 완전히 일치하는지를 검사하는 제 6 단계; 및

상기 제 6 단계의 검사결과, 일치하지 않으면 상기 예외 단어 발음사전 데이터베이스에 등록하여 상기 예외 단어 발음사전 데이터베이스를 구성하고, 일치하면 각 단어의 발음열 출력이 다층 퍼셉트론 출력으로 대체 가능하므로 이를 상기 자소별 음소출력 다층 퍼셉트론 파라메터 데이터베이스에 등록하여 상기 자소별 음소출력 다층 퍼셉트론 파라메터 데이터베이스를 구성하는 제 7 단계

를 포함하여 이루어진 발음사전 생성 방법

3 3

제 2 항에 있어서,

상기 제 4 단계의 학습과정은,

입력 노드를 해당 자소 및 그 자소의 전후 제1 소정의 자소를 입력으로 사용하되, 학습후의 성능이 특별히 낮은 경우에는 전후의 문맥 정보를 추가로 사용하여 전후 제2 소정의 자소를 입력으로 사용하는 것을 특징으로 하는 발음사전 생성 방법

4 4

제 1 항 내지 제 3 항중 어느 한 항에 있어서,

상기 제 2 단계는,

인식 후보단어에 대한 텍스트가 입력되면, 텍스트 전처리 과정을 수행하여 처리 가능한 알파벳만의 문자열로 변경시키는 제 8 단계;

입력된 단어가 예외 단어 발음사전 데이터베이스에 등록되어 있는지를 분석하여, 있으면 등록된 발음열을 출력하고, 없으면 단어의 자소가 상기 예외 자소 발음사전 데이터베이스에 등록되어 있는지를 검사하는 제 9 단계;

상기 제 9 단계의 검사결과, 등록되어 있으면 해당 음소를 출력하고, 등록되어 있지 않으면 각 자소별 음소출력 다층 퍼셉트론 파라메터 데이터베이스에 의한 다층 퍼셉트론으로 해당 음소를 출력한 후에, 입력된 단어의 자소수만큼 수행하였는지를 판단하는 제 10 단계; 및

상기 제 10 단계의 판단결과, 입력된 단어의 자소수만큼 수행하지 않았으면 상기 제 9 단계로 넘어가고, 수행하였으면 발음열 후처리 과정을 수행한 후에, 최종 단어 발음열을 출력하는 제 11 단계

를 포함하여 이루어진 발음사전 생성 방법

5 5

제 4 항에 있어서,

상기 제 11 단계의 발음열 후처리 과정은,

발음열중에 동일한 음소가 연결되어 출력된 경우에 이를 하나로 줄여 주거나 묵음의 출력시에 이를 제거하는 것을 특징으로 하는 발음사전 생성 방법

6 6

제 5 항에 있어서,

상기 각 단어는,

영어의 알파벳(자소)으로 구성되는 것을 특징으로 하는 발음사전 생성 방법

7 7

프로세서를 구비한 음성인식시스템에,

신경망을 이용하여 각 자소별로 대응되는 음소를 직접 매핑시키는 다층 퍼셉트론을 학습시켜 예외 단어 발음사전 데이터베이스, 예외 자소 발음사전 데이터베이스, 각 자소별 음소출력 다층 퍼셉트론(MLP) 파라메터 데이터베이스를 구성하는 기능; 및

전처리된 입력 단어에 대해, 상기 예외 단어 발음사전 데이터베이스, 상기 예외 자소 발음사전 데이터베이스, 상기 다층 퍼셉트론 파라메터 데이터베이스를 검사하여 해당 단어의 발음열을 후처리한 후에 출력하는 기능

을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체

지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US06236965 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US6236965 US 미국 DOCDBFAMILY
국가 R&D 정보가 없습니다.