맞춤기술찾기

이전대상기술

유성음, 무성음, 묵음 구간 정보를 이용한 음성인식방법 및 음성인식장치

  • 기술번호 : KST2015096475
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 컴퓨터를 이용한 음성인식 응용분야에서 유성음, 무성음, 묵음 구간 정보를 이용한 음성인식방법 및 음성 인식장치에 관한 것으로, 종래의 음성인식장치는 음성신호에 대해 프레임 단위로 특징 벡터를 추출하여 이를 음소나 유사 음소 단위로 모델링한 후, 입력된 미지의 특징 벡터를 탐색기에서 음소나 유사 음소 단위의 모델과 비교하는 방법을 사용하므로써 탐색 시간의 증가 및 인식 대상어의 증가로 인한 모호성이 커졌다. 이에 본 발명은 인간의 음성이 입력되었을 때 입력된 신호중에서 일반적으로 음성인식에 사용되는 기존의 특징 파라메터와 더불어 음성신호를 유성음/무성음/묵음으로 잘 부류화시킬 수 있는 또다른 특징 파라메터를 추가로 추출하여 유성음, 무성음, 및 묵음의 구간을 정확히 부류화시키고, 이 유성음/무성음/묵음으로 부류화된 정보를 음성인식기의 탐색기에서 부가적으로 사용하여 탐색 대상을 축소시킴으로써 기존의 음성인식기에 비해 현저한 탐색 시간의 감축 및 탐색 성능의 향상을 가져오게 하였다.
Int. CL G10L 25/93 (2013.01)
CPC G10L 25/93(2013.01) G10L 25/93(2013.01)
출원번호/일자 1019970069559 (1997.12.17)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-1999-0050440 (1999.07.05) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 거절
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (1997.12.17)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 서영주 대한민국 대전광역시 서구
2 박준 대한민국 대전광역시 유성구
3 황규웅 대한민국 대전광역시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이화익 대한민국 서울시 강남구 테헤란로*길** (역삼동,청원빌딩) *층,***,***호(영인국제특허법률사무소)
2 김명섭 대한민국 서울특별시 강남구 테헤란로**길 *, 테헤란오피스빌딩 ***호 시몬국제특허법률사무소 (역삼동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
1997.12.17 수리 (Accepted) 1-1-1997-0217743-13
2 출원심사청구서
Request for Examination
1997.12.17 수리 (Accepted) 1-1-1997-0217745-04
3 대리인선임신고서
Notification of assignment of agent
1997.12.17 수리 (Accepted) 1-1-1997-0217744-58
4 명세서등보정서
Amendment to Description, etc.
1998.05.18 보정승인 (Acceptance of amendment) 1-1-1997-0217746-49
5 의견제출통지서
Notification of reason for refusal
2000.05.01 발송처리완료 (Completion of Transmission) 9-5-2000-0101484-04
6 거절사정서
Decision to Refuse a Patent
2000.08.05 발송처리완료 (Completion of Transmission) 9-5-2000-0195357-39
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2001.04.19 수리 (Accepted) 4-1-2001-0046046-20
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2002.08.08 수리 (Accepted) 4-1-2002-0065009-76
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1

입력된 파형을 전기적인 신호로 바꾸어 디지털화하는 신호 입력부(10)와;

입력된 음성신호를 정해진 구간으로 프레임화하고, 프레임 단위로 음성의 특성을 나타내는 특징 파라메터를 추출하기 위한 음성인식용 특징 파라메터 추출부(20)와;

입력된 음성신호를 정해진 구간으로 프레임화하고, 프레임 단위로 유성음, 무성음, 묵음의 특성을 나타내는 특징 파라메터를 추출하기 위한 유성음/무성음/묵음 정보 추출용 특징 파라메터 추출부(30)와;

인식에 사용되는 모델들을 각각 유성음, 무성음, 묵음 중에서 일치하는 하나의 음으로 대응시키는 인식 모델별 유성음/ 무성음, 묵음 대응 사전부(40)와;

상기 음성인식용 특징 파라메터 추출부(20)로부터 음성인식용 특징 파라메터를 입력받아 각 인식 모델에 대한 스코어를 계산하고 상기 유성음/무성음/묵음 정보 추출용 특징파라메터 추출부(30)로부터 유/무성음, 묵음 정보 추출용 특징 파라메터를 입력받아 각 인식 모델에 대한 스코어를 계산한 후 소정의 가중치를 각각 부과한 후 가산한 최종 스코어를 바탕으로 가상 경로 제외 및 최상 경로를 탐색하기 위한 탐색기부(50)와;

상기 특징 파라메터 추출부(30)로부터 유성음, 무성음, 묵음 정보추출용 특징 파라메터를 입력받아 매 프레임당 유성음, 무성음, 묵음의 여부를 판정하여 유성음, 무성음, 묵음 정보를 추출하기 위한 유성음/무성음/묵음 정보 추출부(60)와;

상기 탐색기부(50)에서 구해진 음성인식 결과를 출력하는 음성인식 출력부(70)로 구성된 것을 특징으로 하는 유성음, 무성음, 묵음 구간 정보를 이용한 음성인식장치

2 2

제 1 항에 있어서,

상기 인식 모델별 유성음/ 무성음, 묵음 대응 사전부(40)는,

음성인식기에서 정의된 인식 모델들을 유성음, 무성음, 묵음 중의 하나로 대응시키기 위하여 입력되는 인식 모델의 유성음, 무성음, 묵음 여부를 알기 위한 해당 인식 모델의 식별자를 입력받는 인식 모델 식별자 입력부와;

상기 입력된 인식 모델의 식별자에 해당되는 부분을 검색하여 그 인식 모델이 유성음인지 무성음인지 묵음인지를 읽어들이는 인식 모델별 유성음, 무성음, 묵음 대응 관계 검색부와;

상기 구해진 인식 모델의 유성음, 무성음, 묵음 여부에 관한 정보를 탐색기부로 출력하는 인식 모델별 유성음, 무성음, 묵음 대응 관계 출력부로 구성된 것을 특징으로 하는 유성음, 무성음, 묵음 구간 정보를 이용한 음성인식장치

3 3

제 1 항에 있어서,

상기 탐색기부(50)는,

입력된 음성인식용 특징 파라메터와 전체 인식 모델들과의 유사도를 비교하여 전체 인식 모델에 대한 스코어들을 구하기 위한 음성인식용 특징 파라메터 스코어 계산부와;

상기 유/무성음, 묵음 정보 추출부(60)로부터 구해진 프레임당 유성음, 무성음, 묵음 정보의 수치와, 상기 인식 모델별 유/무성음, 묵음 대응 사전부(40)로부터 구해진 인식 모델별 유/무성음, 묵음 여부를 바탕으로 전체 인식 모델에 대한 스코어들을 계산하는 유성음, 무성음, 묵음용 특징 파라메터 스코어 계산부와;

상기 구해진 두 스코어들에 대한 가중치 부여 및 가산하여 결합시키는 가중치 부여 및 가산부와;

탐색 프레임이 마지막 프레임일때까지 경로 제외 및 최상 경로 탐색하는 경로제외 및 최상경로 탐색부와;

상기 경로제외 및 최상경로 탐색을 막지막 프레임까지 수행되었을 경우 시작 프레임에서 마지막 프레임까지 연결된 여러 경로들 중에서 최고의 누적 스코어를 가지는 경로를 선택하여 해당하는 인식 대상어를 출력하기 위한 대상어 출력부로 구성된 것을 특징으로 하는 유성음, 무성음, 묵음 구간 정보를 이용한 음성인식장치

4 4

입력된 파형을 전기적인 신호로 바꾸어 디지털화하는 신호 입력단계와;

입력된 음성신호를 정해진 구간으로 프레임화하고, 프레임 단위로 음성의 특성을 나타내는 특징 파라메터를 추출하기 위한 음성인식용 특징 파라메터 추출단계와;

입력된 음성신호를 정해진 구간으로 프레임화하고, 프레임 단위로 유성음, 무성음, 묵음의 특성을 나타내는 특징 파라메터를 추출하기 위한 유성음/무성음/묵음 정보 추출용 특징 파라메터 추출단계와;

인식에 사용되는 모델들을 각각 유성음, 무성음, 묵음 중에서 일치하는 하나의 음으로 대응시키는 인식 모델별 유성음/ 무성음, 묵음 대응단계와;

상기 음성인식용 특징 파라메터 추출단계에서 얻어진 음성인식용 특징 파라메터에 의거하여 각 인식 모델에 대한 스코어와 상기 유/무성음, 묵음 정보 추출용 특징파라미터 추출단계에서 얻어진 유/무성믐, 묵음정보추출용 특징 파라메터에 의거하여 각 인식모델에 대한 스코어를 모두 계산하고 소정의 가중치를 각각 부과한 후 가산한 최종 스코어를 바탕으로 가상 경로 제외 및 최상 경로를 탐색하기 위한 탐색단계와;

상기 특징 파라메터 추출단계에서 얻어진 유성음, 무성음, 묵음 정보추출용 특징 파라메터에 의거하여 매 프레임당 유성음, 무성음, 묵음의 여부를 판정하여 유성음, 무성음, 묵음 정보를 추출하기 위한 유성음/무성음/묵음 정보 추출단계와;

상기 탐색단계에서 구해진 음성인식 결과를 출력하는 음성인식 출력단계를 수행하는 것을 특징으로 하는 유성음, 무성음, 묵음 구간 정보를 이용한 음성인식방법

5 5

제 4 항에 있어서,

상기 인식 모델별 유성음/ 무성음, 묵음 대응단계는,

음성인식기에서 정의된 인식 모델들을 유성음, 무성음, 묵음 중의 하나로 대응시키기 위하여 입력되는 인식 모델의 유성음, 무성음, 묵음 여부를 알기 위한 해당 인식 모델의 식별자를 입력받는 인식 모델 식별자 입력단계와;

상기 입력된 인식 모델의 식별자에 해당되는 부분을 검색하여 그 인식 모델이 유성음인지 무성음인지 묵음인지를 읽어들이는 인식 모델별 유성음, 무성음, 묵음 대응 관계 검색단계와;

상기 구해진 인식 모델의 유성음, 무성음, 묵음 여부에 관한 정보를 출력하는 인식 모델별 유성음, 무성음, 묵음 대응 관계 출력단계를 수행하는 것을 특징으로 하는 유성음, 무성음, 묵음 구간 정보를 이용한 음성인식방법

6 6

제 4 항에 있어서,

상기 탐색단계는,

입력된 음성인식용 특징 파라메터와 전체 인식 모델들과의 유사도를 비교하여 전체 인식 모델에 대한 스코어들을 구하기 위한 음성인식용 특징 파라메터 스코어 계산단계와;

상기 유/무성음, 묵음 정보 추출단계로부터 구해진 프레임당 유성음, 무성음, 묵음 정보의 수치와, 상기 인식 모델별 유/무성음, 묵음 대응단계로부터 구해진 인식 모델별 유/무성음, 묵음 여부에 의거하여 전체 인식 모델에 대한 스코어들을 계산하는 유성음, 무성음, 묵음용 특징 파라메터 스코어 계산단계와;

상기 구해진 두 스코어들에 대한 가중치 부여 및 가산하여 결합시키는 가중치 부여 및 가산단계와;

탐색 프레임이 마지막 프레임일때까지 반복하여 경로 제외 및 최상 경로 탐색하는 경로제외 및 최상경로 탐색단계와;

상기 경로제외 및 최상경로 탐색을 마지막 프레임까지 수행되었을 경우 시작 프레임에서 마지막 프레임까지 연결된 여러 경로들 중에서 최고의 누적 스코어를 가지는 경로를 선택하여 해당하는 인식 대상어를 출력하는 대상어 출력단계를 수행하는 것을 특징으로 하는 유성음, 무성음, 묵음 구간 정보를 이용한 음성인식방법

지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.