요약 | 본 발명은 외부로부터 수신된 음향 신호의 부가 잡음을 제거하는 입력 신호 음질 향상부, 입력 신호 음질 향상부로부터 음향 신호를 수신하여 음향 신호에 포함된 음성 신호의 끝점을 검출하는 제1 끝점 검출부, 제1 끝점 검출부로부터 수신된 음향 신호에 포함된 음성 신호의 유성음 특징을 추출하는 유성음 특징 추출부, 유성음 특징 추출부에서 추출된 유성음 특징의 판단 기준이 되는 유성음 모델 파라미터를 저장하는 유성음/비유성음 판단 모델부 및 유성음 특징 추출부에서 추출된 유성음 특징을 유성음/비유성음 판단 모델부의 유성음 모델 파라미터를 이용하여 유성음 부분을 판단하는 유성음/비유성음 판별부를 포함하는 음성 신호 판별장치를 제공할 수 있다. 음성 인식, 끝점 탐색, 유성음 검출 |
---|---|
Int. CL | G10L 25/93 (2013.01.01) G10L 21/0208 (2013.01.01) |
CPC | |
출원번호/일자 | 1020070095375 (2007.09.19) |
출원인 | 한국전자통신연구원 |
등록번호/일자 | 10-0930584-0000 (2009.12.01) |
공개번호/일자 | 10-2009-0030063 (2009.03.24) 문서열기 |
공고번호/일자 | (20091209) 문서열기 |
국제출원번호/일자 | |
국제공개번호/일자 | |
우선권정보 | |
법적상태 | 소멸 |
심사진행상태 | 수리 |
심판사항 | |
구분 | |
원출원번호/일자 | |
관련 출원번호 | |
심사청구여부/일자 | Y (2007.09.19) |
심사청구항수 | 13 |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 한국전자통신연구원 | 대한민국 | 대전광역시 유성구 |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 이성주 | 대한민국 | 대전 유성구 |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 신영무 | 대한민국 | 서울특별시 강남구 영동대로 ***(대치동) KT&G타워 *층(에스앤엘파트너스) |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 주식회사 엘젠아이씨티 | 서울특별시 강남구 |
번호 | 서류명 | 접수/발송일자 | 처리상태 | 접수/발송번호 |
---|---|---|---|---|
1 | [특허출원]특허출원서 [Patent Application] Patent Application |
2007.09.19 | 수리 (Accepted) | 1-1-2007-0679619-21 |
2 | [명세서등 보정]보정서 [Amendment to Description, etc.] Amendment |
2008.04.08 | 보정승인간주 (Regarded as an acceptance of amendment) | 1-1-2008-0253510-19 |
3 | 선행기술조사의뢰서 Request for Prior Art Search |
2008.06.11 | 수리 (Accepted) | 9-1-9999-9999999-89 |
4 | 선행기술조사보고서 Report of Prior Art Search |
2008.07.15 | 수리 (Accepted) | 9-1-2008-0045168-82 |
5 | 의견제출통지서 Notification of reason for refusal |
2009.03.27 | 발송처리완료 (Completion of Transmission) | 9-5-2009-0133205-09 |
6 | [거절이유 등 통지에 따른 의견]의견(답변, 소명)서 [Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation) |
2009.05.25 | 수리 (Accepted) | 1-1-2009-0310686-41 |
7 | [명세서등 보정]보정서 [Amendment to Description, etc.] Amendment |
2009.05.25 | 보정승인간주 (Regarded as an acceptance of amendment) | 1-1-2009-0310751-11 |
8 | 출원인정보변경(경정)신고서 Notification of change of applicant's information |
2009.08.04 | 수리 (Accepted) | 4-1-2009-5150899-36 |
9 | 최후의견제출통지서 Notification of reason for final refusal |
2009.09.15 | 발송처리완료 (Completion of Transmission) | 9-5-2009-0384251-19 |
10 | [거절이유 등 통지에 따른 의견]의견(답변, 소명)서 [Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation) |
2009.10.06 | 수리 (Accepted) | 1-1-2009-0611174-14 |
11 | [명세서등 보정]보정서 [Amendment to Description, etc.] Amendment |
2009.10.06 | 보정승인 (Acceptance of amendment) | 1-1-2009-0611199-44 |
12 | 등록결정서 Decision to grant |
2009.11.26 | 발송처리완료 (Completion of Transmission) | 9-5-2009-0486694-80 |
13 | 출원인정보변경(경정)신고서 Notification of change of applicant's information |
2015.02.02 | 수리 (Accepted) | 4-1-2015-0006137-44 |
14 | [대리인선임]대리인(대표자)에 관한 신고서 [Appointment of Agent] Report on Agent (Representative) |
2019.08.22 | 수리 (Accepted) | 1-1-2019-0863621-55 |
번호 | 청구항 |
---|---|
1 |
1 외부로부터 수신된 음향 신호의 부가 잡음을 제거하는 입력 신호 음질 향상부; 상기 입력 신호 음질 향상부로부터 음향 신호를 수신하여 상기 음향 신호에 포함된 음성 신호의 끝점을 검출하는 제1 끝점 검출부; 상기 제1 끝점 검출부로부터 수신된 음향 신호에 포함된 음성 신호의 유성음 특징을 추출하는 유성음 특징 추출부; 상기 유성음 특징 추출부에서 추출된 유성음 특징의 판단 기준이 되는 유성음 모델 파라미터를 저장하는 유성음/비유성음 판단 모델부; 상기 유성음 특징 추출부에서 추출된 유성음 특징을 상기 유성음/비유성음 판단 모델부의 유성음 모델 파라미터를 이용하여 유성음 부분을 판단하는 유성음/비유성음 판별부 및 상기 유성음/비유성음 판별부의 판단 결과 및 제1 끝점 검출부의 검출 결과에 상응하여 수신된 상기 음향 신호에 포함된 음성 신호의 끝점을 검출하는 제2 끝점 검출부 를 포함하는 음성 신호 판별장치 |
2 |
2 삭제 |
3 |
3 제1항에 있어서, 상기 입력 음성 음질 향상부는 위너 필터, 최소 평균 제곱 오류(MMSE : Minimum mean square error) 방식 및 칼만 방식 중 어느 하나의 방식을 사용하여 부가 잡음을 제거한 시간축 신호를 출력하는 것 을 특징으로 하는 음성 신호 판별장치 |
4 |
4 제1항에 있어서, 상기 유성음 특징 추출부는 수신된 연속 음성 신호의 변형 시간-주파수 신호 파라미터(Modified TF parameter), HLFBER(high-to-Low Frequency Band Energy Ratio), 조성(Tonality), CMNDV(Cumulative Mean Normalized Difference Valley), ZCR(Zero-Crossing Rate), LCR(Level-Crossing Rate), PVR(Peak-to-Valley Ratio), ABPSE(Adaptive Band-Partitioning Spectral Entropy), NAP(Normalized Autocorrelation Peak),스펙트럼 엔트로피(Spectral entropy) 및 AMDV(Average Magnitude Difference Valley) 특징을 모두 추출하는 것 을 특징으로 하는 음성 신호 판별장치 |
5 |
5 제1항에 있어서, 상기 유성음/비유성음 판단 모델부는 순수 음성 모델에서 추출된 각 유성음 특징의 임계치 및 경계치, GMM(Gaussian Mixture Model), MLP(Multi-Layer Perceptron) 및 SVM(Support Vector Machine) 방식의 모델 파라미터 값 중 어느 하나를 포함하는 것 을 특징으로 하는 음성 신호 판별장치 |
6 |
6 제1항에 있어서, 상기 유성음/비유성음 판별부는 상기 유성음 특징의 임계치 및 경계치와 상기 추출된 음성 신호의 유성음 특징을 단순 비교하는 방식, 통계적 모델을 이용하는 GMM 방식, 인공 지능을 이용하는 MLP 방식, CART(Classification and Regression Tree) 방식, LRT(Likelihood Ratio Test) 방식 및 SVM 방식 중 어느 하나를 이용하는 것 을 특징으로 하는 음성 신호 판별장치 |
7 |
7 제1항에 있어서, 상기 제1 끝점 검출부는 상기 수신된 음향 신호의 시간-주파수 영역의 에너지 및 엔트로피 기반의 특징을 이용하여 상기 음향 신호에 포함된 음성 신호의 끝점을 검출하고 VSFR(Voiced Speech Frame Ratio)를 이용하여 음성인지 판단하고 음성 마킹 정보를 제공하는 것 을 특징으로 하는 음성 신호 판별장치 |
8 |
8 제1항에 있어서, 상기 제2 끝점 검출부는 GSAP(Global Speech Absence Probability), ZCR, LCR 및 엔트로피 계열의 파라미터 중 어느 하나를 이용하여 상기 음향 신호에 포함된 음성 신호의 끝점을 검출하는 것 을 특징으로 하는 음성 신호 판별장치 |
9 |
9 외부로부터 음향 신호를 수신하는 단계; 상기 입력된 음향 신호의 부가 잡음을 제거하는 단계; 상기 부가 잡음이 제거된 음향 신호를 수신하여 상기 음향 신호에 포함된 음성 신호의 제1 끝점을 검출하는 단계 상기 제1 끝점이 검출된 음성 신호의 유성음 특징들을 추출하는 단계; 상기 추출된 유성음 특징들과 미리 설정된 유성음/비유성음 판단 모델을 비교하여 입력된 음향 신호 중 유성음 부분을 판단하는 단계 및 상기 유성음 부분의 판단 결과에 상응하여 상기 음향 신호에 포함된 음성 신호의 제2 끝점을 검출하는 단계 를 포함하는 음성 신호 판별 방법 |
10 |
10 삭제 |
11 |
11 제9항에 있어서, 상기 음향 신호의 부가 잡음 제거는 위너 필터, 최소 평균 제곱 오류방식 및 칼만 방식 중 어느 하나의 방식을 사용하는 것 을 특징으로 하는 음성 신호 판별 방법 |
12 |
12 제9항에 있어서, 상기 유성음 특징은 수신된 연속 음성 신호의 변형 시간-주파수 신호 파라미터, HLFBER, 조성, CMNDV, ZCR, LCR, PVR, ABPSE, NAP, 스펙트럼 엔트로피 및 AMDV 특징인 것 을 특징으로 하는 음성 신호 판별 방법 |
13 |
13 제9항에 있어서, 상기 유성음/비유성음 판단 모델은 순수 음성 모델에서 추출된 각 유성음 특징의 임계치 및 경계치, GMM, MLP 및 SVM 방식의 모델 파라미터 값 중 어느 하나를 포함하는 것 을 특징으로 하는 음성 신호 판별 방법 |
14 |
14 제9항에 있어서, 상기 유성음 부분을 판단하는 방법은 상기 유성음 특징의 임계치 및 경계치와 상기 추출된 음성 신호의 유성음 특징을 단순 비교하는 방식, 통계적 모델을 이용하는 GMM 방식, 인공 지능을 이용하는 MLP 방식, CART 방식, LRT 방식 및 SVM 방식 중 어느 하나를 이용하는 것 을 특징으로 하는 음성 신호 판별 방법 |
15 |
15 제9항에 있어서, 상기 제1 끝점을 검출하는 단계는 끝점 찾기 방식(EPD : end-point detection)을 적용하여 상기 음향 신호에 포함된 음성 신호의 시작점 및 종료점을 검출하는 단계 를 더 포함하는 음성 신호 판별 방법 |
지정국 정보가 없습니다 |
---|
순번 | 패밀리번호 | 국가코드 | 국가명 | 종류 |
---|---|---|---|---|
1 | US20090076814 | US | 미국 | FAMILY |
순번 | 패밀리번호 | 국가코드 | 국가명 | 종류 |
---|---|---|---|---|
1 | US2009076814 | US | 미국 | DOCDBFAMILY |
순번 | 연구부처 | 주관기관 | 연구사업 | 연구과제 |
---|---|---|---|---|
1 | 정보통신부 | 한국전자통신연구원 | IT신성장동력핵심기술개발사업 | 신성장동력산업용 대용량 대화형 분산 처리 음성인터페이스기술개발 |
특허 등록번호 | 10-0930584-0000 |
---|
표시번호 | 사항 |
---|---|
1 |
출원 연월일 : 20070919 출원 번호 : 1020070095375 공고 연월일 : 20091209 공고 번호 : 특허결정(심결)연월일 : 20091126 청구범위의 항수 : 13 유별 : G10L 11/06 발명의 명칭 : 인간 음성의 유성음 특징을 이용한 음성 판별 방법 및 장치 존속기간(예정)만료일 : 20191202 |
순위번호 | 사항 |
---|---|
1 |
(권리자) 한국전자통신연구원 대전광역시 유성구... |
2 |
(권리자) 주식회사 엘젠아이씨티 서울특별시 강남구... |
2 |
(의무자) 한국전자통신연구원 대전광역시 유성구... |
제 1 - 3 년분 | 금 액 | 276,000 원 | 2009년 12월 02일 | 납입 |
제 4 년분 | 금 액 | 326,000 원 | 2012년 11월 29일 | 납입 |
제 5 년분 | 금 액 | 326,000 원 | 2013년 11월 28일 | 납입 |
제 6 년분 | 금 액 | 228,200 원 | 2014년 11월 28일 | 납입 |
제 7 년분 | 금 액 | 594,000 원 | 2015년 11월 27일 | 납입 |
제 8 년분 | 금 액 | 415,800 원 | 2016년 11월 21일 | 납입 |
제 9 년분 | 금 액 | 415,800 원 | 2017년 11월 29일 | 납입 |
제 10 년분 | 금 액 | 477,500 원 | 2018년 11월 21일 | 납입 |
번호 | 서류명 | 접수/발송일자 | 처리상태 | 접수/발송번호 |
---|---|---|---|---|
1 | [특허출원]특허출원서 | 2007.09.19 | 수리 (Accepted) | 1-1-2007-0679619-21 |
2 | [명세서등 보정]보정서 | 2008.04.08 | 보정승인간주 (Regarded as an acceptance of amendment) | 1-1-2008-0253510-19 |
3 | 선행기술조사의뢰서 | 2008.06.11 | 수리 (Accepted) | 9-1-9999-9999999-89 |
4 | 선행기술조사보고서 | 2008.07.15 | 수리 (Accepted) | 9-1-2008-0045168-82 |
5 | 의견제출통지서 | 2009.03.27 | 발송처리완료 (Completion of Transmission) | 9-5-2009-0133205-09 |
6 | [거절이유 등 통지에 따른 의견]의견(답변, 소명)서 | 2009.05.25 | 수리 (Accepted) | 1-1-2009-0310686-41 |
7 | [명세서등 보정]보정서 | 2009.05.25 | 보정승인간주 (Regarded as an acceptance of amendment) | 1-1-2009-0310751-11 |
8 | 출원인정보변경(경정)신고서 | 2009.08.04 | 수리 (Accepted) | 4-1-2009-5150899-36 |
9 | 최후의견제출통지서 | 2009.09.15 | 발송처리완료 (Completion of Transmission) | 9-5-2009-0384251-19 |
10 | [거절이유 등 통지에 따른 의견]의견(답변, 소명)서 | 2009.10.06 | 수리 (Accepted) | 1-1-2009-0611174-14 |
11 | [명세서등 보정]보정서 | 2009.10.06 | 보정승인 (Acceptance of amendment) | 1-1-2009-0611199-44 |
12 | 등록결정서 | 2009.11.26 | 발송처리완료 (Completion of Transmission) | 9-5-2009-0486694-80 |
13 | 출원인정보변경(경정)신고서 | 2015.02.02 | 수리 (Accepted) | 4-1-2015-0006137-44 |
14 | [대리인선임]대리인(대표자)에 관한 신고서 | 2019.08.22 | 수리 (Accepted) | 1-1-2019-0863621-55 |
기술정보가 없습니다 |
---|
과제고유번호 | 1445006409 |
---|---|
세부과제번호 | 2006-S-036-02 |
연구과제명 | 신성장동력산업용대용량/대화형분산처리음성인터페이스기술개발 |
성과구분 | 출원 |
부처명 | 지식경제부 |
연구관리전문기관명 | 정보통신연구진흥원 |
연구주관기관명 | 한국전자통신연구원 |
성과제출연도 | 2007 |
연구기간 | 200703~200802 |
기여율 | 1 |
연구개발단계명 | 개발연구 |
6T분류명 | IT(정보기술) |
[1020070133391] | 입술움직임 영상 판별 방법 및 그 장치 | 새창보기 |
---|---|---|
[1020070133217] | 음성 인식기의 성능 평가 장치 및 그 방법 | 새창보기 |
[1020070132546] | 어휘 디코딩 방법 및 장치 | 새창보기 |
[1020070131816] | 리모트 컨트롤러 장치 및 이를 이용한 동작 제어 방법 | 새창보기 |
[1020070130950] | 음성인식 장치 및 방법 | 새창보기 |
[1020070128929] | 음성 합성 방법 및 장치 | 새창보기 |
[1020070128926] | 음성 데이터베이스 제공 방법 및 장치 | 새창보기 |
[1020070128550] | EPG 검색 서비스에서의 방송 프로그램명 및 인명 관리방법 | 새창보기 |
[1020070127877] | 음성 송신 기능을 가지는 리모컨, 이를 이용한 EPG 정보검색 시스템 및 방법 | 새창보기 |
[1020070122185] | 혼동 행렬 기반 발화 검증 방법 및 장치 | 새창보기 |
[1020070107705] | 음성 인식 방법 | 새창보기 |
[1020070103555] | 내비게이션용 POI의 이형태 생성방법 및 그 시스템 | 새창보기 |
[1020070103554] | 온톨로지 인스턴스 자동 생성 장치 및 방법 | 새창보기 |
[1020070100368] | 음성 인식 시스템 및 방법 | 새창보기 |
[1020070095457] | 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법 | 새창보기 |
[1020070095401] | 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성인식 방법 및 장치 | 새창보기 |
[1020070095375] | 인간 음성의 유성음 특징을 이용한 음성 판별 방법 및 장치 | 새창보기 |
[1020070094047] | 음성 대화 분석 시스템 및 그 방법 | 새창보기 |
[1020070084301] | 환경 이동을 위한 잡음 적응형 음향 모델 생성 방법 및 장치 | 새창보기 |
[KST2015083249][한국전자통신연구원] | 환경 이동을 위한 잡음 적응형 음향 모델 생성 방법 및 장치 | 새창보기 |
---|---|---|
[KST2015101416][한국전자통신연구원] | 마이크 어레이를 이용한 원격음성입력장치 및 그 원격음성입력 처리방법 | 새창보기 |
[KST2019018607][한국전자통신연구원] | 지향성 마이크를 이용한 음향 이벤트 검출 방법, 그리고 지향성 마이크를 이용한 음향 이벤트 검출 장치 | 새창보기 |
[KST2022017647][한국전자통신연구원] | 음향 이벤트의 인식 방법 및 장치 | 새창보기 |
[KST2018011925][한국전자통신연구원] | 자연어 인식 성능 개선 방법 및 장치 | 새창보기 |
[KST2022005845][한국전자통신연구원] | 단일 채널 음성신호에서 음원분리를 이용한 화자분리 장치 | 새창보기 |
[KST2015082656][한국전자통신연구원] | VoIP 서비스를 위한 잡음 제거 장치 및 방법 | 새창보기 |
[KST2015090449][한국전자통신연구원] | 디코딩 정보를 이용한 끝점 검출 장치 및 그 방법 | 새창보기 |
[KST2015097445][한국전자통신연구원] | DB 구축 방법과 이를 이용한 음성 합성 방법 | 새창보기 |
[KST2015079206][한국전자통신연구원] | 통계적 모델에 기초한 유성음/무성음 판별 장치 및 그 방법 | 새창보기 |
[KST2015084734][한국전자통신연구원] | 다채널 잡음처리 장치 및 방법 | 새창보기 |
[KST2015085285][한국전자통신연구원] | 오디오 판별 장치 및 그 방법 | 새창보기 |
[KST2015085370][한국전자통신연구원] | 사용자 음성을 이용한 위치 추적 장치 및 그 방법 | 새창보기 |
[KST2022005476][한국전자통신연구원] | Zero UI 기반 자동 통역 시스템 및 방법 | 새창보기 |
[KST2014032097][한국전자통신연구원] | 음성인식을 위한 모델기반 왜곡 보상형 잡음 제거 장치 및 방법 | 새창보기 |
[KST2015078033][한국전자통신연구원] | 골 전도 마이크로 입력된 음성신호의 음질 향상방법 | 새창보기 |
[KST2019000156][한국전자통신연구원] | 자동통역 시스템, 디바이스 및 방법 | 새창보기 |
[KST2015075427][한국전자통신연구원] | 음성 인식용 원격 음성 입력기 | 새창보기 |
[KST2015100053][한국전자통신연구원] | 마스킹 확률을 이용한 음성 인식 전처리 방법 및 전처리장치 | 새창보기 |
[KST2020016282][한국전자통신연구원] | 밀집 연결된 하이브리드 뉴럴 네트워크를 이용한 음성 처리 장치 및 방법 | 새창보기 |
[KST2015080843][한국전자통신연구원] | 음성/비음성 검증 방법 및 이를 이용한 음성 인식 장치 | 새창보기 |
[KST2015087606][한국전자통신연구원] | 음성 파형의 포락선 정보를 이용한 음성/비음성 판별 장치및 그 방법 | 새창보기 |
[KST2015087940][한국전자통신연구원] | 음성 신호 전처리 장치 및 방법 | 새창보기 |
[KST2015096475][한국전자통신연구원] | 유성음, 무성음, 묵음 구간 정보를 이용한 음성인식방법 및 음성인식장치 | 새창보기 |
[KST2020003766][한국전자통신연구원] | 가상 현실에서 음향 확대 효과 적용을 위한 음향 신호 제어 방법 및 장치 | 새창보기 |
[KST2015084784][한국전자통신연구원] | 잡음 제거 장치 및 방법 | 새창보기 |
[KST2015089100][한국전자통신연구원] | 묵음 구간 정보를 사용한 오디오 신호의 부호화/복호화 장치 및 방법 | 새창보기 |
[KST2018012343][한국전자통신연구원] | 잡음에 강인한 음성 구간 검출 방법 및 장치 | 새창보기 |
[KST2018005859][한국전자통신연구원] | 자연어 대화체 음성을 인식하는 장치 및 방법(APPARATUS AND METHOD FOR RECOGNIZING NATURAL LANGUAGE DIALOGUE SPEECH) | 새창보기 |
[KST2022022485][한국전자통신연구원] | 학습 모델을 이용한 음향 이벤트의 인식 방법, 학습 모델의 트레이닝 방법 및 이를 수행하는 인식 장치 | 새창보기 |
심판사항 정보가 없습니다 |
---|