요약 | 본 발명은 음향 수신부와 영상 수신부가 구비된 음성 구간 검출 장치에 있어서, 상기 영상 수신부로부터 출력되는 영상 프레임에서 움직임 영역을 검출하고, 상기 검출된 움직임 영역에 입술 움직임 영상 특징 정보를 적용하여 입술 움직임 신호를 검출하는 입술 움직임 신호 검출부, 상기 음향 수신부로부터 출력되는 음향 프레임과 상기 입술 움직임 신호 검출부에서 검출된 입술 움직임 신호를 이용하여 음성 구간을 검출하는 음성 구간 검출부를 포함하는 것으로서, 음성구간 검출과정에서 입술움직임 영상정보를 확인하기 때문에 dynamic 잡음이 음성으로 오인식 되는 것을 미리 방지할 수 있다. 음성구간, 음성인식, 입술움직임 |
---|---|
Int. CL | G10L 25/78 (2013.01) G10L 15/25 (2013.01) |
CPC | G10L 25/78(2013.01) G10L 25/78(2013.01) |
출원번호/일자 | 1020060064262 (2006.07.10) |
출원인 | 한국전자통신연구원 |
등록번호/일자 | 10-0820141-0000 (2008.04.01) |
공개번호/일자 | 10-2007-0061207 (2007.06.13) 문서열기 |
공고번호/일자 | (20080408) 문서열기 |
국제출원번호/일자 | |
국제공개번호/일자 | |
우선권정보 |
대한민국 | 1020050120040 | 2005.12.08
|
법적상태 | 등록 |
심사진행상태 | 수리 |
심판사항 | 심판사항 |
구분 | |
원출원번호/일자 | |
관련 출원번호 | |
심사청구여부/일자 | Y (2006.07.10) |
심사청구항수 | 7 |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 한국전자통신연구원 | 대한민국 | 대전광역시 유성구 |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 이수종 | 대한민국 | 대전광역시 유성구 |
2 | 김상훈 | 대한민국 | 대전광역시 유성구 |
3 | 이영직 | 대한민국 | 대전광역시 서구 |
4 | 김응규 | 대한민국 | 대전 서구 |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 신영무 | 대한민국 | 서울특별시 강남구 영동대로 ***(대치동) KT&G타워 *층(에스앤엘파트너스) |
번호 | 이름 | 국적 | 주소 |
---|---|---|---|
1 | 퓨렌스 주식회사 | 서울특별시 금천구 |
번호 | 서류명 | 접수/발송일자 | 처리상태 | 접수/발송번호 |
---|---|---|---|---|
1 | 특허출원서 Patent Application |
2006.07.10 | 수리 (Accepted) | 1-1-2006-0490628-76 |
2 | 선행기술조사의뢰서 Request for Prior Art Search |
2007.06.07 | 수리 (Accepted) | 9-1-9999-9999999-89 |
3 | 선행기술조사보고서 Report of Prior Art Search |
2007.07.11 | 수리 (Accepted) | 9-1-2007-0038715-58 |
4 | 의견제출통지서 Notification of reason for refusal |
2007.08.24 | 발송처리완료 (Completion of Transmission) | 9-5-2007-0457376-27 |
5 | [거절이유 등 통지에 따른 의견]의견(답변, 소명)서 [Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation) |
2007.10.22 | 수리 (Accepted) | 1-1-2007-0752376-78 |
6 | [명세서등 보정]보정서 [Amendment to Description, etc.] Amendment |
2007.10.22 | 보정승인간주 (Regarded as an acceptance of amendment) | 1-1-2007-0752392-09 |
7 | 거절결정서 Decision to Refuse a Patent |
2008.02.14 | 발송처리완료 (Completion of Transmission) | 9-5-2008-0075612-94 |
8 | 명세서 등 보정서(심사전치) Amendment to Description, etc(Reexamination) |
2008.02.22 | 보정승인 (Acceptance of amendment) | 7-1-2008-0007015-67 |
9 | 등록결정서 Decision to grant |
2008.03.28 | 발송처리완료 (Completion of Transmission) | 9-5-2008-0173024-23 |
10 | 출원인정보변경(경정)신고서 Notification of change of applicant's information |
2009.08.04 | 수리 (Accepted) | 4-1-2009-5150899-36 |
11 | 출원인정보변경(경정)신고서 Notification of change of applicant's information |
2015.02.02 | 수리 (Accepted) | 4-1-2015-0006137-44 |
번호 | 청구항 |
---|---|
1 |
1 삭제 |
2 |
2 삭제 |
3 |
3 삭제 |
4 |
4 음향 수신부와 영상 수신부가 구비된 음성 인식 시스템에서 음성 구간을 검출하는 방법에 있어서,상기 음향 수신부로부터 출력되는 음향 프레임을 대상으로 정적 잡음을 제거하고, 상기 잡음이 제거된 음향 프레임이 음성 가능 프레임인지를 판단하는 단계;상기 판단결과 상기 음향 프레임이 음성 가능 프레임이면, 상기 음성 가능 프레임이 검출되는 시점에 영상 프레임에서 입술 움직임 신호가 검출되는지를 판단하는 단계;상기 판단결과 상기 영상 프레임에서 입술 움직임 신호가 검출되면, 상기 음성 가능 프레임을 음성 프레임으로 판단하여 저장하고, 음성 프레임의 개수가 미리 정해진 일정 개수 이상인지를 판단하는 단계;및상기 판단결과 음성 프레임의 개수가 미리 정해진 일정 개수 이상이면, 해당 음성 프레임들을 음성 구간으로 검출하는 단계를 포함하는 것을 특징으로 하는 음성 구간 검출 방법 |
5 |
5 제4항에 있어서, 상기 음향 수신부로부터 출력되는 음향 프레임의 정적 잡음을 제거하는 것은 상기 음향 프레임에 대해 저역 통과 필터링을 수행하여 고역 성분을 제거하는 것을 특징으로 하는 음성 구간 검출 방법 |
6 |
6 제4항에 있어서, 상기 잡음이 제거된 음향 프레임이 음성 가능 프레임인지를 판단하는 단계는, 상기 잡음이 제거된 음향 프레임에 대해 절대 에너지 크기와 영교차율을 분석하여 음성 가능 프레임 또는 잡음 프레임인지를 판단하는 것을 특징으로 하는 음성 구간 검출 방법 |
7 |
7 제4항에 있어서, 상기 음성 가능 프레임이 검출되는 시점에 영상 프레임에서 입술 움직임 신호가 검출되는지를 판단하는 단계는, 연속으로 수신되는 영상 프레임에서 이전 프레임과 현재 프레임을 픽셀 단위로 픽셀값을 비교하여 움직임 영역을 검출하는 단계;상기 검출된 움직임 영역별로 그 크기, 폭, 길이, 위치 정보를 파악하는 단계;및상기 파악된 움직임 영역의 특징에 입술 움직임 영상 특징 정보를 적용하여 입술 움직임 영역인지를 판단하고 그 판단결과에 따라 입술 움직임 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 음성 구간 검출 방법 |
8 |
8 제7항에 있어서, 상기 입술 움직임 영상 특징 정보는 입술의 모양과 입술의 변화를 포함하는 것을 특징으로 하는 음성 구간 검출 방법 |
9 |
9 제7항에 있어서, 상기 파악된 움직임 영역의 특징에 입술 움직임 영상 특징 정보를 적용하여 입술 움직임 영역인지를 판단하고 그 판단결과에 따라 입술 움직임 신호를 검출하는 단계는,상기 파악된 움직임 영역의 특징과 상기 입술 움직임 영상 특징 정보를 비교하여 유사도를 구하는 단계;상기 구해진 유사도가 미리 정해진 일정 값 이상이면, 입술 움직임 영역으로 판단하여 입술 움직임 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 음성 구간 검출 방법 |
10 |
10 제4항에 있어서, 상기 판단결과 상기 영상 프레임에서 입술 움직임 신호가 검출되지 않으면, 해당 음성 가능 프레임을 동적 잡음으로 판단하는 단계를 더 포함하는 것을 특징으로 하는 음성 구간 검출 방법 |
11 |
11 삭제 |
12 |
12 삭제 |
지정국 정보가 없습니다 |
---|
순번 | 패밀리번호 | 국가코드 | 국가명 | 종류 |
---|---|---|---|---|
1 | JP04795919 | JP | 일본 | FAMILY |
2 | JP19156493 | JP | 일본 | FAMILY |
3 | US07860718 | US | 미국 | FAMILY |
4 | US20070136071 | US | 미국 | FAMILY |
순번 | 패밀리번호 | 국가코드 | 국가명 | 종류 |
---|---|---|---|---|
1 | JP2007156493 | JP | 일본 | DOCDBFAMILY |
2 | JP4795919 | JP | 일본 | DOCDBFAMILY |
3 | US2007136071 | US | 미국 | DOCDBFAMILY |
4 | US7860718 | US | 미국 | DOCDBFAMILY |
국가 R&D 정보가 없습니다. |
---|
특허 등록번호 | 10-0820141-0000 |
---|
표시번호 | 사항 |
---|---|
1 |
출원 연월일 : 20060710 출원 번호 : 1020060064262 공고 연월일 : 20080408 공고 번호 : 특허결정(심결)연월일 : 20080328 청구범위의 항수 : 4 유별 : G10L 11/02 발명의 명칭 : 음성 구간 검출 장치 및 방법 그리고 음성 인식 시스템 존속기간(예정)만료일 : |
순위번호 | 사항 |
---|---|
1 |
(권리자) 한국전자통신연구원 대전광역시 유성구... |
2 |
(권리자) 퓨렌스 주식회사 서울특별시 금천구... |
2 |
(의무자) 한국전자통신연구원 대전광역시 유성구... |
제 1 - 3 년분 | 금 액 | 190,500 원 | 2008년 04월 02일 | 납입 |
제 4 년분 | 금 액 | 194,000 원 | 2011년 04월 04일 | 납입 |
제 5 년분 | 금 액 | 194,000 원 | 2012년 03월 30일 | 납입 |
제 6 년분 | 금 액 | 128,000 원 | 2013년 03월 25일 | 납입 |
제 7 년분 | 금 액 | 252,000 원 | 2014년 03월 27일 | 납입 |
제 8 년분 | 금 액 | 252,000 원 | 2015년 03월 27일 | 납입 |
제 9 년분 | 금 액 | 252,000 원 | 2016년 01월 29일 | 납입 |
제 10 년분 | 금 액 | 460,000 원 | 2017년 03월 07일 | 납입 |
제 11 년분 | 금 액 | 460,000 원 | 2018년 03월 30일 | 납입 |
제 12 년분 | 금 액 | 230,000 원 | 2019년 03월 12일 | 납입 |
제 13 년분 | 금 액 | 290,000 원 | 2020년 03월 10일 | 납입 |
번호 | 서류명 | 접수/발송일자 | 처리상태 | 접수/발송번호 |
---|---|---|---|---|
1 | 특허출원서 | 2006.07.10 | 수리 (Accepted) | 1-1-2006-0490628-76 |
2 | 선행기술조사의뢰서 | 2007.06.07 | 수리 (Accepted) | 9-1-9999-9999999-89 |
3 | 선행기술조사보고서 | 2007.07.11 | 수리 (Accepted) | 9-1-2007-0038715-58 |
4 | 의견제출통지서 | 2007.08.24 | 발송처리완료 (Completion of Transmission) | 9-5-2007-0457376-27 |
5 | [거절이유 등 통지에 따른 의견]의견(답변, 소명)서 | 2007.10.22 | 수리 (Accepted) | 1-1-2007-0752376-78 |
6 | [명세서등 보정]보정서 | 2007.10.22 | 보정승인간주 (Regarded as an acceptance of amendment) | 1-1-2007-0752392-09 |
7 | 거절결정서 | 2008.02.14 | 발송처리완료 (Completion of Transmission) | 9-5-2008-0075612-94 |
8 | 명세서 등 보정서(심사전치) | 2008.02.22 | 보정승인 (Acceptance of amendment) | 7-1-2008-0007015-67 |
9 | 등록결정서 | 2008.03.28 | 발송처리완료 (Completion of Transmission) | 9-5-2008-0173024-23 |
10 | 출원인정보변경(경정)신고서 | 2009.08.04 | 수리 (Accepted) | 4-1-2009-5150899-36 |
11 | 출원인정보변경(경정)신고서 | 2015.02.02 | 수리 (Accepted) | 4-1-2015-0006137-44 |
기술정보가 없습니다 |
---|
과제고유번호 | 1440000839 |
---|---|
세부과제번호 | 2005-S-006 |
연구과제명 | 언어정보처리기술개발 |
성과구분 | 등록 |
부처명 | 지식경제부 |
연구관리전문기관명 | 정보통신연구진흥원 |
연구주관기관명 | 한국전자통신연구원 |
성과제출연도 | 2005 |
연구기간 | 200301~200512 |
기여율 | 1 |
연구개발단계명 | 응용연구 |
6T분류명 | IT(정보기술) |
과제고유번호 | 1440000839 |
---|---|
세부과제번호 | 2005-S-006 |
연구과제명 | 언어정보처리기술개발 |
성과구분 | 출원 |
부처명 | 지식경제부 |
연구관리전문기관명 | 정보통신연구진흥원 |
연구주관기관명 | 한국전자통신연구원 |
성과제출연도 | 2005 |
연구기간 | 200301~200512 |
기여율 | 1 |
연구개발단계명 | 응용연구 |
6T분류명 | IT(정보기술) |
[1020060077948] | 발화검증을 위한 임계치값 자동 갱신을 이용한 음성인식장치 및 방법 | 새창보기 |
---|---|---|
[1020060068989] | 단어 끝점 검출 오류 보상을 가지는 비터비 디코딩 방법 | 새창보기 |
[1020060066884] | GMM을 이용한 음질향상 시스템 | 새창보기 |
[1020060064262] | 음성 구간 검출 장치 및 방법 그리고 음성 인식 시스템 | 새창보기 |
[1020060060378] | 분산 음성 인식 시스템에서 음성 신호의 코딩 방법 및 그장치 | 새창보기 |
[1020060060374] | 의미공기정보 지식베이스 구축 방법 및 장치 | 새창보기 |
[1020060060365] | 음성 대화 시스템에서 답변 문장 생성 방법 및 장치 | 새창보기 |
[1020060059135] | 대화흐름 제어를 위한 화행기반 VoiceXML 대화장치및 방법 | 새창보기 |
[1020060056935] | 대화형 음성 인터페이스 시스템에서의 사용자 편의성증대 방법 | 새창보기 |
[1020060056203] | 제한적인 도메인의 문서를 대상으로 특화된 자동 번역 장치및 방법 | 새창보기 |
[1020060056201] | 태깅된 도메인 코퍼스 없이 새로운 도메인에 적용 가능한통계적 HMM 품사 태깅 장치 및 방법 | 새창보기 |
[1020060056194] | 질의응답 시스템에 있어서 다중 정답 추출 방법 및 장치 | 새창보기 |
[1020060056184] | 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의대역어 사전 구축 장치 및 방법 | 새창보기 |
[1020060053775] | 음성 인식 장치 및 방법 | 새창보기 |
[1020060043308] | 연결어미 제약을 이용한 한국어 주어의 생략 성분 복원방법 및 장치 | 새창보기 |
[1020060030127] | 기존 대역 전자사전의 어휘 대역어 공기 정보 및 확률정보를 이용한 복합명사 대역어 생성 장치 및 방법 | 새창보기 |
[1020050120977] | 학습 데이터 구축 장치 및 방법 | 새창보기 |
[1020050120412] | 하이픈 포함 미등록어의 대역어 선택 방법 및 장치 | 새창보기 |
[1020050120301] | 화자적응 방법 및 장치 | 새창보기 |
[1020050119975] | 개체명 인식을 이용한 대화 분석 장치 및 방법 | 새창보기 |
[1020050119974] | 대화형 음성 인터페이스 시스템에서의 예외 상황 처리 방법및 장치 | 새창보기 |
[1020050118987] | 나열 및 병렬형 구문 분석 장치 및 방법 | 새창보기 |
[1020050106861] | 음성합성을 위한 끊어읽기 장치 및 방법 | 새창보기 |
[1020050106584] | 발화 스타일 조절을 위한 운율모델 생성 방법 및 이를이용한 대화체 음성합성 장치 및 방법 | 새창보기 |
[1020050091532] | 주파수 영역 등화 장치 및 그 방법 | 새창보기 |
[1020050069041] | 음성/비음성 검증 방법 및 이를 이용한 음성 인식 장치 | 새창보기 |
[1020050066713] | XML을 이용한 텍스트 정규화 방법 및 장치 | 새창보기 |
[1020050064096] | 템플릿에 기반한 기록정보 색인 및 검색 방법과 이를이용한 질의응답 시스템 | 새창보기 |
[1020050043538] | 번역 메모리 확장 방법 및 이를 이용한 기계번역 시스템 | 새창보기 |
[1020050039411] | DB 구축 방법과 이를 이용한 음성 합성 방법 | 새창보기 |
[1020050037093] | N-gram 네트워크를 이용하는 한국어 연속음성인식의언어모델 적응장치 및 그 방법 | 새창보기 |
[1020050020033] | 명사 의미코드 부착 방법 및 그 장치 | 새창보기 |
[1020050017658] | 전문 분야의 부분 대역 패턴 데이터베이스 자동 구축 장치및 그 방법 | 새창보기 |
[1020040109129] | 음성인식 시스템에서의 SVM 기반 멀티플 반모델을사용한 발화검증 장치 및 방법 | 새창보기 |
[1020040106610] | 화행 정보를 이용한 대화체 음성합성 시스템 및 방법 | 새창보기 |
[1020040102495] | 어휘 개념망 구축을 위한 상위어 자동 추천 방법 | 새창보기 |
[KST2019018607][한국전자통신연구원] | 지향성 마이크를 이용한 음향 이벤트 검출 방법, 그리고 지향성 마이크를 이용한 음향 이벤트 검출 장치 | 새창보기 |
---|---|---|
[KST2022017647][한국전자통신연구원] | 음향 이벤트의 인식 방법 및 장치 | 새창보기 |
[KST2015081855][한국전자통신연구원] | 화상 분석을 이용한 음성 인식 방법 및 장치 | 새창보기 |
[KST2015084396][한국전자통신연구원] | 캡스트럼 평균 차감 방법 및 그 장치 | 새창보기 |
[KST2015090148][한국전자통신연구원] | 음성 끝점 검출 방법 및 장치 | 새창보기 |
[KST2018006624][한국전자통신연구원] | 자연어 발화 음성 판별 시스템 및 방법(SYSTEM AND METHOD FOR CLASSIFYING SPONTANEOUS SPEECH) | 새창보기 |
[KST2018011925][한국전자통신연구원] | 자연어 인식 성능 개선 방법 및 장치 | 새창보기 |
[KST2020014199][한국전자통신연구원] | 음향 이벤트 별로 특성을 고려한 음향 이벤트 검출 방법 및 장치 | 새창보기 |
[KST2015091022][한국전자통신연구원] | 자동 통역 방법 | 새창보기 |
[KST2016016337][한국전자통신연구원] | 음성 인식 장치 및 방법(SPEECH RECOGNITION APPARATUS AND METHOD) | 새창보기 |
[KST2017017159][한국전자통신연구원] | 음성/비음성 구간 검출 장치 및 방법(APPARATUS AND METHOD FOR DETECTING SPEECH/NON-SPEECH REGION) | 새창보기 |
[KST2015076300][한국전자통신연구원] | 연속 피치 정보를 이용한 음성 검출 방법 | 새창보기 |
[KST2015085285][한국전자통신연구원] | 오디오 판별 장치 및 그 방법 | 새창보기 |
[KST2015084381][한국전자통신연구원] | 텔레매틱스 장치를 위한 음성인식 장치 및 그 방법 | 새창보기 |
[KST2015082345][한국전자통신연구원] | 적응형 발성 화면 분석 방법 및 장치 | 새창보기 |
[KST2015100383][한국전자통신연구원] | 음성신호의실시간음성부검출방법 | 새창보기 |
[KST2015077773][한국전자통신연구원] | 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법 | 새창보기 |
[KST2015094167][한국전자통신연구원] | 연속된 짧은 펄스로 구성된 소리를 인식하는 방법 | 새창보기 |
[KST2015101650][한국전자통신연구원] | 음성/무음성 구간 검출 방법 및 장치 | 새창보기 |
번호 | 심판번호(숫자) | 심판번호(문자) | 사건의표시 | 청구일 | 심결일자 |
---|---|---|---|---|---|
1 | 2008101001388 | 2008원1388 | 2006년 특허출원 제0064262호 거절결정불복심판 | 2008.02.22 | 2008.03.28 |