맞춤기술찾기

이전대상기술

톤 카운팅 기반의 음성활성구간 검출 장치 및 방법

  • 기술번호 : KST2020011531
  • 담당센터 : 인천기술혁신센터
  • 전화번호 : 032-420-3580
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 카운팅 기반의 음성활성구간 검출 장치 및 방법이 제공된다. 전처리부는 입력 스펙트로그램을 전처리하여 음성 스펙트로그램과 잡음 스펙트로그램 중 적어도 하나를 출력하고, 이진 마스크 추정부는 음성 스펙트로그램과 잡음 스펙트로그램 중 적어도 하나를 이용하여 음성과 잡음으로 구분되는 이진 마스크를 추정하고, VAD 수행부는 추정된 이진 마스크를 이용하여 상기 입력 스펙트로그램의 t번째 프레임에 존재하는 톤의 개수에 기초하여 상기 스펙트로그램 내에서 음성활성구간 검출(VAD: Voice Activity Detection)을 수행할 수 있다.
Int. CL G10L 25/93 (2013.01.01) G10L 19/028 (2013.01.01) G10L 25/18 (2013.01.01) G10L 25/30 (2013.01.01) G06Q 50/10 (2012.01.01)
CPC G10L 25/93(2013.01) G10L 25/93(2013.01) G10L 25/93(2013.01) G10L 25/93(2013.01) G10L 25/93(2013.01)
출원번호/일자 1020200038930 (2020.03.31)
출원인 한국건설기술연구원, 인트플로우 주식회사
등록번호/일자 10-2136700-0000 (2020.07.16)
공개번호/일자
공고번호/일자 (20200723) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.03.31)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국건설기술연구원 대한민국 경기도 고양시 일산서구
2 인트플로우 주식회사 대한민국 광주광역시 북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 전찬준 경기도 파주시 교하로 **,
2 전광명 광주광역시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인세원 대한민국 서울특별시 서초구 사임당로 **, **층 (서초동, 신영빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 인트플로우 주식회사 광주광역시 북구
2 한국건설기술연구원 경기도 고양시 일산서구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.03.31 수리 (Accepted) 1-1-2020-0335125-49
2 [우선심사신청]심사청구서·우선심사신청서
2020.05.06 수리 (Accepted) 1-1-2020-0457720-23
3 선행기술조사의뢰서
Request for Prior Art Search
2020.05.18 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2020.06.12 발송처리완료 (Completion of Transmission) 9-6-2020-0079606-85
5 의견제출통지서
Notification of reason for refusal
2020.06.22 발송처리완료 (Completion of Transmission) 9-5-2020-0425558-85
6 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2020.06.25 수리 (Accepted) 1-1-2020-0655307-79
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2020.06.25 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2020-0655308-14
8 등록결정서
Decision to grant
2020.07.06 발송처리완료 (Completion of Transmission) 9-5-2020-0462800-42
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.09.08 수리 (Accepted) 4-1-2020-5203313-06
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
입력 스펙트로그램을 전처리하여 음성 스펙트로그램과 잡음 스펙트로그램을 출력하는 전처리부;상기 음성 스펙트로그램과 잡음 스펙트로그램을 이용하여 음성과 잡음으로 구분되는 이진 마스크를 추정하는 이진 마스크 추정부; 및상기 추정된 이진 마스크를 이용하여 상기 입력 스펙트로그램의 t번째 프레임에 존재하는 톤의 개수에 기초하여 상기 스펙트로그램 내에서 음성활성구간 검출(VAD: Voice Activity Detection)을 수행하는 VAD 수행부;를 포함하는 것을 특징으로 하는 톤 카운팅 기반의 음성활성구간 검출 장치
2 2
제1항에 있어서,상기 전처리부가 상기 음성 스펙트로그램과 잡음 스펙트로그램 모두를 출력하는 경우, 상기 이진 마스크 추정부는 다음 식을 이용하여 이진 마스크를 추정하는 것을 특징으로 하는 톤 카운팅 기반의 음성활성구간 검출 장치:여기서, Mi(t,k)는 i번째 스펙트로그램에서 t번째 프레임 중 주파수 k에 해당하는 위치의 마스킹값, Xi(t,k)는 i번째 음성 스펙트로그램의 t번째 프레임 중 주파수 k에 해당하는 위치의 에너지값, Di(t, k)는 i번째 잡음 스펙트로그램의 t번째 프레임 중 주파수 k에 해당하는 위치의 에너지값
3 3
제1항에 있어서,상기 VAD 수행부는,상기 스펙트로그램을 구성하는 다수의 프레임들 별로 톤의 개수를 카운팅하고, 프레임들 별로 카운팅된 톤의 개수가 음성활성구간 판단을 위해 사전에 정해진 최저 톤 개수 및 최대 톤 개수 사이에 속하면 해당 프레임은 음성활성구간을 포함하는 것으로 판단하는 것을 특징으로 하는 톤 카운팅 기반의 음성활성구간 검출 장치
4 4
제3항에 있어서,상기 VAD 수행부는 다음 식을 이용하여 프레임 별로 톤의 개수를 카운팅하는 것을 특징으로 하는 톤 카운팅 기반의 음성활성구간 검출 장치:여기서, Tonei(t)는 i번째 스펙트로그램의 t번째 프레임에 존재하는 톤의 개수, BL과 BH는 각각 음성 대역에 해당하는 주파수 인덱스의 처음과 끝, Mi는 i번째 스펙트로그램에서 t번째 프레임 중 주파수 2k에 해당하는 위치의 마스킹값임
5 5
(A) 전자장치가, 입력 스펙트로그램을 전처리하여 음성 스펙트로그램과 잡음 스펙트로그램을 출력하는 단계;(B) 상기 전자장치가, 상기 음성 스펙트로그램과 잡음 스펙트로그램을 이용하여 음성과 잡음으로 구분되는 이진 마스크를 추정하는 단계; 및(C) 상기 전자장치가, 상기 추정된 이진 마스크를 이용하여 상기 입력 스펙트로그램의 t번째 프레임에 존재하는 톤의 개수에 기초하여 상기 스펙트로그램 내에서 음성활성구간 검출(VAD: Voice Activity Detection)을 수행하는 단계;를 포함하는 것을 특징으로 하는 전자장치의 톤 카운팅 기반의 음성활성구간 검출 방법
6 6
제5항에 있어서,상기 (A) 단계가 상기 음성 스펙트로그램과 잡음 스펙트로그램 모두를 출력하는 경우, 상기 (B) 단계는 다음 식을 이용하여 이진 마스크를 추정하는 것을 특징으로 하는 전자장치의 톤 카운팅 기반의 음성활성구간 검출 방법:여기서, Mi(t,k)는 i번째 스펙트로그램에서 t번째 프레임 중 주파수 k에 해당하는 위치의 마스킹값, Xi(t,k)는 i번째 음성 스펙트로그램의 t번째 프레임 중 주파수 k에 해당하는 위치의 에너지값, Di(t, k)는 i번째 잡음 스펙트로그램의 t번째 프레임 중 주파수 k에 해당하는 위치의 에너지값
7 7
제5항에 있어서,상기 (C) 단계는,상기 스펙트로그램을 구성하는 다수의 프레임들 별로 톤의 개수를 카운팅하고, 프레임들 별로 카운팅된 톤의 개수가 음성활성구간 판단을 위해 사전에 정해진 최저 톤 개수 및 최대 톤 개수 사이에 속하면 해당 프레임은 음성활성구간을 포함하는 것으로 판단하는 것을 특징으로 하는 전자장치의 톤 카운팅 기반의 음성활성구간 검출 방법
8 8
제5항에 있어서,상기 (C) 단계는 다음 식을 이용하여 프레임 별로 톤의 개수를 카운팅하는 것을 특징으로 하는 전자장치의 톤 카운팅 기반의 음성활성구간 검출 방법:여기서, Tonei(t)는 i번째 스펙트로그램의 t번째 프레임에 존재하는 톤의 개수, BL과 BH는 각각 음성 대역에 해당하는 주파수 인덱스의 처음과 끝, Mi는 i번째 스펙트로그램에서 t번째 프레임 중 주파수 2k에 해당하는 위치의 마스킹값임
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국건설기술연구원 인공지능산업원천기술개발(R&D) 재난상황 대응을 위한 청각지능 기반 원거리 음원인지 기술 개발