맞춤기술찾기

이전대상기술

음성/비음성 구간 검출 장치 및 방법(APPARATUS AND METHOD FOR DETECTING SPEECH/NON-SPEECH REGION)

  • 기술번호 : KST2017017159
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 음성/비음성 구간 검출 장치 및 방법이 개시된다. 음성/비음성 구간 검출 방법은 스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 단계; 상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 단계; 상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 단계; 상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 단계를 포함할 수 있다.
Int. CL G10L 25/78 (2016.06.08) G10L 25/87 (2016.06.08) G10L 15/14 (2016.06.08) G10L 15/28 (2016.06.08)
CPC G10L 25/78(2013.01) G10L 25/78(2013.01) G10L 25/78(2013.01) G10L 25/78(2013.01)
출원번호/일자 1020160054812 (2016.05.03)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2017-0124854 (2017.11.13) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 장인선 대한민국 대전광역시 유성구
2 서정일 대한민국 대전광역시 유성구
3 안충현 대한민국 대전광역시 유성구
4 양승준 대한민국 대전광역시 유성구
5 최지훈 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 무한 대한민국 서울특별시 강남구 언주로 ***, *층(역삼동,화물재단빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.05.03 수리 (Accepted) 1-1-2016-0428472-08
2 [출원서등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2016.11.23 수리 (Accepted) 1-1-2016-1147188-01
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 단계;상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 단계;상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 단계;상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 단계를 포함하는 음성/비음성 구간 검출 방법
2 2
제1항에 있어서,상기 센터 채널 성분의 프레임 별 에너지를 계산하는 단계를 더 포함하고,상기 판단하는 단계는,상기 센터 채널 성분의 프레임 별 에너지가 임계값 보다 작은 경우 비음성 구간으로 판단하고, 상기 센터 채널 성분의 프레임 별 에너지가 임계값 보다 큰 경우 상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 음성/비음성 구간 검출 방법
3 3
제1항에 있어서,상기 스테레오 오디오 신호의 채널간 관계 정보는,상기 스테레오 오디오 신호의 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보를 포함하는 음성/비음성 구간 검출 방법
4 4
제1항에 있어서,상기 스테레오 오디오 신호의 채널간 관계 정보는,상기 스테레오 오디오 신호의 채널간 상호연관성 정보를 더 포함하는 음성/비음성 구간 검출 방법
5 5
제1항에 있어서,상기 분류하는 단계는,상기 스테레오 오디오 신호의 각 요소 별 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보가 임계치 보다 작으면 센터 채널 성분으로 분류하고, 상기 스테레오 오디오 신호의 각 요소 별 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보가 임계치 보다 크면 서라운드 채널 성분으로 분류하는 음성/비음성 구간 검출 방법
6 6
제1항에 있어서,상기 추출하는 단계는,상기 분류된 센터 채널 성분과 서라운드 채널 성분의 스펙트로그램 값을 이용하여 각각의 특징벡터를 추출하는 음성/비음성 구간 검출 방법
7 7
제1항에 있어서,상기 추출하는 단계는,상기 분류된 센터 채널 성분과 서라운드 채널 성분의 멜 주파수 캡스트럼(Mel-Frequency Cepstral Coefficient; MFCC)를 이용하여 각각의 특징벡터를 추출하는 음성/비음성 구간 검출 방법
8 8
스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 획득부;상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 분류부;상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 추출부;상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 판단부를 포함하는 음성/비음성 구간 검출 장치
9 9
제8항에 있어서,상기 센터 채널 성분의 프레임 별 에너지를 계산하는 계산부를 더 포함하고,상기 판단부는,상기 센터 채널 성분의 프레임 별 에너지가 임계값 보다 작은 경우 비음성 구간으로 판단하고, 상기 센터 채널 성분의 프레임 별 에너지가 임계값 보다 큰 경우 상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 음성/비음성 구간 검출 장치
10 10
제8항에 있어서,상기 분류부는,상기 스테레오 오디오 신호의 각 요소 별 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보가 임계치 보다 작으면 센터 채널 성분으로 분류하고, 상기 스테레오 오디오 신호의 각 요소 별 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보가 임계치 보다 크면 서라운드 채널 성분으로 분류하는 음성/비음성 구간 검출 장치
11 11
스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 단계;상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 단계;상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 단계; 및상기 추출된 각각의 특징벡터를 이용하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 학습하는 단계를 포함하는 음성/비음성 구간 학습 방법
12 12
제11항에 있어서,상기 추출하는 단계는,상기 분류된 센터 채널 성분과 서라운드 채널 성분의 스펙트로그램 값을 이용하여 각각의 특징벡터를 추출하는 음성/비음성 구간 학습 방법
13 13
제11항에 있어서,상기 분류된 센터 채널 성분과 서라운드 채널 성분의 멜 주파수 캡스트럼(Mel-Frequency Cepstral Coefficient; MFCC)를 이용하여 각각의 특징벡터를 추출하는 음성/비음성 구간 학습 방법
14 14
제11항에 있어서,상기 학습하는 단계는,심층신경망(Deep Neural Net; DNN)을 이용하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 학습하는 음성/비음성 구간 학습 방법
15 15
스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 획득부;상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 분류부;상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 추출부; 및상기 추출된 각각의 특징벡터를 이용하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 학습하는 학습부를 포함하는 음성/비음성 구간 학습 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 한국전자통신연구원 방송통신융합미디어원천기술개발 시청각장애인 방송접근권 향상을 위한 디지털자막·음성해설 서비스 기술 개발