기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

음성/비음성 구간 검출 장치 및 방법(APPARATUS AND METHOD FOR DETECTING SPEECH/NON-SPEECH REGION)

기술번호 : KST2017017159
담당센터 : 대전기술혁신센터
전화번호 : 042-610-2279

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	음성/비음성 구간 검출 장치 및 방법이 개시된다. 음성/비음성 구간 검출 방법은 스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 단계; 상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 단계; 상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 단계; 상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 단계를 포함할 수 있다.
Int. CL	G10L 25/78 (2016.06.08) G10L 25/87 (2016.06.08) G10L 15/14 (2016.06.08) G10L 15/28 (2016.06.08)
CPC	G10L 25/78(2013.01) G10L 25/78(2013.01) G10L 25/78(2013.01) G10L 25/78(2013.01)
출원번호/일자	1020160054812 (2016.05.03)
출원인	한국전자통신연구원
등록번호/일자
공개번호/일자	10-2017-0124854 (2017.11.13) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	공개
심사진행상태	수리
심판사항
구분	신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	N
심사청구항수	15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	한국전자통신연구원	대한민국	대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	장인선	대한민국	대전광역시 유성구
2	서정일	대한민국	대전광역시 유성구
3	안충현	대한민국	대전광역시 유성구
4	양승준	대한민국	대전광역시 유성구
5	최지훈	대한민국	대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	특허법인 무한	대한민국	서울특별시 강남구 언주로 **, 층(역삼동,화물재단빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
최종권리자 정보가 없습니다

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2016.05.03	수리 (Accepted)	1-1-2016-0428472-08
2	[출원서등 보정]보정서 [Amendment to Patent Application, etc.] Amendment	2016.11.23	수리 (Accepted)	1-1-2016-1147188-01

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 단계;상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 단계;상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 단계;상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 단계를 포함하는 음성/비음성 구간 검출 방법
2	2 제1항에 있어서,상기 센터 채널 성분의 프레임 별 에너지를 계산하는 단계를 더 포함하고,상기 판단하는 단계는,상기 센터 채널 성분의 프레임 별 에너지가 임계값 보다 작은 경우 비음성 구간으로 판단하고, 상기 센터 채널 성분의 프레임 별 에너지가 임계값 보다 큰 경우 상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 음성/비음성 구간 검출 방법
3	3 제1항에 있어서,상기 스테레오 오디오 신호의 채널간 관계 정보는,상기 스테레오 오디오 신호의 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보를 포함하는 음성/비음성 구간 검출 방법
4	4 제1항에 있어서,상기 스테레오 오디오 신호의 채널간 관계 정보는,상기 스테레오 오디오 신호의 채널간 상호연관성 정보를 더 포함하는 음성/비음성 구간 검출 방법
5	5 제1항에 있어서,상기 분류하는 단계는,상기 스테레오 오디오 신호의 각 요소 별 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보가 임계치 보다 작으면 센터 채널 성분으로 분류하고, 상기 스테레오 오디오 신호의 각 요소 별 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보가 임계치 보다 크면 서라운드 채널 성분으로 분류하는 음성/비음성 구간 검출 방법
6	6 제1항에 있어서,상기 추출하는 단계는,상기 분류된 센터 채널 성분과 서라운드 채널 성분의 스펙트로그램 값을 이용하여 각각의 특징벡터를 추출하는 음성/비음성 구간 검출 방법
7	7 제1항에 있어서,상기 추출하는 단계는,상기 분류된 센터 채널 성분과 서라운드 채널 성분의 멜 주파수 캡스트럼(Mel-Frequency Cepstral Coefficient; MFCC)를 이용하여 각각의 특징벡터를 추출하는 음성/비음성 구간 검출 방법
8	8 스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 획득부;상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 분류부;상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 추출부;상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 판단부를 포함하는 음성/비음성 구간 검출 장치
9	9 제8항에 있어서,상기 센터 채널 성분의 프레임 별 에너지를 계산하는 계산부를 더 포함하고,상기 판단부는,상기 센터 채널 성분의 프레임 별 에너지가 임계값 보다 작은 경우 비음성 구간으로 판단하고, 상기 센터 채널 성분의 프레임 별 에너지가 임계값 보다 큰 경우 상기 추출된 센터 채널 성분과 서라운드 채널 성분의 특징벡터를 기계 학습을 통해 미리 생성된 통계적 모델에 적용하고, 적용된 결과에 기초하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 판단하는 음성/비음성 구간 검출 장치
10	10 제8항에 있어서,상기 분류부는,상기 스테레오 오디오 신호의 각 요소 별 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보가 임계치 보다 작으면 센터 채널 성분으로 분류하고, 상기 스테레오 오디오 신호의 각 요소 별 채널간 레벨 차이에 대한 정보와 채널간 위상 차이에 대한 정보가 임계치 보다 크면 서라운드 채널 성분으로 분류하는 음성/비음성 구간 검출 장치
11	11 스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 단계;상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 단계;상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 단계; 및상기 추출된 각각의 특징벡터를 이용하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 학습하는 단계를 포함하는 음성/비음성 구간 학습 방법
12	12 제11항에 있어서,상기 추출하는 단계는,상기 분류된 센터 채널 성분과 서라운드 채널 성분의 스펙트로그램 값을 이용하여 각각의 특징벡터를 추출하는 음성/비음성 구간 학습 방법
13	13 제11항에 있어서,상기 분류된 센터 채널 성분과 서라운드 채널 성분의 멜 주파수 캡스트럼(Mel-Frequency Cepstral Coefficient; MFCC)를 이용하여 각각의 특징벡터를 추출하는 음성/비음성 구간 학습 방법
14	14 제11항에 있어서,상기 학습하는 단계는,심층신경망(Deep Neural Net; DNN)을 이용하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 학습하는 음성/비음성 구간 학습 방법
15	15 스테레오 오디오 신호에서 상기 스테레오 오디오 신호의 채널간 관계 정보를 획득하는 획득부;상기 채널간 관계 정보에 기초하여 상기 스테레오 오디오 신호의 각 요소를 센터 채널 성분과 서라운드 채널 성분으로 분류하는 분류부;상기 분류된 센터 채널 성분과 서라운드 채널 성분을 이용하여 각각의 특징벡터를 추출하는 추출부; 및상기 추출된 각각의 특징벡터를 이용하여 상기 스테레오 오디오 신호의 음성/비음성 구간을 학습하는 학습부를 포함하는 음성/비음성 구간 학습 장치

순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번	연구부처	주관기관	연구사업	연구과제
1	미래창조과학부	한국전자통신연구원	방송통신융합미디어원천기술개발	시청각장애인 방송접근권 향상을 위한 디지털자막·음성해설 서비스 기술 개발

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2016.05.03	수리 (Accepted)	1-1-2016-0428472-08
2	[출원서등 보정]보정서	2016.11.23	수리 (Accepted)	1-1-2016-1147188-01

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2016000934][한국전자통신연구원]	켑스트럼 특징벡터에 기반한 음성인식 장치 및 방법	새창보기
[KST2015097793][한국전자통신연구원]	음향 모델 생성 장치 및 방법	새창보기
[KST2015082510][한국전자통신연구원]	핵심어 인식 기반의 탐색 네트워크 제한을 이용한연속음성인식 장치 및 방법	새창보기
[KST2015089192][한국전자통신연구원]	음성 인식 방법 및 장치	새창보기
[KST2020011573][한국전자통신연구원]	단어임베딩을 이용한 음성 인식 시스템 및 그 방법	새창보기
[KST2015092156][한국전자통신연구원]	디바이스 구분 음향모델 누적 적응을 이용한 음성인식 시스템 및 방법	새창보기
[KST2014067340][한국전자통신연구원]	대화형 차량정보서비스를 위한 대화처리 기술	새창보기
[KST2017015148][한국전자통신연구원]	영어 말하기의 운율 및 유창성 평가 장치 및 그 방법(APPARATUS AND METHOD FOR RATING PROSODY AND FLUENCY OF ENGLISH TALK)	새창보기
[KST2015089037][한국전자통신연구원]	언어 모델 가중치 추정 방법 및 이를 위한 장치	새창보기
[KST2015078253][한국전자통신연구원]	음성언어 식별 장치 및 방법	새창보기
[KST2015079744][한국전자통신연구원]	수정된 비터비 알고리즘과 빔폭 및 지속시간을 이용한핵심어 검출기	새창보기
[KST2015093200][한국전자통신연구원]	복소수 라플라시안 통계모델을 이용한 음성 검출기 및 음성 검출 방법	새창보기
[KST2015091132][한국전자통신연구원]	음성인식 성능향상 방법	새창보기
[KST2015090241][한국전자통신연구원]	음성인식 오류 혼돈 행렬을 이용한 클러스터링 장치 및 그 방법	새창보기
[KST2017012537][한국전자통신연구원]	다중 음성인식 결과를 통합한 발화 검증 장치 및 방법(Utterance Verification Device and Method Using Output Result Integration of Multiple Speech Recognition)	새창보기
[KST2016001003][한국전자통신연구원]	엔그램을 이용한 단어 의미 인식 장치	새창보기
[KST2015087495][한국전자통신연구원]	음성인식을 위한 학습과 인식 방법 및 시스템	새창보기
[KST2016001002][한국전자통신연구원]	온라인 비지도 특징 벡터 적응 기법을 이용한 음성 인식 시스템 및 방법	새창보기
[KST2016001063][한국전자통신연구원]	음성 인식 장치 및 방법	새창보기
[KST2015086190][한국전자통신연구원]	음성 인식 시스템	새창보기
[KST2015093868][한국전자통신연구원]	음성 인식 장치 및 방법	새창보기
[KST2015089922][한국전자통신연구원]	최대 로그 우도법 기반의 최적 음향모델 생성 장치 및 방법	새창보기
[KST2015095744][한국전자통신연구원]	부대역의 불확실성 정보를 이용한 잡음환경에서의 음성인식 방법 및 장치	새창보기
[KST2015068675][한국전자통신연구원]	통역 장치 및 방법	새창보기
[KST2015090178][한국전자통신연구원]	음향 모델 훈련 장치 및 그 방법	새창보기
[KST2015085642][한국전자통신연구원]	연령 및 성별을 이용한 사용자 인식 장치 및 방법	새창보기
[KST2015086845][한국전자통신연구원]	음성인식 시스템의 발화검증 방법 및 장치	새창보기
[KST2015097287][한국전자통신연구원]	연속어 음성인식 방법 및 연속어 음성인식 장치	새창보기
[KST2015095196][한국전자통신연구원]	주제어 인식이 가능한 음성인식시스템 및 방법	새창보기
[KST2015091335][한국전자통신연구원]	다국어 공통 음소셋를 이용한 음향모델 재학습방법 및 장치	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택

기술이전 상담신청 드립니다.
기업명
신청자 성명		직책
연락처	- -
이메일	@
상담희망전담센터	※ 사업장(본점) 소재지가 속한 지역의 기술혁신센터를 지정해주세요.