기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

합성곱 신경망 기반 환경음 인식 방법 및 시스템

기술번호 : KST2019018684
담당센터 : 대전기술혁신센터
전화번호 : 042-610-2279

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명은 외부로부터 오디오 신호를 입력받아 분석하고 합성곱 신경망을 통해 학습하여 주변 환경에 적합한 환경음으로 출력할 수 있도록 하는 합성곱 신경망 기반 환경음 인식 방법 및 시스템에 관한 것이다. 본 발명에 따른 합성곱 신경망 기반 환경음 인식 시스템은, 오디오 신호를 입력받아 멀티레졸루션 단시간 푸리에 변환(Multi-resolution STFT)과 멜프리퀀시 필터뱅크 변환 및 로그 변환을 통해 멀티레졸루션 로그 멜스펙트로그램을 획득하는 멀티레졸루션 분석부; 상기 멀티레졸루션 로그 멜스펙트로그램을 입력받아 합성곱 연산 및 풀링 연산을 실행하여 환경음 라벨 데이터를 출력하는 합성곱 신경망 모듈부를 포함할 수 있다.
Int. CL	G10L 15/16 (2006.01.01) G10L 15/06 (2006.01.01) G10L 13/02 (2006.01.01)
CPC
출원번호/일자	1020190032038 (2019.03.20)
출원인	한국과학기술원
등록번호/일자
공개번호/일자	10-2019-0110939 (2019.10.01) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보	대한민국 \| 1020180032526 \| 2018.03.21
법적상태	등록
심사진행상태	수리
심판사항
구분	신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2019.03.20)
심사청구항수	10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	한국과학기술원	대한민국	대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	유창동		대전광역시 유성구
2	박현신		대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	특허법인위더피플	대한민국	서울특별시 서대문구 경기대로 *, 진양빌딩 층(충정로*가)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
최종권리자 정보가 없습니다

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2019.03.20	수리 (Accepted)	1-1-2019-0288358-64
2	출원인정보변경(경정)신고서 Notification of change of applicant's information	2019.04.24	수리 (Accepted)	4-1-2019-5081392-49
3	[대리인선임]대리인(대표자)에 관한 신고서 [Appointment of Agent] Report on Agent (Representative)	2019.09.11	수리 (Accepted)	1-1-2019-0936132-20
4	선행기술조사의뢰서 Request for Prior Art Search	2020.03.13	수리 (Accepted)	9-1-9999-9999999-89
5	출원인정보변경(경정)신고서 Notification of change of applicant's information	2020.05.15	수리 (Accepted)	4-1-2020-5108396-12
6	선행기술조사보고서 Report of Prior Art Search	2020.05.28	발송처리완료 (Completion of Transmission)	9-6-2020-0066483-51
7	의견제출통지서 Notification of reason for refusal	2020.05.29	발송처리완료 (Completion of Transmission)	9-5-2020-0372566-18
8	출원인정보변경(경정)신고서 Notification of change of applicant's information	2020.06.12	수리 (Accepted)	4-1-2020-5131486-63
9	[명세서등 보정]보정서 [Amendment to Description, etc.] Amendment	2020.07.29	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2020-0795619-58
10	[거절이유 등 통지에 따른 의견]의견서·답변서·소명서	2020.07.29	수리 (Accepted)	1-1-2020-0795618-13

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 오디오 신호를 입력받아 멀티레졸루션 단시간 푸리에 변환(Multi-resolution Short-Time Fourier Transform)과 멜프리퀀시 필터뱅크 변환 및 로그 변환을 통해 멀티레졸루션 로그 멜스펙트로그램을 획득하는 멀티레졸루션 분석부;상기 멀티레졸루션 로그 멜스펙트로그램을 입력받아 합성곱 연산 및 풀링 연산을 실행하여 환경음 라벨 데이터를 출력하는 합성곱 신경망 모듈부;를 포함하는 합성곱 신경망 기반 환경음 인식 시스템
2	2 제1 항에 있어서,상기 멀티레졸루션 분석부는, 상기 입력된 오디오 신호를 멀티레졸루션 단시간 푸리에 변환(Multi-resolution STFT)을 통해 멀티레졸루션 스펙트로그램(Multi-resolution Spectrogram)으로 변환하고, 상기 멀티레졸루션 스펙트로그램을 비선형 주파수 변환인 멜프리퀀시(mel-frequency)와 삼각 필터뱅크에 기반한 멜프리퀀시 필터뱅크를 통해 멀티레졸루션 멜스펙트로그램(Multi-resolution mel-spectrogram)으로 변환하며, 상기 멀티레졸루션 멜스펙트로그램을 로그 변환해 멀티레졸루션 로그 멜스펙트로그램(Multi-resolution log mel-spectrogram)을 획득하여 상기 합성곱 신경망 모듈부에 출력하는 합성곱 신경망 기반 환경음 인식 시스템
3	3 제1 항에 있어서,상기 오디오 신호를 학습하기 위해 적어도 하나 이상 학습 데이터를 저장하고 있는 학습 데이터 저장부;를 더 포함하는 합성곱 신경망 기반 환경음 인식 시스템
4	4 제1 항에 있어서,상기 멀티레졸루션 로그 멜스펙트로그램을 입력받아 합성곱 연산 및 풀링 연산을 실행하여 획득한 환경음 라벨 데이터를 학습하는 합성곱 신경망 학습 모듈부;를 더 포함하는 합성곱 신경망 기반 환경음 인식 시스템
5	5 제1 항에 있어서,상기 합성곱 신경망 모듈부는, 상기 멀티레졸루션 로그 멜스펙트로그램을 입력받아 합성곱 연산을 수행하는 적어도 하나 이상의 컨볼루션 레이어(Convolution Layer);상기 컨볼루션 레이어에서 출력된 합성곱 연산 데이터를 풀링 연산하는 적어도 하나 이상의 풀링 레이어(Pooling Layer); 상기 적어도 하나 이상의 풀링 레이어에서 출력된 풀링 연산 데이터를 병합하는 병합 레이어(Merging Layer); 및상기 병합 레이어에서 출력되는 데이터를 입력받아 각 환경음에 대한 확률을 출력하는 연결 레이어(fully connected layer);를 포함하는 합성곱 신경망 기반 환경음 인식 시스템
6	6 제5 항에 있어서,상기 컨볼루션 레이어는, 상기 멀티레졸루션 로그 멜스펙트로그램을 입력받아 각 주파수(f) 별로 레이어의 출력을 제곱하고 시간축으로 평균하여 에너지(e_f)를 산출하며, 산출된 에너지(e_f)를 기반으로 각 주파수마다 드랍 아웃(dropout) 확률(p_f)을 결정하는 합성곱 신경망 기반 환경음 인식 시스템
7	7 제5 항에 있어서,상기 연결 레이어는, 상기 병합 레이어에서 출력되는 데이터를 입력받아 신경망(neural network)을 통해 환경음의 각 클래스에 대한 스코어를 계산하고, softmax 함수를 이용하여 각 환경음에 대한 확률을 출력하는 합성곱 신경망 기반 환경음 인식 시스템
8	8 제7 항에 있어서,상기 드랍 아웃(dropout) 확률(p_f)은, 다음 수학식에 따라 산출되는,(a, b는 hyper-parameter)합성곱 신경망 기반 환경음 인식 시스템
9	9 (a) 멀티레졸루션 분석부에서 오디오 신호를 입력받는 단계;(b) 멀티레졸루션 분석부에서 상기 오디오 신호를 멀티레졸루션 단시간 푸리에 변환(Multi-resolution STFT)과 멜프리퀀시(mel-frequency) 필터뱅크 변환 및 로그 변환을 통해 멀티레졸루션 로그 멜스펙트로그램을 획득하는 단계;(c) 합성곱 신경망 모듈부에서 상기 멀티레졸루션 로그 멜스펙트로그램을 입력받는 단계;(d) 컨볼루션 레이어에서 상기 멀티레졸루션 로그 멜스펙트로그램을 합성곱 연산하는 단계;(e) 풀링 레이어에서 상기 합성곱 연산 데이터를 풀링 연산하는 단계;(f) 병합 레이어에서 상기 풀링 연산 데이터를 병합하는 단계; 및(g) 연결 레이어에서 상기 병합 데이터를 입력받아 각 환경음에 대한 확률을 출력하는 단계;를 포함하는 합성곱 신경망 기반 환경음 인식 방법
10	10 제9 항에 있어서,상기 (b) 단계에서 상기 멀티레졸루션 분석부는, 상기 입력된 오디오 신호를 멀티레졸루션 단시간 푸리에 변환(Multi-resolution STFT)을 통해 멀티레졸루션 스펙트로그램(Multi-resolution Spectrogram)으로 변환하고, 상기 멀티레졸루션 스펙트로그램을 비선형 주파수 변환인 멜프리퀀시(mel-frequency)와 삼각 필터뱅크에 기반한 멜프리퀀시 필터뱅크를 통해 멀티레졸루션 멜스펙트로그램(Multi-resolution mel-spectrogram)으로 변환하며, 상기 멀티레졸루션 멜스펙트로그램을 로그 변환해 멀티레졸루션 로그 멜스펙트로그램(Multi-resolution log mel-spectrogram)을 획득하여 상기 합성곱 신경망 모듈부에 출력하는 합성곱 신경망 기반 환경음 인식 방법
11	11 제9 항에 있어서,상기 (d) 단계에서 상기 컨볼루션 레이어는, 상기 멀티레졸루션 로그 멜스펙트로그램을 입력받아 각 주파수(f) 별로 레이어의 출력을 제곱하고 시간축으로 평균하여 에너지(e_f)를 산출하며, 산출된 에너지(e_f)를 기반으로 각 주파수마다 드랍 아웃(dropout) 확률(p_f)을 결정하는 합성곱 신경망 기반 환경음 인식 방법
12	12 제11 항에 있어서,상기 드랍 아웃(dropout) 확률(p_f)은, 다음 수학식에 따라 산출되는,(a, b는 하이퍼 파라미터(hyper-parameter)를 나타냄)합성곱 신경망 기반 환경음 인식 방법
13	13 제9 항에 있어서,상기 (g) 단계에서 상기 연결 레이어는, 상기 병합 레이어에서 출력되는 데이터를 입력받아 신경망(neural network)을 통해 환경음의 각 클래스에 대한 스코어를 계산하고, softmax 함수를 이용하여 각 환경음에 대한 확률을 출력하는 합성곱 신경망 기반 환경음 인식 방법

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2019.03.20	수리 (Accepted)	1-1-2019-0288358-64
2	출원인정보변경(경정)신고서	2019.04.24	수리 (Accepted)	4-1-2019-5081392-49
3	[대리인선임]대리인(대표자)에 관한 신고서	2019.09.11	수리 (Accepted)	1-1-2019-0936132-20
4	선행기술조사의뢰서	2020.03.13	수리 (Accepted)	9-1-9999-9999999-89
5	출원인정보변경(경정)신고서	2020.05.15	수리 (Accepted)	4-1-2020-5108396-12
6	선행기술조사보고서	2020.05.28	발송처리완료 (Completion of Transmission)	9-6-2020-0066483-51
7	의견제출통지서	2020.05.29	발송처리완료 (Completion of Transmission)	9-5-2020-0372566-18
8	출원인정보변경(경정)신고서	2020.06.12	수리 (Accepted)	4-1-2020-5131486-63
9	[명세서등 보정]보정서	2020.07.29	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2020-0795619-58
10	[거절이유 등 통지에 따른 의견]의견서·답변서·소명서	2020.07.29	수리 (Accepted)	1-1-2020-0795618-13

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2024000461][한국과학기술원]	공감 대화를 위한 프롬프트 생성 장치 및 방법	새창보기
[KST2021006592][한국과학기술원]	텍스트 음성 변환과 함께 멀티태스크 학습을 사용한 감정적 음성 변환 방법 및 장치	새창보기
[KST2019021925][한국과학기술원]	사용자와 대화하며 내면 상태를 이해하고 긴밀한 관계를 맺을 수 있는 감성지능형 개인비서 시스템	새창보기
[KST2021010522][한국과학기술원]	전자 장치 및 이의 제어 방법	새창보기
[KST2015117908][한국과학기술원]	은닉 마르코프 모델에 기초하는 음향 모델 구축 장치 및 그방법	새창보기
[KST2015117387][한국과학기술원]	ＷＴＭ을 기반으로 손실함수와 최대마진기법을 통한 음성 감정 인식 모델 구축 방법.	새창보기
[KST2018013953][한국과학기술원]	음성변조를 위한 음성모델 부호화를 이용한 음성합성 기술 및 장치	새창보기
[KST2017017939][한국과학기술원]	웨어러블 디바이스 형태의 뉴로모픽 기기 및 상기 뉴로모픽 기기를 이용한 생체 정보 처리 방법	새창보기
[KST2020016485][한국과학기술원]	사용자 맞춤형 발화선택 장치 및 그를 위한 컴퓨터 프로그램	새창보기
[KST2015119368][한국과학기술원]	음성 인식률의 향상을 위한 음성 인식 지원 방법 및 시스템	새창보기
[KST2019021935][한국과학기술원]	문장 패러프레이즈 인식 기반 대화 시스템 답변 방법	새창보기
[KST2021010537][한국과학기술원]	상향식 주의집중과 하향식 주의집중 인공신경망을 이용한 음성 감정 인식 방법 및 장치	새창보기
[KST2014047210][한국과학기술원]	개인 운율 모델에 기반하여 감정 음성을 합성하기 위한 방법 및 장치 및 기록 매체	새창보기
[KST2021009289][한국과학기술원]	반지도 학습 기반 단어 단위 감정 임베딩과 LSTM 모델을 이용한 대화 내에서 발화의 감정 분류 방법	새창보기
[KST2021003145][한국과학기술원]	음성합성기를 구축하기 위한 음소열 기반의 음성합성 훈련용 문장 선정 장치 및 그 동작 방법	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택