맞춤기술찾기

이전대상기술

오디오 신호의 코딩을 수행하는 신경망 모델의 훈련을 위한 손실 결정 방법 및 장치

  • 기술번호 : KST2022020766
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 오디오 신호의 코딩을 수행하는 신경망 모델의 훈련을 위한 손실 결정 방법 및 장치가 개시된다. 본 발명의 일실시예에 따른 손실 결정 방법은 입력 신호를 식별하는 단계; 오디오 신호의 코딩을 수행하는 신경망 모델에 상기 입력 신호를 입력하여 출력 신호를 생성하는 단계; 상기 입력 신호 및 상기 출력 신호를 주파수 영역으로 변환하는 단계; 상기 변환된 입력 신호 및 상기 변환된 출력 신호 간의 차이에 기초하여, 부호화 잡음을 결정하는 단계; 심리 음향 모델(psychoacoustic model)에 따른 마스킹 임계치를 결정하는 단계; 상기 부호화 잡음과 상기 마스킹 임계치를 비교하여 잡음-마스킹 비율을 계산하는 단계; 및 상기 잡음-마스킹 비율에 따라 손실을 결정하는 단계를 포함할 수 있다.
Int. CL G10L 25/30 (2013.01.01) G10L 21/0264 (2013.01.01) G10L 19/02 (2006.01.01)
CPC G10L 25/30(2013.01) G10L 21/0264(2013.01) G10L 19/02(2013.01)
출원번호/일자 1020210059407 (2021.05.07)
출원인 한국전자통신연구원, 연세대학교 원주산학협력단
등록번호/일자
공개번호/일자 10-2022-0151997 (2022.11.15) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 20

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
2 연세대학교 원주산학협력단 대한민국 강원도 원주시

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 성종모 대전광역시 유성구
2 백승권 대전광역시 유성구
3 이태진 대전광역시 유성구
4 임우택 대전광역시 유성구
5 장인선 대전광역시 유성구
6 박영철 강원도 원주시
7 변준 강원도 원주시 세계로 ***,
8 신승민 강원도 원주시 원문로*

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 무한 대한민국 서울특별시 강남구 언주로 ***, *층(역삼동,화물재단빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.05.07 수리 (Accepted) 1-1-2021-0532375-02
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
손실 결정 방법에 있어서, 입력 신호를 식별하는 단계; 오디오 신호의 코딩을 수행하는 신경망 모델에 상기 입력 신호를 입력하여 출력 신호를 생성하는 단계; 상기 입력 신호 및 상기 출력 신호를 주파수 영역으로 변환하는 단계;상기 주파수 영역으로 변환된 입력 신호 및 상기 변환된 출력 신호 간의 차이에 기초하여, 부호화 잡음을 결정하는 단계;심리 음향 모델(psychoacoustic model)에 따른 마스킹 임계치를 결정하는 단계; 상기 부호화 잡음과 상기 마스킹 임계치를 비교하여 잡음-마스킹 비율을 계산하는 단계; 및상기 잡음-마스킹 비율에 따라 지각적 손실을 결정하는 단계를 포함하는 손실 결정 방법
2 2
제1항에 있어서, 상기 부호화 잡음과 상기 마스킹 임계치를 멜-주파수 영역으로 변환하는 단계를 더 포함하고, 상기 잡음-마스킹 비율을 계산하는 단계는,상기 멜-주파수 영역으로 변환된 부호화 잡음과 상기 변환된 마스킹 임계치의 차이에 따라 잡음-마스킹 비율을 결정하는, 손실 결정 방법
3 3
제1항에 있어서, 상기 부호화 잡음은, 상기 변환된 입력 신호 및 상기 변환된 출력 신호 간의 차이에 대한 파워 스펙트럼(power spectrum)에 따라 결정되는, 손실 결정 방법
4 4
제1항에 있어서,상기 지각적 손실을 결정하는 단계는,지각 엔트로피(perceptual entropy)를 나타내는 파라미터와 상기 잡음-마스킹 비율을 연산함으로써 상기 지각적 손실을 결정하는, 손실 결정 방법
5 5
제4항에 있어서,상기 손실을 결정하는 단계는,상기 주파수 영역 입력 신호와 상기 마스킹 임계치로부터 지각적 엔트로피(perceptual entropy)를 계산하는 단계; 상기 지각적 엔트로피를 서로 다른 해상도를 갖는 복수의 멜-주파수 영역으로 변환하는 단계; 상기 멜-주파수 영역 지각적 엔트로피부터 각 멜-주파수 영역에 대한 가중치를 계산하는 단계; 및상기 상기 잡음 대 마스크비와 상기 가중치를 연산함으로써 상기 손실을 결정하는 단계를 포함하는, 손실 결정 방법
6 6
제1항에 있어서,상기 지각적 손실을 결정하는 단계는, i) 상기 잡음-마스킹 비율 및 ii) 상기 입력 신호 및 상기 출력 신호의 차이에 따른 오차에 기초하여, 상기 지각적 손실을 결정하는, 손실 결정 방법
7 7
제1항에 있어서,상기 지각적 손실이 최소가 되도록 상기 신경망 모델에 포함되는 파라미터를 업데이트하는 단계를 더 포함하는, 손실 결정 방법
8 8
손실 결정 방법에 있어서, 입력 신호를 식별하는 단계; 오디오 신호의 코딩을 수행하는 신경망 모델에 상기 입력 신호를 적용하여 출력 신호를 생성하는 단계; 상기 입력 신호와 상기 출력 신호의 차이에 기초하여, 오차 손실을 결정하는 단계;i) 상기 입력 신호와 상기 출력 신호의 차이에 따른 부호화 잡음 및 ii) 심리 음향 모델(psychoacoustic model)에 따른 마스킹 임계치를 비교하여 지각적 손실을 결정하는 단계;상기 신경망 모델의 부호화 과정에서 생성되는 잠재 변수에 대한 엔트로피에 기초하여 엔트로피 손실을 결정하는 단계; 및 상기 오차 손실, 지각적 손실 및 엔트로피 제3 손실 중 적어도 하나 이상의 손실을 이용하여 전체 손실을 결정하는 단계를 포함하는 손실 결정 방법
9 9
제8항에 있어서,상기 전체 손실을 결정하는 단계는, 상기 오차 손실, 지각적 손실 및 엔트로피 손실 중 적어도 하나 이상의 가중합으로 상기 전체 손실을 계산하는, 손실 결정 방법
10 10
제8항에 있어서,상기 잠재 변수의 소프트맥스(softmax) 양자화 결과와 하드(hard) 양자화 결과의 차이에 기초하여 양자화 패널티 손실을 결정하는 단계를 더 포함하고,상기 전체 손실을 결정하는 단계는, 상기 오차 손실, 지각적 손실, 양자화 패널티 손실 및 엔트로피 손실 중 적어도 하나 이상의 손실을 이용하여 전체 손실을 계산하는, 손실 결정 방법
11 11
제8항에 있어서,상기 지각적 손실을 결정하는 단계는, 상기 부호화 잡음 및 상기 마스킹 임계치의 차이에 기초하여 결정되는 잡음-마스킹 비율에 따라 상기 지각적 손실을 결정하는, 손실 결정 방법
12 12
손실 결정 장치에 있어서, 상기 손실 결정 장치는 프로세서를 포함하고,상기 프로세서는, 입력 신호를 식별하고, 오디오 신호의 코딩을 수행하는 신경망 모델에 상기 입력 신호를 입력하여 출력 신호를 생성하고, 상기 입력 신호 및 상기 출력 신호를 주파수 영역으로 변환하고, 상기 변환된 입력 신호 및 상기 변환된 출력 신호 간의 차이에 기초하여, 부호화 잡음을 결정하고, 심리 음향 모델(psychoacoustic model)에 따른 마스킹 임계치를 결정하고, 상기 부호화 잡음과 상기 마스킹 임계치를 비교하여 잡음-마스킹 비율을 계산하고, 상기 잡음-마스킹 비율에 따라 지각적 손실을 결정하는,손실 결정 장치
13 13
제12항에 있어서,상기 프로세서는, 상기 부호화 잡음과 상기 마스킹 임계치를 멜-주파수 영역으로 변환하고, 상기 변환된 부호화 잡음과 상기 변환된 마스킹 임계치의 차이에 따라 잡음-마스킹 비율을 결정하는, 손실 결정 장치
14 14
제12항에 있어서, 상기 부호화 잡음은, 상기 변환된 입력 신호 및 상기 변환된 출력 신호 간의 차이에 대한 파워 스펙트럼(power spectrum)에 따라 결정되는, 손실 결정 장치
15 15
제12항에 있어서,상기 프로세서는, 지각 엔트로피(perceptual entropy)를 나타내는 파라미터와 상기 잡음-마스킹 비율을 연산함으로써 상기 지각적 손실을 결정하는, 손실 결정 장치
16 16
제12항에 있어서,상기 프로세서는, i) 상기 잡음-마스킹 비율 및 ii) 상기 입력 신호 및 상기 출력 신호의 차이에 따른 오차에 기초하여, 상기 지각적 손실을 결정하는, 손실 결정 장치
17 17
제12항에 있어서,상기 프로세서는, 상기 지각적 손실이 최소가 되도록 상기 신경망 모델에 포함되는 파라미터를 업데이트하는, 손실 결정 장치
18 18
손실 결정 장치에 있어서, 상기 손실 결정 장치는 프로세서를 포함하고,상기 프로세서는, 입력 신호를 식별하고, 오디오 신호의 코딩을 수행하는 신경망 모델에 상기 입력 신호를 적용하여 출력 신호를 생성하고, 상기 입력 신호와 상기 출력 신호의 차이에 기초하여, 오차 손실을 결정하고, i) 상기 입력 신호와 상기 출력 신호의 차이에 따른 부호화 잡음 및 ii) 심리 음향 모델(psychoacoustic model)에 따른 마스킹 임계치를 비교하여 지각적 손실을 결정하고, 상기 신경망 모델의 부호화 과정에서 생성되는 잠재 변수에 대한 엔트로피에 기초하여 엔트로피 손실을 결정하고, 상기 오차 손실, 지각적 손실 및 엔트로피 제3 손실 중 적어도 하나 이상의 손실을 이용하여 전체 손실을 결정하는손실 결정 장치
19 19
제18항에 있어서,상기 프로세서는, 상기 오차 손실, 지각적 손실 및 엔트로피 손실 중 적어도 하나 이상의 가중합으로 상기 전체 손실을 계산하는, 손실 결정 장치
20 20
제18항에 있어서,상기 프로세서는, 상기 잠재 변수의 소프트맥스(softmax) 양자화 결과와 하드(hard) 양자화 결과의 차이에 기초하여 양자화 패널티 손실을 결정하고, 상기 오차 손실, 지각적 손실, 양자화 패널티 손실 및 엔트로피 손실 중 적어도 하나 이상의 손실을 이용하여 전체 손실을 계산하는, 손실 결정 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국전자통신연구원 정부출연금사업(기관고유사업) 초실감 입체공간 미디어·콘텐츠 원천기술연구