기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

소리 데이터 분류 장치 및 방법

기술번호 : KST2019001324
담당센터 : 대전기술혁신센터
전화번호 : 042-610-2279

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명의 일 실시예에 따른 소리 데이터 분류 방법은, 복수의 훈련용 음성 데이터 각각과 복수의 훈련용 비음성 데이터 각각에 대한, 한 종류 이상의 특징 파라미터의 값을 산출하는 제 1 단계, 상기 훈련용 음성 데이터 각각에 대한 상기 특징 파라미터의 값의 분포로부터 획득되는 제 1 분포 함수와, 상기 훈련용 비음성 데이터 각각에 대한 상기 특징 파라미터의 값의 분포로부터 획득되는 제 2 분포 함수를 포함하는 테스트 모델을 생성하는 제 2 단계, 대상 소리 데이터에 대한 상기 특징 파라미터의 값을 산출하는 제 3 단계 및 상기 테스트 모델 및 상기 대상 소리 데이터에 대해 산출된 상기 특징 파라미터의 값에 기초하여, 상기 대상 소리 데이터가 음성 데이터와 비음성 데이터 중 어느 쪽에 속하는지 판단하는 제 4 단계를 포함할 수 있다.
Int. CL	G10L 21/0272 (2013.01.01) G10L 25/18 (2013.01.01) G10L 25/51 (2013.01.01)
CPC	G10L 21/0272(2013.01) G10L 21/0272(2013.01) G10L 21/0272(2013.01)
출원번호/일자	1020170104407 (2017.08.17)
출원인	국방과학연구소
등록번호/일자
공개번호/일자	10-2019-0019464 (2019.02.27) 문서열기
공고번호/일자	문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	등록
심사진행상태	수리
심판사항
구분	신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2017.08.17)
심사청구항수	17

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	국방과학연구소	대한민국	대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	강상원	대한민국	경기도 성남시 분당구
2	이현성	대한민국	강원

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	제일특허법인(유)	대한민국	서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
1	국방과학연구소		대전광역시 유성구

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2017.08.17	수리 (Accepted)	1-1-2017-0795486-89
2	의견제출통지서 Notification of reason for refusal	2018.10.30	발송처리완료 (Completion of Transmission)	9-5-2018-0738253-69
3	[명세서등 보정]보정서 [Amendment to Description, etc.] Amendment	2018.12.28	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2018-1319338-67
4	[거절이유 등 통지에 따른 의견]의견(답변, 소명)서 [Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)	2018.12.28	수리 (Accepted)	1-1-2018-1319337-11
5	등록결정서 Decision to grant	2019.02.28	발송처리완료 (Completion of Transmission)	9-5-2019-0153077-54

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 복수의 훈련용 음성 데이터 각각과 복수의 훈련용 비음성 데이터 각각에 대한, 한 종류 이상의 특징 파라미터의 값을 산출하는 제 1 단계;상기 훈련용 음성 데이터 각각에 대한 상기 특징 파라미터의 값의 분포로부터 획득되는 제 1 분포 함수와, 상기 훈련용 비음성 데이터 각각에 대한 상기 특징 파라미터의 값의 분포로부터 획득되는 제 2 분포 함수를 포함하는 테스트 모델을 생성하는 제 2 단계;대상 소리 데이터에 대한 상기 특징 파라미터의 값을 산출하는 제 3 단계; 및상기 테스트 모델 및 상기 대상 소리 데이터에 대해 산출된 상기 특징 파라미터의 값에 기초하여, 상기 대상 소리 데이터가 음성 데이터와 비음성 데이터 중 어느 쪽에 속하는지 판단하는 제 4 단계를 포함하고,상기 제 1 단계는, 상기 훈련용 음성 데이터 각각과 상기 훈련용 비음성 데이터 각각에 대한 단위 파라미터와 관련된 통계 정보를 이용하여, 두 종류 이상의 후보 파라미터의 값을 산출하고, 상기 후보 파라미터 값 중에서 적어도 한 종류의 후보 파라미터를 상기 특징 파라미터로서 선택하는 단계를 포함하는소리 데이터 분류 방법
2	2 제 1 항에 있어서,상기 단위 파라미터와 관련된 통계 정보는, 복수의 프레임 각각의 특징을 나타내는 단위 파라미터의 값에 대한 통계 정보 혹은 상기 단위 파라미터의 시간에 따른 변화량에 대한 통계 정보를 포함하는소리 데이터 분류 방법
3	3 제 2 항에 있어서,상기 단위 파라미터는, 스펙트럼 평탄도(spectral flatness), 스펙트럼 다이내믹스(spectral dynamics), 스펙트럼 도심(spectral centroid), 여기 신호 에너지(excitation signal energy), 음성 신호 에너지(speech signal energy) 및 피치 주기(pitch period) 중 적어도 하나를 포함하며,상기 통계 정보는, 평균, 표준편차, 왜도 및 첨도 중 적어도 하나를 포함하는소리 데이터 분류 방법
4	4 제 1 항에 있어서,상기 제 1 단계는, 상기 후보 파라미터 중 한 종류의 후보 파라미터의 값을 이용하여 상기 훈련용 음성 데이터와 상기 훈련용 비음성 데이터를 분류하는 과정을, 상기 후보 파라미터 각각에 대해 수행하는 단계를 포함하고,상기 특징 파라미터는 상기 분류의 결과에 기초하여 선택되는소리 데이터 분류 방법
5	5 제 4 항에 있어서,상기 수행하는 단계는, 상기 후보 파라미터 각각의 분류도를 구하는 단계를 포함하되,상기 후보 파라미터 중 상기 분류도를 구하고자 하는 특정한 후보 파라미터의 값을 모두 포함하는 수치 범위를 M(M은 2 이상의 자연수)개의 구간으로 분할하고, 상기 구간 중 j(j는 1 이상 M 이하의 자연수)번째 구간에 속하는 후보 파라미터의 값 중 상기 훈련용 음성 데이터에 대해 산출된 값의 개수를 h(sp)(j)라 하고, 상기 훈련용 비음성 데이터에 대해 산출된 값의 개수를 h(nsp)(j)라 할 때, 상기 특정한 후보 파라미터의 분류도는의 값과 같으며,상기 선택하는 단계는, 상기 후보 파라미터 각각의 분류도에 기초하여, 상기 후보 파라미터 중 상기 특징 파라미터를 선택하는 단계를 포함하는소리 데이터 분류 방법
6	6 제 1 항에 있어서,상기 특징 파라미터의 종류의 수를 N(N은 자연수)이라 할 때, 상기 분포 함수는 가우시안 혼합 모델(Gaussian mixture model)을 이용하여 N차원 좌표공간 상에 정의된 연속적인 확률 밀도 함수(probability density function)이며,상기 제 4 단계는, 상기 대상 소리 데이터에 대해 산출된 상기 특징 파라미터 각각의 값에 기초하여 정해지는 상기 N차원 좌표공간 상에서의 위치에서의 상기 제 1 분포 함수의 값과 상기 제 2 분포 함수의 값을 산출하는 단계; 및상기 제 1 분포 함수의 값과 상기 제 2 분포 함수의 값의 비교 결과에 기초하여, 상기 대상 소리 데이터가 상기 음성 데이터와 상기 비음성 데이터 중 어느 쪽에 속하는지 판단하는 단계를 포함하는소리 데이터 분류 방법
7	7 제 1 항에 있어서,훈련용 소리 데이터 각각의 PESQ(Perceptual Evaluation of Speech Quality) 값을 획득하는 단계; 및상기 훈련용 소리 데이터 중, 상기 PESQ 값이 소정의 임계 PESQ 값 이상인 데이터는 상기 훈련용 음성 데이터로, 상기 PESQ 값이 상기 임계 PESQ 값 미만인 데이터는 상기 훈련용 비음성 데이터로 분류하는 단계를 더 포함하는소리 데이터 분류 방법
8	8 복수의 훈련용 음성 데이터 각각과 복수의 훈련용 비음성 데이터 각각에 대한, 한 종류 이상의 특징 파라미터의 값을 산출하며, 대상 소리 데이터에 대한 상기 특징 파라미터의 값을 산출하는 파라미터 연산부;상기 훈련용 음성 데이터 각각에 대한 상기 특징 파라미터의 값의 분포로부터 획득되는 제 1 분포 함수와, 상기 훈련용 비음성 데이터 각각에 대한 상기 특징 파라미터의 값의 분포로부터 획득되는 제 2 분포 함수를 포함하는 테스트 모델을 생성하는 모델 생성부; 및상기 테스트 모델 및 상기 대상 소리 데이터에 대해 산출된 상기 특징 파라미터의 값에 기초하여, 상기 대상 소리 데이터가 음성 데이터와 비음성 데이터 중 어느 쪽에 속하는지 판단하는 분류부를 포함하고, 상기 파라미터 연산부는, 상기 훈련용 음성 데이터 각각과 상기 훈련용 비음성 데이터 각각에 대한 단위 파라미터와 관련된 통계 정보를 이용하여, 두 종류 이상의 후보 파라미터의 값을 산출하고, 상기 후보 파라미터 값 중에서 적어도 한 종류의 후보 파라미터를 상기 특징 파라미터로서 선택하는소리 데이터 분류 장치
9	9 제 8 항에 있어서,상기 단위 파라미터와 관련된 통계 정보는, 복수의 프레임 각각의 특징을 나타내는 단위 파라미터의 값에 대한 통계 정보 혹은 상기 단위 파라미터의 시간에 따른 변화량에 대한 통계 정보를 포함하는 소리 데이터 분류 장치
10	10 제 9 항에 있어서,상기 단위 파라미터는, 스펙트럼 평탄도(spectral flatness), 스펙트럼 다이내믹스(spectral dynamics), 스펙트럼 도심(spectral centroid), 여기 신호 에너지(excitation signal energy), 음성 신호 에너지(speech signal energy) 및 피치 주기(pitch period) 중 적어도 하나를 포함하며,상기 통계 정보는, 평균, 표준편차, 왜도 및 첨도 중 적어도 하나를 포함하는소리 데이터 분류 장치
11	11 제 8 항에 있어서,상기 파라미터 연산부는, 상기 후보 파라미터 중 한 종류의 후보 파라미터의 값을 이용하여 상기 훈련용 음성 데이터와 상기 훈련용 비음성 데이터를 분류하는 과정을, 상기 후보 파라미터 각각에 대해 수행하고, 상기 특징 파라미터는 상기 분류의 결과에 기초하여 선택되는소리 데이터 분류 장치
12	12 제 11 항에 있어서,상기 파라미터 연산부는, 상기 후보 파라미터 각각의 분류도를 구하고, 상기 후보 파라미터 각각의 분류도에 기초하여, 상기 후보 파라미터 중 상기 특징 파라미터를 선택하되,상기 후보 파라미터 중 상기 분류도를 구하고자 하는 특정한 후보 파라미터의 값을 모두 포함하는 수치 범위를 M(M은 2 이상의 자연수)개의 구간으로 분할하고, 상기 구간 중 j(j는 1 이상 M 이하의 자연수)번째 구간에 속하는 후보 파라미터의 값 중 상기 훈련용 음성 데이터에 대해 산출된 값의 개수를 h(sp)(j)라 하고, 상기 훈련용 비음성 데이터에 대해 산출된 값의 개수를 h(nsp)(j)라 할 때, 상기 특정한 후보 파라미터의 분류도는의 값과 같은소리 데이터 분류 장치
13	13 제 8 항에 있어서,상기 특징 파라미터의 종류의 수를 N(N은 자연수)이라 할 때, 상기 분포 함수는 가우시안 혼합 모델(Gaussian mixture model)을 이용하여 N차원 좌표공간 상에 정의된 연속적인 확률 밀도 함수(probability density function)이며,상기 분류부는, 상기 대상 소리 데이터에 대해 산출된 상기 특징 파라미터 각각의 값에 기초하여 정해지는 상기 N차원 좌표공간 상에서의 위치에서의 상기 제 1 분포 함수의 값과 상기 제 2 분포 함수의 값을 산출하고, 상기 제 1 분포 함수의 값과 상기 제 2 분포 함수의 값의 비교 결과에 기초하여, 상기 대상 소리 데이터가 상기 음성 데이터와 상기 비음성 데이터 중 어느 쪽에 속하는지 판단하는소리 데이터 분류 장치
14	14 제 8 항에 있어서,훈련용 소리 데이터 각각의 PESQ(Perceptual Evaluation of Speech Quality) 값을 획득하고, 상기 훈련용 소리 데이터 중, 상기 PESQ 값이 소정의 임계 PESQ 값 이상인 데이터는 상기 훈련용 음성 데이터로, 상기 PESQ 값이 상기 임계 PESQ 값 미만인 데이터는 상기 훈련용 비음성 데이터로 분류하는 PESQ 연산부를 더 포함하는소리 데이터 분류 장치
15	15 대상 소리 데이터에 대한, 한 종류 이상의 특징 파라미터의 값을 산출하는 단계; 및상기 대상 소리 데이터의 분류를 위한 테스트 모델 및 상기 대상 소리 데이터에 대한 상기 특징 파라미터의 값에 기초하여, 상기 대상 소리 데이터가 음성 데이터와 비음성 데이터 중 어느 쪽에 속하는지 판단하는 단계를 포함하며,상기 테스트 모델은, 복수의 훈련용 음성 데이터 각각에 대한 특징 파라미터의 값의 분포로부터 획득되는 제 1 분포 함수와, 복수의 훈련용 비음성 데이터 각각에 대한 특징 파라미터의 값의 분포로부터 획득되는 제 2 분포 함수를 포함하고, 상기 제 1 분포 함수와 상기 제 2 분포 함수는, 상기 훈련용 음성 데이터 각각과 상기 훈련용 비음성 데이터 각각에 대한 단위 파라미터와 관련된 통계 정보를 이용하여 산출된 두 종류 이상의 후보 파라미터의 값 중에서 적어도 한 종류의 후보 파라미터를 포함하는 특징 파라미터 값의 분포로부터 획득되는소리 데이터 분류 방법
16	16 제 1 항 내지 제 7 항 및 제 15 항 중 어느 한 항에 기재된 방법에 따른 각각의 단계를 수행하는, 컴퓨터 판독 가능 기록매체에 저장된 프로그램
17	17 제 1 항 내지 제 7 항 및 제 15 항 중 어느 한 항에 기재된 방법에 따른 각각의 단계를 수행하는 명령어를 포함하는 프로그램이 기록된 컴퓨터 판독 가능 기록매체

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2017.08.17	수리 (Accepted)	1-1-2017-0795486-89
2	의견제출통지서	2018.10.30	발송처리완료 (Completion of Transmission)	9-5-2018-0738253-69
3	[명세서등 보정]보정서	2018.12.28	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2018-1319338-67
4	[거절이유 등 통지에 따른 의견]의견(답변, 소명)서	2018.12.28	수리 (Accepted)	1-1-2018-1319337-11
5	등록결정서	2019.02.28	발송처리완료 (Completion of Transmission)	9-5-2019-0153077-54

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2019019602][국방과학연구소]	음향 신호를 분류하는 방법 및 시스템	새창보기
[KST2020002390][국방과학연구소]	음성 구간을 검출하는 방법 및 장치	새창보기
[KST2022002409][국방과학연구소]	어텐션 매커니즘을 적용한 음성합성 시스템 및 그 방법	새창보기
[KST2022019011][국방과학연구소]	AMR 음성데이터 판별 방법 및 그 장치	새창보기
[KST2022001644][국방과학연구소]	생성 모델 기반의 음성 코덱 복원 방법 및 장치, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램	새창보기
[KST2019012738][국방과학연구소]	잡음 제거 장치 및 방법	새창보기
[KST2021003876][국방과학연구소]	음성 복원 장치 및 그 방법, 그 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하는 컴퓨터 판독 가능한 기록매체 및 컴퓨터 프로그램	새창보기
[KST2023004938][국방과학연구소]	화자 인식을 위한 전자 장치 및 그의 동작 방법	새창보기
[KST2021012362][국방과학연구소]	AMR 음성데이터의 압축포맷정보를 추정하는 방법 및 그 장치	새창보기
[KST2021003719][국방과학연구소]	적대적 학습(adversarial training) 모델을 이용한 강인한 음성 향상 훈련 방법 및 그 장치	새창보기
[KST2022001289][국방과학연구소]	자기 부호화기를 이용한 주파수 대역 신호를 변형하기 위한 장치, 방법, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택