맞춤기술찾기

이전대상기술

음성 프로파일링 장치 및 방법

  • 기술번호 : KST2024000238
  • 담당센터 : 경기기술혁신센터
  • 전화번호 : 031-8006-1570
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 일 실시예에 따른 음성 프로파일링 장치는, 프로파일링 대상 화자의 음성 데이터를 획득하는 데이터 획득부와, 학습 대상 화자들에 대한 복수의 분류 대상 특성이 라벨링이 된 학습용 음성 데이터가 기 학습되어 있는 인공신경망모델이 상기 프로파일링 대상 화자의 음성 데이터에 대하여 상기 복수의 분류 대상 특성을 예측한 결과를 제공하는 특성 예측부와, 상기 특성 예측부에 의한 결과를 출력하는 출력부를 포함하고, 상기 인공신경망모델은, 상기 프로파일링 대상 화자의 음성 데이터에 대하여 상기 복수의 분류 대상 특성에 대한 공통 특징으로서 2차원의 특징 행렬로 변환하는 공통 특징 추출 네트워크와, 상기 2차원의 특징 행렬로부터 상기 복수의 분류 대상 특성을 예측하는 특성 예측 네트워크를 포함한다.
Int. CL G10L 17/02 (2013.01.01) G10L 17/18 (2013.01.01) G10L 17/04 (2013.01.01) G10L 21/0208 (2013.01.01) G06N 3/08 (2023.01.01)
CPC G10L 17/02(2013.01) G10L 17/18(2013.01) G10L 17/04(2013.01) G10L 21/0208(2013.01) G06N 3/08(2013.01)
출원번호/일자 1020220065406 (2022.05.27)
출원인 성균관대학교산학협력단
등록번호/일자
공개번호/일자 10-2023-0165535 (2023.12.05) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.05.27)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 성균관대학교산학협력단 대한민국 경기도 수원시 장안구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박진영 경기도 수원시 장안구
2 홍지우 서울특별시 구
3 전효림 서울특별시 마포구
4 이수정 경기도 성남시 분당구
5 이승우 서울특별시 종로구
6 안세현 서울특별시 양천구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.05.27 수리 (Accepted) 1-1-2022-0563413-00
2 특허고객번호 정보변경(경정)신고서·정정신고서
2023.12.14 수리 (Accepted) 4-1-2023-5331701-35
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
프로파일링 대상 화자의 음성 데이터를 획득하는 데이터 획득부와,학습 대상 화자들에 대한 복수의 분류 대상 특성이 라벨링이 된 학습용 음성 데이터가 기 학습되어 있는 인공신경망모델이 상기 프로파일링 대상 화자의 음성 데이터에 대하여 상기 복수의 분류 대상 특성을 예측한 결과를 제공하는 특성 예측부와,상기 특성 예측부에 의한 결과를 출력하는 출력부를 포함하고,상기 인공신경망모델은,상기 프로파일링 대상 화자의 음성 데이터에 대하여 상기 복수의 분류 대상 특성에 대한 공통 특징으로서 2차원의 특징 행렬로 변환하는 공통 특징 추출 네트워크와,상기 2차원의 특징 행렬로부터 상기 복수의 분류 대상 특성을 예측하는 특성 예측 네트워크를 포함하는음성 프로파일링 장치
2 2
제 1 항에 있어서,상기 프로파일링 대상 화자의 음성 데이터에 대하여 잡음 제거 후 MFCC(mel-frequency cepstral coefficient)와 F0(fundamental frequency)의 조합으로 전처리하여 상기 특성 예측부에 제공하는 전처리부를 더 포함하는음성 프로파일링 장치
3 3
제 1 항에 있어서,상기 특성 예측 네트워크는, 복수의 개별 예측 계층이 상기 복수의 분류 대상 특성을 일대일로 각각 예측하는음성 프로파일링 장치
4 4
제 3 항에 있어서,상기 공통 특징 추출 네트워크는, 하드 파라미터 쉐어링(hard parameter sharing) 기반의 복수의 합성곱(convolutional) 계층을 포함하고,상기 개별 예측 계층은, 완전 연결(fully connected) 계층을 포함하는음성 프로파일링 장치
5 5
제 1 항에 있어서,상기 특성 예측 네트워크는, 복수의 개별 예측 계층이 상기 복수의 분류 대상 특성을 순차적으로 예측하되 상기 복수의 개별 예측 계층 중 선동작하는 개별 예측 계층의 결과값을 후동작하는 개별 예측 계층의 입력으로 이용하는음성 프로파일링 장치
6 6
제 5 항에 있어서,상기 공통 특징 추출 네트워크는, 하드 파라미터 쉐어링 기반의 복수의 합성곱 계층을 포함하고,상기 개별 예측 계층은, LSTM(long short term memory)을 포함하는음성 프로파일링 장치
7 7
음성 프로파일링 장치가 수행하는 음성 프로파일링 방법으로서,프로파일링 대상 화자의 음성 데이터를 획득하는 단계와,학습 대상 화자들에 대한 복수의 분류 대상 특성이 라벨링이 된 학습용 음성 데이터가 기 학습되어 있는 인공신경망모델이 상기 프로파일링 대상 화자의 음성 데이터에 대하여 상기 복수의 분류 대상 특성을 예측한 결과를 제공하는 단계와,상기 복수의 분류 대상 특성을 예측한 결과를 출력하는 단계를 포함하고,상기 복수의 분류 대상 특성을 예측한 결과를 제공하는 단계는,상기 인공신경망모델의 공통 특징 추출 네트워크가 상기 프로파일링 대상 화자의 음성 데이터에 대하여 상기 복수의 분류 대상 특성에 대한 공통 특징으로서 2차원의 특징 행렬로 변환하는 단계와,상기 인공신경망모델의 특성 예측 네트워크가 상기 2차원의 특징 행렬로부터 상기 복수의 분류 대상 특성을 예측하는 단계를 포함하는음성 프로파일링 방법
8 8
제 7 항에 있어서,상기 프로파일링 대상 화자의 음성 데이터에 대하여 잡음 제거 후 MFCC(mel-frequency cepstral coefficient)와 F0(fundamental frequency)의 조합으로 전처리하여 상기 인공신경망모델에 제공하는 단계를 더 포함하는음성 프로파일링 방법
9 9
제 7 항에 있어서,상기 복수의 분류 대상 특성을 예측하는 단계는, 복수의 개별 예측 계층이 상기 복수의 분류 대상 특성을 일대일로 각각 예측하는음성 프로파일링 방법
10 10
제 9 항에 있어서,상기 공통 특징 추출 네트워크는, 하드 파라미터 쉐어링 기반의 복수의 합성곱 계층을 포함하고,상기 개별 예측 계층은, 완전 연결 계층을 포함하는음성 프로파일링 방법
11 11
제 7 항에 있어서,상기 복수의 분류 대상 특성을 예측하는 단계는, 복수의 개별 예측 계층이 상기 복수의 분류 대상 특성을 순차적으로 예측하되 상기 복수의 개별 예측 계층 중 선동작하는 개별 예측 계층의 결과값을 후동작하는 개별 예측 계층의 입력으로 이용하는음성 프로파일링 방법
12 12
제 11 항에 있어서,상기 공통 특징 추출 네트워크는, 하드 파라미터 쉐어링 기반의 복수의 합성곱 계층을 포함하고,상기 개별 예측 계층은, LSTM을 포함하는음성 프로파일링 방법
13 13
컴퓨터 판독 가능 기록매체에 저장되어 있는 컴퓨터 프로그램으로서,상기 컴퓨터 프로그램은, 프로세서에 의해 실행되면,프로파일링 대상 화자의 음성 데이터를 획득하는 단계와,학습 대상 화자들에 대한 복수의 분류 대상 특성이 라벨링이 된 학습용 음성 데이터가 기 학습되어 있는 인공신경망모델이 상기 프로파일링 대상 화자의 음성 데이터에 대하여 상기 복수의 분류 대상 특성을 예측한 결과를 제공하는 단계와,상기 복수의 분류 대상 특성을 예측한 결과를 출력하는 단계를 포함하고,상기 복수의 분류 대상 특성을 예측한 결과를 제공하는 단계는,상기 인공신경망모델의 공통 특징 추출 네트워크가 상기 프로파일링 대상 화자의 음성 데이터에 대하여 상기 복수의 분류 대상 특성에 대한 공통 특징으로서 2차원의 특징 행렬로 변환하는 단계와,상기 인공신경망모델의 특성 예측 네트워크가 상기 2차원의 특징 행렬로부터 상기 복수의 분류 대상 특성을 예측하는 단계를 포함하는 음성 프로파일링 방법을 상기 프로세서가 수행하도록 하기 위한 명령어를 포함하는컴퓨터 프로그램
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.