맞춤기술찾기

이전대상기술

화자 유사도 판단 방법 및 장치

  • 기술번호 : KST2023002072
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 화자 유사도 판단 장치의 프로세서에 의해 수행되는 화자 유사도를 판단하기 위한 방법으로서, 화자 정보 및 테스트 음성 데이터를 수신하고, 화자 정보에 따라 미리 등록된 화자의 등록 음성 데이터를 검색하고, 테스트 음성 데이터로부터 제1 화자 특징 벡터 및 제1 보조 특징 벡터를 도출하고, 상기 등록 음성 데이터로부터 제2 화자 특징 벡터 및 제2 보조 특징 벡터를 추출하고, 제1 화자 특징 벡터 및 제2 화자 특징 벡터에 기초하여 화자 특징 유사도 행렬을 도출하고, 제1 화자 특징 벡터 및 제1 보조 특징 벡터에 기초하여 제1 종합 특징 벡터를 생성하고, 제2 화자 특징 벡터 및 상기 제2 화자 특징 벡터에 기초하여 제2 종합 특징 벡터를 생성하고, 제1 종합 특징 벡터 및 상기 제2 종합 특징 벡터를 이용하여 교차 집중도를 계산하고, 화자 특징 유사도 행렬 및 교차 집중도에 기초하여 테스트 음성과 상기 화자의 음성의 유사도를 산출하는 단계를 포함할 수 있다.
Int. CL G10L 17/08 (2013.01.01) G10L 17/04 (2013.01.01) G10L 25/54 (2013.01.01) G10L 17/18 (2013.01.01) G06N 3/02 (2023.01.01)
CPC G10L 17/08(2013.01) G10L 17/04(2013.01) G10L 25/54(2013.01) G10L 17/18(2013.01) G06N 3/02(2013.01)
출원번호/일자 1020210194701 (2021.12.31)
출원인 서울대학교산학협력단
등록번호/일자
공개번호/일자 10-2023-0103667 (2023.07.07) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.12.31)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 한민현 서울특별시 마포구
2 김남수 서울특별시 서초구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 남앤남 대한민국 서울특별시 중구 서소문로**(서소문동, 정안빌딩*층)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.12.31 수리 (Accepted) 1-1-2021-1535601-75
2 보정요구서
Request for Amendment
2022.01.11 발송처리완료 (Completion of Transmission) 1-5-2022-0006503-39
3 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2022.01.18 수리 (Accepted) 1-1-2022-0061437-54
4 특허고객번호 정보변경(경정)신고서·정정신고서
2022.04.04 수리 (Accepted) 4-1-2022-5079741-71
5 특허고객번호 정보변경(경정)신고서·정정신고서
2022.08.11 수리 (Accepted) 4-1-2022-5189083-38
6 특허고객번호 정보변경(경정)신고서·정정신고서
2022.10.07 수리 (Accepted) 4-1-2022-5235636-01
7 의견제출통지서
Notification of reason for refusal
2023.07.28 발송처리완료 (Completion of Transmission) 9-5-2023-0686744-84
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
화자 유사도 판단 장치의 프로세서에 의해 수행되는 화자 유사도를 판단하기 위한 방법으로서,화자 정보 및 테스트 음성 데이터를 수신하는 단계;상기 화자 정보에 따라 미리 등록된 화자의 등록 음성 데이터를 검색하는 단계;상기 테스트 음성 데이터로부터 제1 화자 특징 벡터 및 제1 보조 특징 벡터를 추출하고, 상기 등록 음성 데이터로부터 제2 화자 특징 벡터 및 제2 보조 특징 벡터를 추출하는 단계;상기 제1 화자 특징 벡터 및 상기 제2 화자 특징 벡터에 기초하여 화자 특징 유사도 행렬을 도출하는 단계;상기 제1 화자 특징 벡터 및 상기 제1 보조 특징 벡터에 기초하여 제1 종합 특징 벡터를 생성하고, 상기 제2 화자 특징 벡터 및 상기 제2 화자 특징 벡터에 기초하여 제2 종합 특징 벡터를 생성하는 단계;상기 제1 종합 특징 벡터 및 상기 제2 종합 특징 벡터를 이용하여 교차 집중도를 계산하는 단계; 및 상기 화자 특징 유사도 행렬 및 상기 교차 집중도에 기초하여 상기 테스트 음성과 상기 화자의 음성의 유사도를 산출하는 단계를 포함하는,화자 유사도 판단 방법
2 2
제 1 항에 있어서,상기 교차 집중도를 계산하는 단계는,상기 제1 종합 특징 벡터 및 상기 제2 종합 특징 벡터에 기초하여 상기 테스트 음성 데이터에 대한 제1 시간별 음성 집중도 벡터 및 상기 등록 음성 데이터에 대한 제2 시간별 음성 집중도 벡터를 생성하는 단계;상기 제1 보조 특징 벡터와 상기 제2 보조 특징 벡터에 기초하여 보조 특징 유사도 행렬을 도출하는 단계; 및상기 보조 특징 유사도 행렬, 상기 제1 시간별 음성 집중도 벡터 및 상기 제2 시간별 음성 집중도 벡터에 기초하여 교차 집중도를 계산하는 단계를 포함하는,화자 유사도 판단 방법
3 3
제 2 항에 있어서,상기 음성 집중도 벡터를 생성하는 단계는 하기 식1에 따라 신경망 모델을 통하여 수행되며,식1: 여기서, 는 시간별 음성 집중도 벡터이고 W1 및 W2는 상기 신경망 모델의 파라미터이고, 는 활성화 함수이며, 는 종합 특징 벡터인, 화자 유사도 판단 방법
4 4
제 3 항에 있어서,상기 교차 집중도를 계산하는 단계는,상기 제1 시간별 음성 집중도 벡터에 대한 제1 교차 집중도 및 상기 제2 시간별 음성 집중도 벡터에 대한 제2 교차 집중도를 계산하는 단계를 포함하고,상기 제1 교차 집중도는 하기 식2에 따라 계산되고, 상기 제2 교차 집중도는 하기 식3에 따라 계산되며,식2: 식3: 여기서, RC는 상기 보조 특징 유사도 행렬이고, 는 상기 제1 시간별 음성 집중도 벡터이고, 는 상기 제2 시간별 음성 집중도 벡터인,화자 유사도 판단 방법
5 5
제 4 항에 있어서,상기 화자의 음성의 유사도를 산출하는 단계는 하기 식4에 따라 수행되며,식4: 여기서, s는 유사도이고, Rh는 상기 화자 특징 유사도 행렬이고, s의 크기가 클수록 유사도가 높음을 의미하는,화자 유사도 판단 방법
6 6
제 1 항에 있어서,상기 등록 음성 데이터를 검색하는 단계 이후 및 상기 추출하는 단계 이전에,상기 등록 음성 데이터 및 상기 테스트 음성 데이터 각각에서 적어도 하나의 프레임을 선택하는 단계를 더 포함하고,상기 추출하는 단계는, 상기 테스트 음성 데이터의 적어도 하나의 프레임로부터 제1 화자 특징 벡터 및 제1 보조 특징 벡터를 도출하고, 상기 등록 음성 데이터의 적어도 하나의 프레임으로부터 제2 화자 특징 벡터 및 제2 보조 특징 벡터를 추출하는 단계를 포함하는,화자 유사도 판단 방법
7 7
제 1 항 내지 제 6 항 중 어느 한 항에 기재된 방법을 실행하도록 구성된 하나 이상의 명령어를 포함하는 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능한 기록 매체
8 8
화자 유사도를 판단하기 위한 장치로서,명령어 및 신경망 모델을 저장하는 메모리; 및상기 메모리와 전기적으로 연결된 적어도 하나의 프로세서를 포함하고,상기 프로세서는,화자 정보 및 테스트 음성 데이터를 수신하는 동작,상기 화자 정보에 따라 미리 등록된 화자의 등록 음성 데이터를 검색하는 동작,상기 테스트 음성 데이터로부터 제1 화자 특징 벡터 및 제1 보조 특징 벡터를 추출하고, 상기 등록 음성 데이터로부터 제2 화자 특징 벡터 및 제2 보조 특징 벡터를 추출하는 동작,상기 제1 화자 특징 벡터 및 상기 제2 화자 특징 벡터에 기초하여 화자 특징 유사도 행렬을 도출하는 동작,상기 제1 화자 특징 벡터 및 상기 제1 보조 특징 벡터에 기초하여 제1 종합 특징 벡터를 생성하고, 상기 제2 화자 특징 벡터 및 상기 제2 화자 특징 벡터에 기초하여 제2 종합 특징 벡터를 생성하는 동작,상기 제1 종합 특징 벡터 및 상기 제2 종합 특징 벡터를 이용하여 교차 집중도를 계산하는 동작, 및 상기 화자 특징 유사도 행렬 및 상기 교차 집중도에 기초하여 상기 테스트 음성과 상기 화자의 음성의 유사도를 산출하는 동작을 수행하도록 구성되는,화자 유사도 판단 장치
9 9
제 8 항에 있어서,상기 교차 집중도를 계산하는 동작은,상기 제1 종합 특징 벡터 및 상기 제2 종합 특징 벡터에 기초하여 상기 테스트 음성 데이터에 대한 제1 시간별 음성 집중도 벡터 및 상기 등록 음성 데이터에 대한 제2 시간별 음성 집중도 벡터를 생성하는 동작,상기 제1 보조 특징 벡터와 상기 제2 보조 특징 벡터에 기초하여 보조 특징 유사도 행렬을 도출하는 동작, 및 상기 보조 특징 유사도 행렬, 상기 제1 시간별 음성 집중도 벡터 및 상기 제2 시간별 음성 집중도 벡터에 기초하여 교차 집중도를 계산하는 동작을 포함하는,화자 유사도 판단 장치
10 10
제 9 항에 있어서,상기 음성 집중도 벡터를 생성하는 동작은 하기 식1에 따라 신경망 모델을 통하여 수행되며,식1: 여기서, 는 시간별 음성 집중도 벡터이고 W1 및 W2는 상기 신경망 모델의 파라미터이고, 는 활성화 함수이며, 는 종합 특징 벡터인, 화자 유사도 판단 장치
11 11
제 10 항에 있어서,상기 교차 집중도를 계산하는 동작은,상기 제1 시간별 음성 집중도 벡터에 대한 제1 교차 집중도 및 상기 제2 시간별 음성 집중도 벡터에 대한 제2 교차 집중도를 계산하는 동작을 포함하고,상기 제1 교차 집중도는 하기 식2에 따라 계산되고, 상기 제2 교차 집중도는 하기 식3에 따라 계산되며,식2: 식3: 여기서, RC는 상기 보조 특징 유사도 행렬이고, 는 상기 제1 시간별 음성 집중도 벡터이고, 는 상기 제2 시간별 음성 집중도 벡터인,화자 유사도 판단 장치
12 12
제 11 항에 있어서,상기 화자의 음성의 유사도를 산출하는 동작은 하기 식4에 따라 수행되며,식4: 여기서, s는 유사도이고, Rh는 상기 화자 특징 유사도 행렬이고, s의 크기가 클수록 유사도가 높음을 의미하는,화자 유사도 판단 장치
13 13
제 8 항에 있어서,상기 프로세서는,상기 등록 음성 데이터를 검색하는 동작 이후 및 상기 추출하는 동작 이전에,상기 등록 음성 데이터 및 상기 테스트 음성 데이터 각각에서 적어도 하나의 프레임을 선택하는 동작을 더 수행하도록 구성되고,상기 추출하는 동작은, 상기 테스트 음성 데이터의 적어도 하나의 프레임로부터 제1 화자 특징 벡터 및 제1 보조 특징 벡터를 도출하고, 상기 등록 음성 데이터의 적어도 하나의 프레임으로부터 제2 화자 특징 벡터 및 제2 보조 특징 벡터를 추출하는 동작을 포함하는,화자 유사도 판단 방법
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 WO2023128035 WO 세계지적재산권기구(WIPO) FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
DOCDB 패밀리 정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 경찰청 서울대학교 치안과학기술연구개발(R&D) 성문분석을 통한 실시간 화자검색 기술 개발