기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

화자 유사도 판단 방법 및 장치

기술번호 : KST2023002072
담당센터 : 서울동부기술혁신센터
전화번호 : 02-2155-3662

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명은 화자 유사도 판단 장치의 프로세서에 의해 수행되는 화자 유사도를 판단하기 위한 방법으로서, 화자 정보 및 테스트 음성 데이터를 수신하고, 화자 정보에 따라 미리 등록된 화자의 등록 음성 데이터를 검색하고, 테스트 음성 데이터로부터 제1 화자 특징 벡터 및 제1 보조 특징 벡터를 도출하고, 상기 등록 음성 데이터로부터 제2 화자 특징 벡터 및 제2 보조 특징 벡터를 추출하고, 제1 화자 특징 벡터 및 제2 화자 특징 벡터에 기초하여 화자 특징 유사도 행렬을 도출하고, 제1 화자 특징 벡터 및 제1 보조 특징 벡터에 기초하여 제1 종합 특징 벡터를 생성하고, 제2 화자 특징 벡터 및 상기 제2 화자 특징 벡터에 기초하여 제2 종합 특징 벡터를 생성하고, 제1 종합 특징 벡터 및 상기 제2 종합 특징 벡터를 이용하여 교차 집중도를 계산하고, 화자 특징 유사도 행렬 및 교차 집중도에 기초하여 테스트 음성과 상기 화자의 음성의 유사도를 산출하는 단계를 포함할 수 있다.
Int. CL	G10L 17/08 (2013.01.01) G10L 17/04 (2013.01.01) G10L 25/54 (2013.01.01) G10L 17/18 (2013.01.01) G06N 3/02 (2023.01.01)
CPC	G10L 17/08(2013.01) G10L 17/04(2013.01) G10L 25/54(2013.01) G10L 17/18(2013.01) G06N 3/02(2013.01)
출원번호/일자	1020210194701 (2021.12.31)
출원인	서울대학교산학협력단
등록번호/일자
공개번호/일자	10-2023-0103667 (2023.07.07) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	공개
심사진행상태	수리
심판사항
구분	국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2021.12.31)
심사청구항수	13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	서울대학교산학협력단	대한민국	서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	한민현		서울특별시 마포구
2	김남수		서울특별시 서초구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	특허법인 남앤남	대한민국	서울특별시 중구 서소문로*(서소문동, 정안빌딩층)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
최종권리자 정보가 없습니다

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2021.12.31	수리 (Accepted)	1-1-2021-1535601-75
2	보정요구서 Request for Amendment	2022.01.11	발송처리완료 (Completion of Transmission)	1-5-2022-0006503-39
3	[출원서 등 보정]보정서 [Amendment to Patent Application, etc.] Amendment	2022.01.18	수리 (Accepted)	1-1-2022-0061437-54
4	특허고객번호 정보변경(경정)신고서·정정신고서	2022.04.04	수리 (Accepted)	4-1-2022-5079741-71
5	특허고객번호 정보변경(경정)신고서·정정신고서	2022.08.11	수리 (Accepted)	4-1-2022-5189083-38
6	특허고객번호 정보변경(경정)신고서·정정신고서	2022.10.07	수리 (Accepted)	4-1-2022-5235636-01
7	의견제출통지서 Notification of reason for refusal	2023.07.28	발송처리완료 (Completion of Transmission)	9-5-2023-0686744-84

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 화자 유사도 판단 장치의 프로세서에 의해 수행되는 화자 유사도를 판단하기 위한 방법으로서,화자 정보 및 테스트 음성 데이터를 수신하는 단계;상기 화자 정보에 따라 미리 등록된 화자의 등록 음성 데이터를 검색하는 단계;상기 테스트 음성 데이터로부터 제1 화자 특징 벡터 및 제1 보조 특징 벡터를 추출하고, 상기 등록 음성 데이터로부터 제2 화자 특징 벡터 및 제2 보조 특징 벡터를 추출하는 단계;상기 제1 화자 특징 벡터 및 상기 제2 화자 특징 벡터에 기초하여 화자 특징 유사도 행렬을 도출하는 단계;상기 제1 화자 특징 벡터 및 상기 제1 보조 특징 벡터에 기초하여 제1 종합 특징 벡터를 생성하고, 상기 제2 화자 특징 벡터 및 상기 제2 화자 특징 벡터에 기초하여 제2 종합 특징 벡터를 생성하는 단계;상기 제1 종합 특징 벡터 및 상기 제2 종합 특징 벡터를 이용하여 교차 집중도를 계산하는 단계; 및 상기 화자 특징 유사도 행렬 및 상기 교차 집중도에 기초하여 상기 테스트 음성과 상기 화자의 음성의 유사도를 산출하는 단계를 포함하는,화자 유사도 판단 방법
2	2 제 1 항에 있어서,상기 교차 집중도를 계산하는 단계는,상기 제1 종합 특징 벡터 및 상기 제2 종합 특징 벡터에 기초하여 상기 테스트 음성 데이터에 대한 제1 시간별 음성 집중도 벡터 및 상기 등록 음성 데이터에 대한 제2 시간별 음성 집중도 벡터를 생성하는 단계;상기 제1 보조 특징 벡터와 상기 제2 보조 특징 벡터에 기초하여 보조 특징 유사도 행렬을 도출하는 단계; 및상기 보조 특징 유사도 행렬, 상기 제1 시간별 음성 집중도 벡터 및 상기 제2 시간별 음성 집중도 벡터에 기초하여 교차 집중도를 계산하는 단계를 포함하는,화자 유사도 판단 방법
3	3 제 2 항에 있어서,상기 음성 집중도 벡터를 생성하는 단계는 하기 식1에 따라 신경망 모델을 통하여 수행되며,식1: 여기서, 는 시간별 음성 집중도 벡터이고 W1 및 W2는 상기 신경망 모델의 파라미터이고, 는 활성화 함수이며, 는 종합 특징 벡터인, 화자 유사도 판단 방법
4	4 제 3 항에 있어서,상기 교차 집중도를 계산하는 단계는,상기 제1 시간별 음성 집중도 벡터에 대한 제1 교차 집중도 및 상기 제2 시간별 음성 집중도 벡터에 대한 제2 교차 집중도를 계산하는 단계를 포함하고,상기 제1 교차 집중도는 하기 식2에 따라 계산되고, 상기 제2 교차 집중도는 하기 식3에 따라 계산되며,식2: 식3: 여기서, RC는 상기 보조 특징 유사도 행렬이고, 는 상기 제1 시간별 음성 집중도 벡터이고, 는 상기 제2 시간별 음성 집중도 벡터인,화자 유사도 판단 방법
5	5 제 4 항에 있어서,상기 화자의 음성의 유사도를 산출하는 단계는 하기 식4에 따라 수행되며,식4: 여기서, s는 유사도이고, Rh는 상기 화자 특징 유사도 행렬이고, s의 크기가 클수록 유사도가 높음을 의미하는,화자 유사도 판단 방법
6	6 제 1 항에 있어서,상기 등록 음성 데이터를 검색하는 단계 이후 및 상기 추출하는 단계 이전에,상기 등록 음성 데이터 및 상기 테스트 음성 데이터 각각에서 적어도 하나의 프레임을 선택하는 단계를 더 포함하고,상기 추출하는 단계는, 상기 테스트 음성 데이터의 적어도 하나의 프레임로부터 제1 화자 특징 벡터 및 제1 보조 특징 벡터를 도출하고, 상기 등록 음성 데이터의 적어도 하나의 프레임으로부터 제2 화자 특징 벡터 및 제2 보조 특징 벡터를 추출하는 단계를 포함하는,화자 유사도 판단 방법
7	7 제 1 항 내지 제 6 항 중 어느 한 항에 기재된 방법을 실행하도록 구성된 하나 이상의 명령어를 포함하는 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능한 기록 매체
8	8 화자 유사도를 판단하기 위한 장치로서,명령어 및 신경망 모델을 저장하는 메모리; 및상기 메모리와 전기적으로 연결된 적어도 하나의 프로세서를 포함하고,상기 프로세서는,화자 정보 및 테스트 음성 데이터를 수신하는 동작,상기 화자 정보에 따라 미리 등록된 화자의 등록 음성 데이터를 검색하는 동작,상기 테스트 음성 데이터로부터 제1 화자 특징 벡터 및 제1 보조 특징 벡터를 추출하고, 상기 등록 음성 데이터로부터 제2 화자 특징 벡터 및 제2 보조 특징 벡터를 추출하는 동작,상기 제1 화자 특징 벡터 및 상기 제2 화자 특징 벡터에 기초하여 화자 특징 유사도 행렬을 도출하는 동작,상기 제1 화자 특징 벡터 및 상기 제1 보조 특징 벡터에 기초하여 제1 종합 특징 벡터를 생성하고, 상기 제2 화자 특징 벡터 및 상기 제2 화자 특징 벡터에 기초하여 제2 종합 특징 벡터를 생성하는 동작,상기 제1 종합 특징 벡터 및 상기 제2 종합 특징 벡터를 이용하여 교차 집중도를 계산하는 동작, 및 상기 화자 특징 유사도 행렬 및 상기 교차 집중도에 기초하여 상기 테스트 음성과 상기 화자의 음성의 유사도를 산출하는 동작을 수행하도록 구성되는,화자 유사도 판단 장치
9	9 제 8 항에 있어서,상기 교차 집중도를 계산하는 동작은,상기 제1 종합 특징 벡터 및 상기 제2 종합 특징 벡터에 기초하여 상기 테스트 음성 데이터에 대한 제1 시간별 음성 집중도 벡터 및 상기 등록 음성 데이터에 대한 제2 시간별 음성 집중도 벡터를 생성하는 동작,상기 제1 보조 특징 벡터와 상기 제2 보조 특징 벡터에 기초하여 보조 특징 유사도 행렬을 도출하는 동작, 및 상기 보조 특징 유사도 행렬, 상기 제1 시간별 음성 집중도 벡터 및 상기 제2 시간별 음성 집중도 벡터에 기초하여 교차 집중도를 계산하는 동작을 포함하는,화자 유사도 판단 장치
10	10 제 9 항에 있어서,상기 음성 집중도 벡터를 생성하는 동작은 하기 식1에 따라 신경망 모델을 통하여 수행되며,식1: 여기서, 는 시간별 음성 집중도 벡터이고 W1 및 W2는 상기 신경망 모델의 파라미터이고, 는 활성화 함수이며, 는 종합 특징 벡터인, 화자 유사도 판단 장치
11	11 제 10 항에 있어서,상기 교차 집중도를 계산하는 동작은,상기 제1 시간별 음성 집중도 벡터에 대한 제1 교차 집중도 및 상기 제2 시간별 음성 집중도 벡터에 대한 제2 교차 집중도를 계산하는 동작을 포함하고,상기 제1 교차 집중도는 하기 식2에 따라 계산되고, 상기 제2 교차 집중도는 하기 식3에 따라 계산되며,식2: 식3: 여기서, RC는 상기 보조 특징 유사도 행렬이고, 는 상기 제1 시간별 음성 집중도 벡터이고, 는 상기 제2 시간별 음성 집중도 벡터인,화자 유사도 판단 장치
12	12 제 11 항에 있어서,상기 화자의 음성의 유사도를 산출하는 동작은 하기 식4에 따라 수행되며,식4: 여기서, s는 유사도이고, Rh는 상기 화자 특징 유사도 행렬이고, s의 크기가 클수록 유사도가 높음을 의미하는,화자 유사도 판단 장치
13	13 제 8 항에 있어서,상기 프로세서는,상기 등록 음성 데이터를 검색하는 동작 이후 및 상기 추출하는 동작 이전에,상기 등록 음성 데이터 및 상기 테스트 음성 데이터 각각에서 적어도 하나의 프레임을 선택하는 동작을 더 수행하도록 구성되고,상기 추출하는 동작은, 상기 테스트 음성 데이터의 적어도 하나의 프레임로부터 제1 화자 특징 벡터 및 제1 보조 특징 벡터를 도출하고, 상기 등록 음성 데이터의 적어도 하나의 프레임으로부터 제2 화자 특징 벡터 및 제2 보조 특징 벡터를 추출하는 동작을 포함하는,화자 유사도 판단 방법

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번	패밀리번호	국가코드	국가명	종류
1	WO2023128035	WO	세계지적재산권기구(WIPO)	FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번	패밀리번호	국가코드	국가명	종류
DOCDB 패밀리 정보가 없습니다

순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번	연구부처	주관기관	연구사업	연구과제
1	경찰청	서울대학교	치안과학기술연구개발(R＆D)	성문분석을 통한 실시간 화자검색 기술 개발

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2021.12.31	수리 (Accepted)	1-1-2021-1535601-75
2	보정요구서	2022.01.11	발송처리완료 (Completion of Transmission)	1-5-2022-0006503-39
3	[출원서 등 보정]보정서	2022.01.18	수리 (Accepted)	1-1-2022-0061437-54
4	특허고객번호 정보변경(경정)신고서·정정신고서	2022.04.04	수리 (Accepted)	4-1-2022-5079741-71
5	특허고객번호 정보변경(경정)신고서·정정신고서	2022.08.11	수리 (Accepted)	4-1-2022-5189083-38
6	특허고객번호 정보변경(경정)신고서·정정신고서	2022.10.07	수리 (Accepted)	4-1-2022-5235636-01
7	의견제출통지서	2023.07.28	발송처리완료 (Completion of Transmission)	9-5-2023-0686744-84

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2021000639][서울대학교]	인공신경망을 이용한 체형분류 자동화 및 패턴 자동보정 시스템	새창보기
[KST2019001656][서울대학교]	영상 처리 및 기계 학습에 기초한 뼈 나이 판독 장치 및 방법	새창보기
[KST2022007281][서울대학교]	통신 제어 장치 및 통신 제어 방법	새창보기
[KST2019011713][서울대학교]	딥 러닝 기반의 통합 음향 정보 인지 시스템	새창보기
[KST2020009846][서울대학교]	화자 인식을 위한 뉴럴 네트워크 장치, 및 그 동작 방법	새창보기
[KST2020014930][서울대학교]	인공지능 기반 뇌 영역 분류 시스템	새창보기
[KST2018000882][서울대학교]	단어 임베딩 방법, 단어 임베딩 장치, 음성 인식 방법 및 음성 인식 장치(METHOD AND APPARATUS FOR WORD EMBEDDING, METHOD AND APPARATUS FOR VOICE RECOGNITION)	새창보기
[KST2022007585][서울대학교]	심층 신경망을 이용한 활성 단말 검출과 채널 추정 방법 및 장치	새창보기
[KST2021001621][서울대학교]	안구 영상 내 혈관 분할을 이용한 자동 질환 판단 장치 및 그 방법	새창보기
[KST2019006213][서울대학교]	화자 인식을 위한 뉴럴 네트워크 장치, 및 그 동작 방법	새창보기
[KST2022007280][서울대학교]	음성인식기의 결과 텍스트와 음성 특징을 이용한 음성인식 오류교정 모델링 방법	새창보기
[KST2019004257][서울대학교]	전력 감응형 식습관 개선용 로봇	새창보기
[KST2021010241][서울대학교]	가속기, 가속기의 동작 방법 및 이를 포함한 가속기 시스템	새창보기
[KST2022022501][서울대학교]	다중 통신에서 딥러닝을 이용하여 학습된 확산 코드를 이용한 활성 단말 검출 방법 및 장치	새창보기
[KST2020014585][서울대학교]	순환신경망을 이용한 구간혈압 추정 방법 및 그 방법을 구현하기 위한 구간 혈압 추정 장치	새창보기
[KST2016010373][서울대학교]	뉴런 디바이스 및 뉴런 디바이스를 포함하는 집적회로(NEURON DEVICES AND INTEGRATED CIRCUIT INCLUDING NEURON DEVICES)	새창보기
[KST2020006434][서울대학교]	딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법	새창보기
[KST2021000638][서울대학교]	인공신경망을 이용한 체형분류 자동화 및 패턴 생성 시스템	새창보기
[KST2020006539][서울대학교]	딥러닝 네트워크를 이용하여 복수의 이미지들로부터 이야기를 생성하기 위한 방법 및 장치	새창보기
[KST2017015168][서울대학교]	입출력 회로를 가지는 계층적 신경망 구조의 언어모델 장치(LANGUAGE MODEL APPARATUS USING HIERARCHICAL NEURAL NETWORKS FOR LOW COMPLEXITY INPUT AND OUTPUT)	새창보기
[KST2019004256][서울대학교]	전력 및 모션 감응형 교육용 로봇	새창보기
[KST2022008226][서울대학교]	화자 외 정보가 제거된 화자 임베딩 장치 및 방법	새창보기
[KST2022003952][서울대학교]	화자 인식을 위한 음성인식기 기반 풀링 기법의 화자 임베딩 추출 방법 및 시스템, 그리고 이를 위한 기록매체	새창보기
[KST2022003891][서울대학교]	장단기 메모리 네트워크를 이용한 활성 단말 검출 방법 및 장치	새창보기
[KST2019035863][서울대학교]	기계학습을 이용한 음성 인식 OTP(One Time Password)인증 방법 및 시스템	새창보기
[KST2020006253][서울대학교]	LSTM을 이용한 순환식 수경재배의 양액 다량이온 추정 장치 및 그 방법	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택

기술이전 상담신청 드립니다.
기업명
신청자 성명		직책
연락처	- -
이메일	@
상담희망전담센터	※ 사업장(본점) 소재지가 속한 지역의 기술혁신센터를 지정해주세요.