1 |
1
미등록 화자를 추가할 수 있는 심층 신경망 기반의 화자 식별 장치에 있어서, 각각이 복수의 노드를 포함하는 입력계층, 하나 이상의 은닉계층 및 출력계층을 포함하며, 서로 다른 계층의 복수의 노드가 가중치로 연결되는 심층신경망; 및 화자가 알려지지 않은 음성을 상기 심층신경망의 상기 입력계층에 입력시킨 후, 상기 출력계층의 복수의 출력노드의 출력값을 기초로 화자를 식별하되, 상기 복수의 출력노드의 출력값 모두가 기 설정된 임계치 미만이면, 상기 화자를 미등록 화자로 분류하는 인식부;를 포함하는 것을 특징으로 하는 화자 식별 장치
|
2 |
2
제1항에 있어서, 상기 미등록 화자로 분류되면, 상기 미등록 화자에 대응하는 출력노드를 출력계층에 추가하고, 소정 횟수 이상 저장된 미등록 화자의 마지막 은닉계층의 노드값을 기초로 마지막 은닉계층의 복수의 은닉노드와 상기 출력층에 추가된 출력노드 간의 가중치를 산출하는 학습부;를 더 포함하는 것을 특징으로 하는 화자 식별 장치
|
3 |
3
제2항에 있어서, 상기 출력 노드의 활성화 함수는 소프트맥스(softmax) 함수이며, 마지막 은닉계층의 복수의 은닉노드와 상기 추가된 출력 노드 간의 가중치는 저장된 마지막 은닉계층의 복수의 은닉노드 각각의 노드값의 평균인 것을 특징으로 하는 화자 식별 장치
|
4 |
4
제1항에 있어서, 상기 임계치는 등록된 화자를 학습할 때 사용한 학습 데이터의 기댓값 중 가장 큰 값인 것을 특징으로 하는 화자 식별 장치
|
5 |
5
미등록 화자를 추가할 수 있는 심층 신경망 기반의 화자 식별 방법에 있어서, 인식부가 각각이 복수의 노드를 포함하는 입력계층, 하나 이상의 은닉계층 및 출력계층을 포함하며, 서로 다른 복수의 계층의 복수의 노드가 가중치로 연결되는 심층신경망에 화자가 알려지지 않은 음성을 입력하는 단계; 상기 인식부가 상기 입력에 따라 상기 심층신경망의 복수의 계층의 복수의 노드가 상기 가중치가 작용되는 복수의 연산을 통해 출력계층의 복수의 출력노드의 출력값을 도출하는 단계; 상기 인식부가 상기 출력계층의 복수의 출력노드의 출력값을 기초로 화자를 식별하되, 상기 복수의 출력노드의 출력값 모두가 기 설정된 임계치 미만인지 여부를 판별하는 단계; 및 상기 판별 결과, 상기 복수의 출력노드의 출력값 모두가 기 설정된 임계치 미만이면, 상기 인식부가 상기 화자를 미등록 화자로 분류하는 단계;를 포함하는 것을 특징으로 하는 화자 식별 방법
|
6 |
6
제5항에 있어서, 상기 화자를 미등록 화자로 분류하는 단계 후, 학습부가 상기 미등록 화자에 대응하는 출력노드를 출력계층에 추가하는 단계; 상기 학습부가 소정 횟수 이상 저장된 미등록 화자의 마지막 은닉계층의 복수의 은닉노드의 노드값을 기초로 마지막 은닉계층의 복수의 은닉노드와 상기 출력계층에 추가된 출력노드 간의 가중치를 산출하는 단계;를 더 포함하는 것을 특징으로 하는 화자 식별 방법
|
7 |
7
제6항에 있어서, 상기 출력노드의 활성화 함수는 소프트맥스(softmax) 함수이며, 상기 가중치를 산출하는 단계는 저장된 마지막 은닉계층의 복수의 은닉노드 각각의 노드값의 평균을 상기 마지막 은닉계층의 복수의 은닉노드와 상기 출력계층에 추가된 출력 노드 간의 가중치로 산출하는 것을 특징으로 하는 화자 식별 방법
|
8 |
8
제5항에 있어서, 상기 임계치는 등록된 화자를 학습할 때 사용한 학습 데이터의 기댓값 중 가장 큰 값인 것을 특징으로 하는 화자 식별 방법
|
9 |
9
미등록 화자를 추가할 수 있는 심층 신경망 기반의 화자 식별 방법을 수행하기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록매체에 있어서, 인식부가 각각이 복수의 노드를 포함하는 입력계층, 하나 이상의 은닉계층 및 출력계층을 포함하며, 서로 다른 복수의 계층의 복수의 노드가 가중치로 연결되는 심층신경망에 화자가 알려지지 않은 음성을 입력하는 단계; 상기 인식부가 상기 입력에 따라 상기 심층신경망의 복수의 계층의 복수의 노드가 상기 가중치가 작용되는 복수의 연산을 통해 출력계층의 복수의 출력노드의 출력값을 도출하는 단계; 상기 인식부가 상기 출력계층의 복수의 출력노드의 출력값을 기초로 화자를 식별하되, 상기 복수의 출력노드의 출력값 모두가 기 설정된 임계치 미만인지 여부를 판별하는 단계; 및 상기 판별 결과, 상기 복수의 출력노드의 출력값 모두가 기 설정된 임계치 미만이면, 상기 인식부가 상기 화자를 미등록 화자로 분류하는 단계;를 포함하는 화자 식별 방법을 수행하기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
|
10 |
10
제9항에 있어서, 상기 화자를 미등록 화자로 분류하는 단계 후, 학습부가 상기 미등록 화자에 대응하는 출력노드를 출력계층에 추가하는 단계; 상기 학습부가 소정 횟수 이상 저장된 미등록 화자의 마지막 은닉계층의 복수의 은닉노드의 노드값을 기초로 마지막 은닉계층의 복수의 은닉노드와 상기 출력계층에 추가된 출력노드 간의 가중치를 산출하는 단계;를 더 포함하는 화자 식별 방법을 수행하기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
|
11 |
11
제10항에 있어서, 상기 출력노드의 활성화 함수는 소프트맥스(softmax) 함수이며, 상기 가중치를 산출하는 단계는 저장된 마지막 은닉계층의 복수의 은닉노드 각각의 노드값의 평균을 상기 마지막 은닉계층의 복수의 은닉노드와 상기 출력계층에 추가된 출력 노드 간의 가중치로 산출하는 것을 특징으로 하는 화자 식별 방법을 수행하기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
|
12 |
12
제9항에 있어서, 상기 임계치는 등록된 화자를 학습할 때 사용한 학습 데이터의 기댓값 중 가장 큰 값인 것을 특징으로 하는 화자 식별 방법을 수행하기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
|