1 |
1
화자 인식을 위한 뉴럴 네트워크 장치에 있어서,하나 이상의 명령어(instruction)를 저장하는 메모리; 및상기 하나 이상의 명령어를 실행함으로써, 제 1 뉴럴 네트워크를 훈련시켜, 혼합 음성 신호를 개별 음성 신호들로 분리하도록 훈련된 제 1 뉴럴 네트워크를 생성하고, 상기 훈련된 제 1 뉴럴 네트워크에 적어도 하나의 레이어를 부가하여 제 2 뉴럴 네트워크를 생성하고, 상기 제 2 뉴럴 네트워크를 훈련시켜, 혼합 음성 신호를 개별 음성 신호들로 분리하고 상기 개별 음성 신호들 각각에 대한 화자를 인식하도록 훈련된 제 2 뉴럴 네트워크를 생성하는, 프로세서를 포함하는, 뉴럴 네트워크 장치
|
2 |
2
제 1 항에 있어서,상기 프로세서는, 복수의 화자들의 혼합 음성 신호에 대한 정보를 상기 제 1 뉴럴 네트워크에 대한 입력 정보로써 획득하고,상기 복수의 화자들 각각의 개별 음성 신호에 대한 정보를 상기 제 1 뉴럴 네트워크에 대한 출력 정보로써 획득하고,상기 제 1 뉴럴 네트워크에 대한 입력 정보 및 출력 정보를 통해, 상기 제 1 뉴럴 네트워크를 훈련시키는, 뉴럴 네트워크 장치
|
3 |
3
제 1 항에 있어서,상기 프로세서는,복수의 화자들의 혼합 음성 신호에 대한 정보를 상기 제 2 뉴럴 네트워크에 대한 입력 정보로써 획득하고,상기 복수의 화자들 각각의 개별 음성 신호에 대한 화자 식별 정보를 출력 정보로써 획득하고,상기 제 2 뉴럴 네트워크에 대한 입력 정보 및 출력 정보를 통해 상기 제 2 뉴럴 네트워크를 훈련시키는, 뉴럴 네트워크 장치
|
4 |
4
제 1 항에 있어서,상기 프로세서는,상기 훈련된 제 1 뉴럴 네트워크의 출력 레이어를 제거하고, 적어도 하나의 히든 레이어 및 출력 레이어를 연결시켜, 상기 제 2 뉴럴 네트워크를 생성하는, 뉴럴 네트워크 장치
|
5 |
5
제 1 항에 있어서,혼합 음성 신호를 센싱하는 음향 센서;를 더 포함하고,상기 프로세서는,상기 훈련된 제 2 뉴럴 네트워크를 이용하여, 상기 센싱된 혼합 음성 신호에 대한 적어도 하나의 화자를 인식하는, 뉴럴 네트워크 장치
|
6 |
6
제 5 항에 있어서,상기 프로세서는,상기 훈련된 제 2 뉴럴 네트워크를 이용하여, 상기 센싱된 혼합 음성 신호에 포함된 적어도 하나의 개별 음성 신호에 대한 화자 인식용 특징 정보를 획득하고,상기 적어도 하나의 개별 음성 신호에 대한 화자 인식용 특징 정보와, 기 등록된 화자 인식용 특징 정보를 비교하여, 상기 센싱된 혼합 음성 신호에 대한 적어도 하나의 화자를 인식하는, 뉴럴 네트워크 장치
|
7 |
7
제 6 항에 있어서,상기 프로세서는,상기 센싱된 혼합 음성 신호에 대한 정보가 입력된 상기 훈련된 제 2 뉴럴 네트워크의 마지막 히든 레이어의 출력 벡터를 추출하여, 상기 적어도 하나의 개별 음성 신호에 대한 화자 인식용 특징 정보를 획득하는, 뉴럴 네트워크 장치
|
8 |
8
제 5 항에 있어서,상기 음향 센서는, 광대역 마이크로폰, 공진기 마이크로폰, 협대역 공진기 마이크로폰 어레이 중 적어도 하나를 포함하는, 뉴럴 네트워크 장치
|
9 |
9
제 1 항에 있어서,화자의 음성 신호를 센싱하는 음향 센서;를 더 포함하고,상기 프로세서는,상기 훈련된 제 2 뉴럴 네트워크를 이용하여, 상기 화자의 음성 신호에 대한 화자 인식용 특징 정보를 획득하고, 상기 획득된 화자 인식용 특징 정보를 상기 화자의 식별 정보와 함께 저장하여, 상기 화자를 등록하는, 뉴럴 네트워크 장치
|
10 |
10
화자 인식을 위한 뉴럴 네트워크 장치의 동작 방법에 있어서,제 1 뉴럴 네트워크를 훈련시켜, 혼합 음성 신호를 개별 음성 신호들로 분리하도록 훈련된 제 1 뉴럴 네트워크를 생성하는 단계; 상기 훈련된 제 1 뉴럴 네트워크에 적어도 하나의 레이어를 부가하여 제 2 뉴럴 네트워크를 생성하는 단계; 및상기 제 2 뉴럴 네트워크를 훈련시켜, 혼합 음성 신호를 개별 음성 신호들로 분리하고 상기 개별 음성 신호들 각각에 대한 화자를 인식하도록 훈련된 제 2 뉴럴 네트워크를 생성하는 단계를 포함하는, 동작 방법
|
11 |
11
제 10 항에 있어서,상기 훈련된 제 1 뉴럴 네트워크를 생성하는 단계는,복수의 화자들의 혼합 음성 신호에 대한 정보를 상기 제 1 뉴럴 네트워크에 대한 입력 정보로써 획득하는 단계;상기 복수의 화자들 각각의 개별 음성 신호에 대한 정보를 상기 제 1 뉴럴 네트워크에 대한 출력 정보로써 획득하는 단계; 및상기 제 1 뉴럴 네트워크에 대한 입력 정보 및 출력 정보를 통해, 상기 제 1 뉴럴 네트워크를 훈련시키는 단계를 포함하는, 동작 방법
|
12 |
12
제 10 항에 있어서,상기 훈련된 제 2 뉴럴 네트워크를 생성하는 단계는,복수의 화자들의 혼합 음성 신호에 대한 정보를 상기 제 2 뉴럴 네트워크에 대한 입력 정보로써 획득하는 단계;상기 복수의 화자들 각각의 개별 음성 신호에 대한 화자 식별 정보를 출력 정보로써 획득하는 단계; 및상기 제 2 뉴럴 네트워크에 대한 입력 정보 및 출력 정보를 통해 상기 제 2 뉴럴 네트워크를 훈련시키는 단계를 포함하는, 동작 방법
|
13 |
13
제 10 항에 있어서,상기 제 2 뉴럴 네트워크를 생성하는 단계는,상기 훈련된 제 1 뉴럴 네트워크의 출력 레이어를 제거하고, 적어도 하나의 히든 레이어 및 출력 레이어를 연결시켜, 상기 제 2 뉴럴 네트워크를 생성하는, 동작 방법
|
14 |
14
제 10 항에 있어서,혼합 음성 신호를 획득하는 단계; 및상기 훈련된 제 2 뉴럴 네트워크를 이용하여, 상기 획득된 혼합 음성 신호에 대한 적어도 하나의 화자를 인식하는 단계를 더 포함하는, 동작 방법
|
15 |
15
제 14 항에 있어서,상기 적어도 하나의 화자를 인식하는 단계는,상기 훈련된 제 2 뉴럴 네트워크를 이용하여, 상기 획득된 혼합 음성 신호에 포함된 적어도 하나의 개별 음성 신호에 대한 화자 인식용 특징 정보를 획득하는 단계; 및상기 적어도 하나의 개별 음성 신호에 대한 화자 인식용 특징 정보와, 기 등록된 화자 인식용 특징 정보를 비교하여, 상기 획득된 혼합 음성 신호에 대한 적어도 하나의 화자를 인식하는 단계를 포함하는, 동작 방법
|
16 |
16
제 15 항에 있어서,상기 적어도 하나의 개별 음성 신호에 대한 화자 인식용 특징 정보를 획득하는 단계는,상기 센싱된 혼합 음성 신호에 대한 정보가 입력된 상기 훈련된 제 2 뉴럴 네트워크의 마지막 히든 레이어의 출력 벡터를 추출하여, 상기 적어도 하나의 개별 음성 신호에 대한 화자 인식용 특징 정보를 획득하는, 동작 방법
|
17 |
17
제 14 항에 있어서,상기 혼합 음성 신호를 획득하는 단계는,광대역 마이크로폰, 공진기 마이크로폰, 협대역 공진기 마이크로폰 어레이 중 적어도 하나를 이용하여, 상기 혼합 음성 신호를 센싱하는 단계를 포함하는, 동작 방법
|
18 |
18
제 10 항에 있어서,화자의 음성 신호를 획득하는 단계;상기 훈련된 제 2 뉴럴 네트워크를 이용하여, 상기 화자의 음성 신호에 대한 화자 인식용 특징 정보를 획득하는 단계; 및상기 획득된 화자 인식용 특징 정보를 상기 화자의 식별 정보와 함께 저장하여, 상기 화자를 등록하는 단계를 더 포함하는, 동작 방법
|
19 |
19
제 10 항 내지 18 항 중에 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체
|