1 |
1
음성 데이터를 입력 받는 입력부;상기 음성 데이터의 연결 가중치를 초기화하는 모델 생성부; 및 상기 연결 가중치에 대한 정보를 출력하는 출력부를 포함하고, 상기 모델 생성부는, 상기 음성 데이터에 대응하는 음소 결과가 출력될 수 있도록, 결정된 심층 신경회로망 구조에 따라 은닉 계층을 쌓으면서 상기 연결 가중치를 학습하고, 각 계층들 사이에, 출력 계층을 적용해, 각 계층에서의 상기 학습된 연결 가중치를 보정하여, 상기 연결 가중치를 초기화하는 음성인식을 위한 초벌학습 장치
|
2 |
2
제 1 항에 있어서,상기 출력 계층은 음소 유닛별 스테이트와 직접 매핑되는 음성인식을 위한 초벌학습 장치
|
3 |
3
제 1 항에 있어서,상기 모델 생성부는, 은닉 계층들을 쌓아 올려 심층 구조를 형성할 때, 하나의 은닉 계층에 출력 계층을 적용하여 하나의 상기 은닉 계층의 연결 가중치를 보정하고, 상기 출력 계층을 제거한 후, 또 다른 은닉 계층을 쌓고, 상기 또 다른 은닉 계층에 상기 출력 계층을 적용하여, 상기 또 다른 은닉 계층의 연결 가중치를 보정하며,상기 과정을 마지막 은닉 계층까지 반복하여 각 은닉 계층의 연결 가중치를 보정하여 상기 연결 가중치를 초기화하는 음성인식을 위한 초벌학습 장치
|
4 |
4
제 1 항에 있어서,상기 모델 생성부는,상기 음성 데이터들이 입력되는 입력 계층과 상기 입력 계층 위에 쌓인 제1은닉 계층 사이의 제1연결 가중치를 출력 계층을 이용해 초기화하고,상기 제1은닉 계층과 상기 제1은닉 계층 위에 쌓인 제2은닉 계층 사이의 제2연결 가중치를 출력 계층을 이용해 초기화하며,상기 과정들을 최종 은닉 계층까지 반복하여, 각 은닉 계층에서의 연결 가중치를 초기화시키는 음성인식을 위한 초벌학습 장치
|
5 |
5
제 4 항에 있어서,상기 모델 생성부는 상기 제1연결 가중치를 초기화하기 위해,상기 음성 데이터를 프레임 특징 벡터로 변환시키고, 적어도 2개 이상의 프레임들을 구성하는 프레임 특징 벡터들의 집합인 입력 프레임 묶음을, 입력 계층에 입력시키고,상기 입력 계층과 상기 입력 계층 위에 쌓인 제1은닉 계층 사이의 제1연결 가중치를 최대 엔트로피 방식을 이용하여 결정하며,상기 제1은닉 계층 위에 출력 계층을 쌓고, 상기 입력 프레임 묶음에 대응하는 음소 유닛의 스테이트가 출력되도록 상기 제1연결 가중치를 보정하여 상기 제1연결 가중치를 초기화하는 음성인식을 위한 초벌학습 장치
|
6 |
6
제 5 항에 있어서,상기 모델 생성부는 상기 제2연결 가중치를 초기화하기 위해,상기 제1연결 가중치가 보정된 후, 상기 출력 계층을 제거하고, 상기 제1은닉 계층 위에, 제2은닉 계층을 쌓고, 상기 제1연결 가중치를 이용하여, 상기 제1은닉 계층의 각 노드에서의 값을 계산하며, 최대 엔트로피 방식을 이용하여, 상기 제1은닉 계층과 상기 제2은닉 계층 사이의 제2연결 가중치를 결정하며,상기 제2은닉 계층 위에 출력 계층을 쌓고, 상기 입력 프레임 묶음에 대응하는 음소 유닛의 스테이트가 출력되도록 상기 제2연결 가중치를 보정하는 음성인식을 위한 초벌학습 장치
|
7 |
7
제 1 항에 있어서,상기 입력부는,유선 네트워크 또는 무선 네트워크를 통해 통신을 수행하여 상기 음성 데이터를 입력 받거나, 저장매체로부터 상기 음성 데이터를 입력 받거나, 또는 음성을 직접 입력 받은 후 상기 음성을 디지털화시켜 상기 음성 데이터로 변환시키는 음성인식을 위한 초벌학습 장치
|
8 |
8
음성 데이터를 입력 받는 단계; 및상기 음성 데이터의 연결 가중치를 초기화하는 단계를 포함하고, 상기 연결 가중치를 초기화하는 단계는,상기 음성 데이터에 대응하는 음소 결과가 출력될 수 있도록, 결정된 심층 신경회로망 구조에 따라 은닉 계층을 쌓으면서 상기 연결 가중치를 학습하고, 상기 각 은닉 계층들 사이에, 출력 계층을 적용해, 상기 각 계층에서의 상기 학습된 연결 가중치를 보정하여 상기 연결 가중치를 초기화하는 음성인식을 위한 초벌학습 방법
|
9 |
9
제 8 항에 있어서,상기 연결 가중치를 초기화하는 단계는, 은닉 계층들을 쌓아 올려 심층 구조를 형성할 때, 하나의 은닉 계층에 출력 계층을 적용하여 하나의 상기 은닉 계층의 연결 가중치를 보정하는 단계; 상기 출력 계층을 제거한 후, 또 다른 은닉 계층을 쌓는 단계; 상기 또 다른 은닉 계층에 상기 출력 계층을 적용하여, 상기 또 다른 은닉 계층의 연결 가중치를 보정하는 단계; 및상기 과정을 마지막 은닉 계층까지 반복하여 각 은닉 계층의 연결 가중치를 초기화하는 단계를 포함하는 음성인식을 위한 초벌학습 방법
|
10 |
10
제 8 항에 있어서,상기 연결 가중치를 초기화하는 단계는,상기 음성 데이터들이 입력되는 입력 계층과 상기 입력 계층 위에 쌓인 제1은닉 계층 사이의 제1연결 가중치를 출력 계층을 이용해 초기화하는 단계;상기 제1은닉 계층과 상기 제1은닉 계층 위에 쌓인 제2은닉 계층 사이의 제2연결 가중치를 상기 출력 계층을 이용해 초기화하는 단계; 및상기 과정들을 최종 은닉 계층까지 반복하여, 각 은닉 계층에서의 연결 가중치를 초기화시키는 단계를 포함하는 음성인식을 위한 초벌학습 방법
|
11 |
11
제 10 항에 있어서,상기 제1연결 가중치를 초기화하는 단계는,상기 음성 데이터를 프레임 특징 벡터로 변환시키고, 적어도 2개 이상의 프레임들을 구성하는 프레임 특징 벡터들의 집합인 입력 프레임 묶음을, 입력 계층에 입력시키는 단계;상기 입력 계층과 상기 입력 계층 위에 쌓인 제1은닉 계층 사이의 제1연결 가중치를 최대 엔트로피 방식을 이용하여 결정하는 단계; 및상기 제1은닉 계층 위에 출력 계층을 쌓고, 상기 입력 프레임 묶음에 대응하는 음소 유닛의 스테이트가 출력되도록 상기 제1연결 가중치를 보정하는 단계를 포함하는 음성인식을 위한 초벌학습 방법
|