1 |
1
외부로부터 입력된 음성을 디지털 신호로 변환하는 신호 입력수단, 상기 신호 입력 수단으로부터 입력된 음성신호를 정해진 구간으로 프레임화한 후에, 특징 파라메터를 추출하는 특징 파라메터 추출 수단, 추출된 특징 파라메터열을 입력받아 분석할 프레임이 유성음인지 무성음인지 묵음인지의 여부를 판정하는 유성음/무성음/묵음 판정 수단 및 상기 유성음/무성음/묵음 판정 수단의 출력을 입력받아 시간 프레임마다 출력을 하거나, 입력의 시작부터 종료까지를 묶어 일률적으로 출력하는 유성음/무성음/묵음 정보 출력 수단을 포함하여 이루어진 신경망을 이용한 유성음, 무성음, 묵음 구간 부류화 장치
|
2 |
2
제1항에 있어서, 상기 유성음/무성음/묵음 판정 수단은, 각각의 노드들은 각각 유성음의 출력값과, 무성음의 출력값, 및 묵음의 출력값을 출력하며, 최대값을 출력하는 노드에 따라서 그 프레임이 유성음인지, 무성음인지, 묵음인지를 결정하는 출력층, 다수개의 노드를 가지고 있으며, 그 노드들의 수가 신경망의 성능을 최적화하는 작용과 관련이 있는 은닉층, 당해 시간 프레임 각각의 출력노드 값을 한 주기 만큼 지연시키는 지연수단 및 프레임으로부터 추출된 특징 파라메터의 당해 시간 값과, 특징 파라메터의 당해 시간 보다 한주기 전의 값과, 특징 파라메터의 당해 시간 보다 한 주기 앞선 값과, 상기 지연 수단을 통과한 이전 시간에서 출력된 출력 수단의 출력노드 값과 또 다른 예측 신경망에서 출력된 당해 시간 보다 한주기 앞선 각각의 출력 노드 갑을 입력으로 사용하는 입력층을 포함하여 이루어진 신경망을 이용한 유성음, 무성음, 묵음 구간 부류화장치
|
3 |
3
외부로부터 입력된 음성을 아날로그 전기 신호로 변환한 후에, 디지털 신호로 변환하여 출력하는 제 1 단계, 입력된 음성신호를 먼저 정해진 구간으로 프레임화한 후에, 특징 파라메터를 추출하여 출력하는 제 2 단계, 추출된 특징 파라메터열을 입력받아 분석할 프레임이 유성음인지 무성음인지 묵음인지의 여부를 판정하여 출력하는 제 3 단계 및 판정 정보를 입력받아 시간 프레임마다 출력을 하거나, 입력의 시작부터 종료까지를 묶어 일률적으로 출력을 하는 제 4 단계를 포함하여 이루어진 신경망을 이용한 유성음, 무성음, 묵음 구간 부류화방법
|
4 |
4
제 3 항에 있어서, 상기 제 2 단계는, 입력된 신호를 정해진 구간의 N개의 샘플들로 구성된 프레임으로 분할하여 연속적으로 추출하는 제 5 단계, 추출된 각각의 프레임에 대하여 유성음과, 무성음, 및 묵음의 특성을 잘 나타내는 특징 파라메터를 추출하는 제 6 단계 및 추출한 파라메터를 신경망의 입력으로 사용할 수 있도록 각각의 프레임마다 특징 파라메터를 정규화하는 제 7 단계를 포함하여 이루어진 신경망을 이용한 유성음, 무성음, 묵음 구간 부류화 방법
|