1 |
1
음성 인식기에 적용되는 음성 인식 방법에 있어서, 이전에 인식된 대화의 화행 정보로부터 현재 발성된 내용의 화행 정보를 예측하기 위한 화행 추정 파라미터를 구하는 제 1 단계; 상기 화행 추정 파라미터를 언어모델에 반영하는 제 2 단계; 입력 음성을 1차로 인식한 후에, 상기 1차 음성 인식 결과로부터 상기 화행 추정 파라미터를 사용하여 현재의 화행 정보를 추정하는 제 3 단계; 및 상기 추정한 화행 정보에 따라 상기 1차 인식 결과를 재계산하여 인식 결과를 구하는 제 4 단계 를 포함하는 음성 인식 방법
|
2 |
2
제 1 항에 있어서, 상기 제 1 단계는, 대화별로 모아진 텍스트 코퍼스의 각 문장에 대하여 그 문장이 어느 화행에 속하는지를 태깅하는 제 5 단계; 이전 화행으로부터 현재 화행으로 천이할 확률을 구하는 제 6 단계; 상기 텍스트 코퍼스를 사용하여 광역 언어모델을 구하는 제 7 단계; 상기 텍스트 코퍼스를 화행별로 분류하고, 화행별로 분류된 문장을 사용하여 화행의존 언어모델을 구하는 제 8 단계; 및 각 화행별로 분류된 텍스트의 각 문장으로부터 추출한 소정 개수의 내용어와 문장의 종류에 대한 정보로부터 화행 정보를 예측하기 위한 화행 추정 파라미터를 구하는 제 9 단계 를 포함하는 음성 인식 방법
|
3 |
3
제 2 항에 있어서, 상기 제 9 단계의 화행 추정 파라미터는, 최대 엔트로피(maximum entropy) 방식을 이용하여 구하는 것을 특징으로 하는 음성 인식 방법
|
4 |
4
제 2 항에 있어서, 상기 제 9 단계의 화행 추정 파라미터는, 백오프(backoff) 평활화 방식을 이용하여 구하는 것을 특징으로 하는 음성 인식 방법
|
5 |
5
제 1 항 내지 제 4 항중 어느 한 항에 있어서, 상기 제 3 단계는, 상기 광역 언어모델을 사용하여 격자(lattice) 형태로 얻어지는 1차 인식 결과를 얻는 제 10 단계; 상기 얻은 격자로부터 제일 확률이 높은 하나의 문장을 추출하는 제 11 단계; 상기 추출한 문장으로부터 상기 소정 개수의 내용어와 문장 종류에 대한 정보를 추출하는 제 12 단계; 및 상기 구한 화행 추정 파라미터를 사용하여 상기 1차 인식 결과가 어느 화행일 확률이 가장 높은지를 추정하는 제 13 단계 를 포함하는 음성 인식 방법
|
6 |
6
제 5 항에 있어서, 상기 제 4 단계는, 상기 제 13 단계에서 추정한 화행 정보에 의존하는 언어모델 값과 광역 언어모델 값을 보간하는 제 14 단계; 및 상기 1차 인식 결과로 주어진 격자에 대하여 상기 화행의존 언어모델을 적용하여 문장 확률이 최대가 되는 문장을 구하여 최종 인식 결과를 출력하는 제 15 단계 를 포함하는 음성 인식 방법
|
7 |
7
제 6 항에 있어서, 상기 제 15 단계에서 구한 문장확률이 최대인 문장에 대하여 선험적인 화행확률을 곱한 값이 최대가 되는 하나의 문장을 추출하여 최종 인식 결과로 출력하는 제 16 단계 를 더 포함하는 음성 인식 방법
|
8 |
8
제 6 항에 있어서, 상기 제 14 단계의 보간 과정은, 보간 가중치가 화행 확률에 비례하도록 정한 것을 특징으로 하는 음성 인식 방법
|
9 |
9
프로세서를 구비한 음성 인식기에, 이전에 인식된 대화의 화행 정보로부터 현재 발성된 내용의 화행 정보를 예측하기 위한 화행 추정 파라미터를 구하는 제 1 기능; 상기 화행 추정 파라미터를 언어모델에 반영하는 제 2 기능; 입력 음성을 1차로 인식한 후에, 상기 1차 음성 인식 결과로부터 상기 화행 추정 파라미터를 사용하여 현재의 화행 정보를 추정하는 제 3 기능; 및 상기 추정한 화행 정보에 따라 상기 1차 인식 결과를 재계산하여 인식 결과를 구하는 제 4 기능 을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|