1 |
1
음성인식시스템에 적용되는 발음사전 생성 방법에 있어서, 신경망을 이용하여 각 자소별로 대응되는 음소를 직접 매핑시키는 다층 퍼셉트론을 학습시켜 예외 단어 발음사전 데이터베이스, 예외 자소 발음사전 데이터베이스, 각 자소별 음소출력 다층 퍼셉트론(MLP) 파라메터 데이터베이스를 구성하는 제 1 단계; 및 전처리된 입력 단어에 대해, 상기 예외 단어 발음사전 데이터베이스, 상기 예외 자소 발음사전 데이터베이스, 상기 다층 퍼셉트론 파라메터 데이터베이스를 검사하여 해당 단어의 발음열을 후처리한 후에 출력하는 제 2 단계 를 포함하여 이루어진 발음사전 생성 방법
|
2 |
2
제 1 항에 있어서, 상기 제 1 단계는, 단어의 각 자소와 음소 사이의 유사도를 지식 및 사례를 토대로 정의하여 다이내믹 타임 와핑(DTW) 알고리즘에 의해 단어별로 각 자소와 음소 사이의 대응관계를 설정하는 제 3 단계; 구해진 각 자소-음소 매핑 데이터를 가지고 각 자소별 다층 퍼셉트론을 역전사(Back-Propagation) 방식으로 학습시켜 자소별 음소출력 다층 퍼셉트론 네트워크를 구성하는 제 4 단계; 이전 발음사전을 입력하여 구현된 다층 퍼셉트론의 자소별 발음출력과 이전 발음사전이 일치하지 않으면서 항상 한가지 결과를 출력하는지를 분석하는 제 5 단계; 상기 제 5 단계의 분석결과, 구현된 다층 퍼셉트론의 자소별 발음출력과 이전 발음사전이 일치하지 않으면서 항상 한가지 결과를 출력하면, 이를 상기 예외 자소 발음사전 데이터베이스에 등록하여 상기 예외 자소 발음사전 데이터베이스를 구성하고, 그렇지 않으면 각 단어의 발음열 출력이 이전 발음사전과 완전히 일치하는지를 검사하는 제 6 단계; 및 상기 제 6 단계의 검사결과, 일치하지 않으면 상기 예외 단어 발음사전 데이터베이스에 등록하여 상기 예외 단어 발음사전 데이터베이스를 구성하고, 일치하면 각 단어의 발음열 출력이 다층 퍼셉트론 출력으로 대체 가능하므로 이를 상기 자소별 음소출력 다층 퍼셉트론 파라메터 데이터베이스에 등록하여 상기 자소별 음소출력 다층 퍼셉트론 파라메터 데이터베이스를 구성하는 제 7 단계 를 포함하여 이루어진 발음사전 생성 방법
|
3 |
3
제 2 항에 있어서, 상기 제 4 단계의 학습과정은, 입력 노드를 해당 자소 및 그 자소의 전후 제1 소정의 자소를 입력으로 사용하되, 학습후의 성능이 특별히 낮은 경우에는 전후의 문맥 정보를 추가로 사용하여 전후 제2 소정의 자소를 입력으로 사용하는 것을 특징으로 하는 발음사전 생성 방법
|
4 |
4
제 1 항 내지 제 3 항중 어느 한 항에 있어서, 상기 제 2 단계는, 인식 후보단어에 대한 텍스트가 입력되면, 텍스트 전처리 과정을 수행하여 처리 가능한 알파벳만의 문자열로 변경시키는 제 8 단계; 입력된 단어가 예외 단어 발음사전 데이터베이스에 등록되어 있는지를 분석하여, 있으면 등록된 발음열을 출력하고, 없으면 단어의 자소가 상기 예외 자소 발음사전 데이터베이스에 등록되어 있는지를 검사하는 제 9 단계; 상기 제 9 단계의 검사결과, 등록되어 있으면 해당 음소를 출력하고, 등록되어 있지 않으면 각 자소별 음소출력 다층 퍼셉트론 파라메터 데이터베이스에 의한 다층 퍼셉트론으로 해당 음소를 출력한 후에, 입력된 단어의 자소수만큼 수행하였는지를 판단하는 제 10 단계; 및 상기 제 10 단계의 판단결과, 입력된 단어의 자소수만큼 수행하지 않았으면 상기 제 9 단계로 넘어가고, 수행하였으면 발음열 후처리 과정을 수행한 후에, 최종 단어 발음열을 출력하는 제 11 단계 를 포함하여 이루어진 발음사전 생성 방법
|
5 |
5
제 4 항에 있어서, 상기 제 11 단계의 발음열 후처리 과정은, 발음열중에 동일한 음소가 연결되어 출력된 경우에 이를 하나로 줄여 주거나 묵음의 출력시에 이를 제거하는 것을 특징으로 하는 발음사전 생성 방법
|
6 |
6
제 5 항에 있어서, 상기 각 단어는, 영어의 알파벳(자소)으로 구성되는 것을 특징으로 하는 발음사전 생성 방법
|
7 |
7
프로세서를 구비한 음성인식시스템에, 신경망을 이용하여 각 자소별로 대응되는 음소를 직접 매핑시키는 다층 퍼셉트론을 학습시켜 예외 단어 발음사전 데이터베이스, 예외 자소 발음사전 데이터베이스, 각 자소별 음소출력 다층 퍼셉트론(MLP) 파라메터 데이터베이스를 구성하는 기능; 및 전처리된 입력 단어에 대해, 상기 예외 단어 발음사전 데이터베이스, 상기 예외 자소 발음사전 데이터베이스, 상기 다층 퍼셉트론 파라메터 데이터베이스를 검사하여 해당 단어의 발음열을 후처리한 후에 출력하는 기능 을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|