1 |
1
음향모델, 언어모델, 데이터 사전을 포함하는 음성인식 알고리즘을 이용하여 로봇 또는 자율이동체의 모션을 제어하는 로봇 및 자율이동체 정밀 모션 제어를 위한 단독형 음성인식 기반 에이전트 모듈의 작동방법에 있어서,(a) 마이크를 통한 사용자의 음성 입력 단계;(b) 입력된 음성의 특징 벡터를 추출하는 단계;(c) 특징 벡터를 음성인식 알고리즘을 이용하여 인식 가능한 텍스트로 변환하는 단계;(d) 인식 가능하도록 변환된 텍스트를 속도 제어 텍스트로 변환하는 단계;(e) 속도 제어 텍스트를 프로그래밍 언어를 통해 속도 제어 명령을 생성하는 단계 및(f) 상기 속도 제어 명령에 따라 로봇운영시스템이 로봇 또는 자율이동체의 모션을 동작시키는 구동부를 제어하는 단계를 포함하며,상기 (b) 내지 (d) 단계는 음성인식 알고리즘을 포함하는 음성인식엔진에서 이루어지고,상기 (c) 단계는,음향모델이 화자의 음성에 적응하는 단계;상기 화자에 적응한 음향모델과 상기 특징 벡터를 비교하여 음성을 인식하는 단계 및인식된 음성에 따라 언어모델이 후보 음소 또는 후보 단어를 추출 후, 데이터 사전을 이용하여 정확한 음성을 판별하여, 로봇 및 자율이동체 모션 제어를 위해 인식 가능한 텍스트 형태로 변환하는 단계를 포함하되,상기 음성인식엔진은,음성 인식에 필요한 특징 벡터를 잡음처리하고, MFCC(Mel frequency cepstral coefficients) 알고리즘을 이용하며, 1/100(초) 단위로 추출하는 전처리부 및음성인식 알고리즘을 저장하며, 상기 전처리부에서 추출된 특징 벡터를 상기 음성인식 알고리즘을 통해 분석하여 언어처리 하는 인식부를 포함하며,상기 음향모델은,마이크를 통해 입력된 음성에 대하여 MLLR(Maximum Likelihood Linear Regression) 적응 후, MAP(Maximum A Posteriori) 적응기법을 이용하여 적응성을 갖고,상기 언어모델은,단어 단위 검색 및 문장 단위 검색을 포함하여 상기 추출된 특징 벡터를 상기 적응성을 가진 음향모델과 패턴 비교 후 인식 가능한 텍스트 형태로 변환하되, 어휘 및 문법 구조를 제약하여 언어처리하고, HMM(Hidden markov Model)의 통계적 패턴 인식을 기반으로 패턴 비교하며,상기 데이터사전은,상기 언어모델이 상기 추출된 특징 벡터와 상기 음향모델 비교 시에, 인식 가능한 텍스트 형태로 변환할 수 있는지 판별해 주고,상기 인식부는 전처리부에서 추출된 음성의 특징 벡터를 전달받아 상기 음향모델과 패턴 비교하여 인식 결과를 얻으며,상기 언어모델의 단어 단위 검색은 음소 단위의 검색을 포함하여 진행되며, 데이터베이스에 저장된 음향모델과의 단어 단위 또는 음소 단위의 패턴 비교를 통해 가능한 후보 단어 또는 후보 음소를 추출한 후 문장 단위 검색을 진행하고,상기 문장 단위 검색은 후보 단어 또는 후보 음소들의 정보를 토대로, 데이터 사전을 이용하여 문법 구조, 문장 문맥, 특정 주제에 부합 여부를 판단하여 가장 적합한 단어나 음소를 판별하며, 상기 구동부는 저레벨 프로세서, PWM 생성기 및 DC 모터를 포함하며,상기 (f) 단계는,상기 로봇운영시스템으로부터 저레벨 프로세서가 속도 값을 전달받아 속도를 저레벨 신호로 입력하는 단계;PWM 생성기가 상기 저레벨 프로세서를 통해 입력된 저레벨의 속도 신호를 펄스 변조하는 단계 및DC 모터가 상기 PWM 생성기로부터 변조된 펄스에 따라 로봇 또는 자율이동체의 모션이 동작되도록 구동하는 단계를 포함하고,상기 음성인식엔진은 포켓스피닉스(Pocketsphinx) 또는 다른 개방형 음성인식 모듈을 포함하고,상기 프로그래밍 언어는 C/C++ 또는 파이썬(python)이고,상기 프로그래밍 언어로부터 상기 로봇운영시스템으로의 속도 제어 명령 전달은 유선 또는 무선 통신방식을 통해서 전달되는 것을 특징으로 하는 로봇 및 자율이동체 정밀 모션 제어를 위한 단독형 음성인식 기반 에이전트 모듈의 작동방법
|