1 |
1
입력된 음성을 인식 가능한 텍스트로 출력하도록 언어처리한 후, 모션 제어를 위한 속도 제어 텍스트로 변환하여 할당하는 음성인식엔진;상기 음성인식엔진에서 속도 제어 텍스트를 할당받는 프로그래밍 언어를 통해 속도 제어 명령을 전달받아 로봇 또는 자율이동체가 구동되도록 속도 값을 전달하는 로봇운영시스템;상기 로봇운영시스템으로부터 속도 값을 전달받아 로봇 또는 자율이동체를 구동하는 구동부를 포함하며,상기 음성인식엔진은,음성 인식에 필요한 특징 벡터를 잡음처리하고, MFCC(Mel frequency cepstral coefficients) 알고리즘을 이용하며, 1/100(초) 단위로 추출하는 전처리부 및음성인식 알고리즘을 저장하며, 상기 전처리부에서 추출된 특징 벡터를 상기 음성인식 알고리즘을 통해 분석하여 언어처리 하는 인식부를 포함하되,상기 음성인식 알고리즘은,마이크를 통해 입력된 음성에 대하여 MLLR(Maximum Likelihood Linear Regression) 적응 후, MAP(Maximum A Posteriori) 적응기법을 이용하여 적응성을 갖도록 하는 음향모델;단어 단위 검색 및 문장 단위 검색을 포함하여 상기 추출된 특징 벡터를 상기 적응성을 가진 음향모델과 패턴 비교 후 인식 가능한 텍스트 형태로 변환하되, 어휘 및 문법 구조를 제약하여 언어처리하고, HMM(Hidden markov Model)의 통계적 패턴 인식을 기반으로 하는 언어모델 및상기 언어모델이 상기 추출된 특징 벡터와 상기 음향모델 비교 시에, 인식 가능한 텍스트 형태로 변환할 수 있는지 판별해 주는 데이터 사전을 포함하고,상기 인식부는 전처리부에서 추출된 음성의 특징 벡터를 전달받아 상기 음향모델과 패턴 비교하여 인식 결과를 얻으며,상기 언어모델의 단어 단위 검색은 음소 단위의 검색을 포함하여 진행되며, 데이터베이스에 저장된 음향모델과의 단어 단위 또는 음소 단위의 패턴 비교를 통해 가능한 후보 단어 또는 후보 음소를 추출한 후 문장 단위 검색을 진행하고,상기 문장 단위 검색은 후보 단어 또는 후보 음소들의 정보를 토대로, 데이터 사전을 이용하여 문법 구조, 문장 문맥, 특정 주제에 부합 여부를 판단하여 가장 적합한 단어나 음소를 판별하며,상기 음성인식엔진은 포켓스피닉스(Pocketsphinx) 또는 다른 개방형 음성인식모듈을 포함하고,상기 프로그래밍 언어는 파이썬(python) 또는 C/C++이며,상기 프로그래밍 언어로부터 상기 로봇운영시스템으로의 속도 제어 명령 전달은 유선 또는 무선 통신방식을 통해서 전달되고,상기 구동부는,상기 로봇운영시스템으로부터 속도 값을 전달받아 속도를 저레벨 신호로 입력하는 저레벨 프로세서;상기 저레벨 프로세서를 통해 입력된 속도 신호를 펄스 변조하는 PWM 생성기 및상기 PWM 생성기로부터 변조된 펄스에 따라 로봇 또는 자율이동체를 구동하는 DC 모터를 포함하는 로봇 및 자율이동체 정밀 모션 제어를 위한 단독형 음성인식 기반 에이전트 모듈
|