기술번호
|
KST2014063089
|
자료제공기관
|
미래기술마당
|
기술공급기관
|
|
기술명
|
뇌의 음성처리에 기반한 음성신호 프레임 중첩 분할 방법
|
기술개요
|
1) 뇌의 음성처리에 기반한 음성신호 프레임 중첩 분할 방법 - 뇌에서 음성신호를 분할하는 과정을 모사하여 자음과 모음을 서로 다른 길이의 프레임으로 비균등하게 나누는 방법을 제공하며, 특히 stop consonant의 특징을 효과적으로 추출할 수 있으며 잡음에 대한 강건성 증가를 이끌어 냄 - 잡음속에서도 성신호를 분할하는데 사용되는 레퍼런스 신호가 잘 유지되어 신호의 고유 특징을 추출할 수 있음 - 기존 음성분할 방식에 비해 잡음 속 평균 13%의 인식률 향상을 보임
|
개발상태
|
연구실환경 테스트
|
기술의 우수성
|
1) 기존 기술의 현황 및 문제점 - 기존의 음성신호특징추출기술은 음성신호에 잡음이 섞일 경우 잡음의 주파수 성분까지 특징벡터에 포함되고 음성신호 고유의 특징을 담아내지 못하여 인식률의 저하 초래. - 또한 지속시간이 길고 주기적인 특성을 갖는 모음을 인식하는 데는 효과적이지만 지속시간이 짧고 비주기적인 특성을 갖는 자음을 인식하는데 효과적이지 않음. - 음성신호 내의 의미있는 구간을 찾기위해 반복적인 구간별 차이(difference) 계산을 수행해야 하므로 computation complexity가 높음.
2) 본 기술의 효과 - 본 기술은 신호의 동적 특성을 고려하여 신호가 불균등하게 분할되기 때문에 자음과 모음의 특성을 효과적으로 나타낼 수 있는 분할 방식임. - 본 기술은 음성신호 내에 존재하는 음성 분할 경계(boundary)를 사용하기 때문에 반복적인 계산이 필요없고 이에 따라 computation complexity가 낮아짐. - 본 기술은 Overlap이 필요없어 적은 개수의 프레임으로 음성신호를 분할 할 수 있음.
|
응용분야
|
1) 예상 적용처 - 휴대폰 음성인식 시스템 - 음성인식을 이용한 자동차제어시스템 - 음성인식을 통한 기계제어 산업 전분야 활용 가능
|
시장규모 및 동향
|
1) 세계 시장은 다양한 산업분야와 융합하여 연평균 8.8% 성장을 통해 2015년까지 584억 달러 규모의 시장으로 성장할 것으로 전망됨.
2) 국내시장은 2015년까지 총 6,200억원 규모로 예상됨.
3) 미국 Nuance가 약 70% 점유율로 세계 음성인식시장을 주도하고 있으며, 구글, MS, 애플 등이 인수ㆍ합병 및 제휴를 통해 시장을 공략하고 있음.
4) 국내 음성검색서비스는 다음과 네이버가 한글음성인식기술은 Voiceware, HCI Lab, ETRI가 주도하고 있음.
|
희망거래유형
|
|
사업화적용실적
|
|
도입시고려사항
|
|