1 |
1
자연어 문장에서 응대 여부를 판단하는 음성인식 방법으로:상기 방법은, 사용자가 발화한 음성을 음성입력 장치에서 디지털 음성신호로 변환하는 단계;상기 변환된 디지털 음성신호에서 음향정보 추출 툴킷인 OpenSmile Toolkit을 이용하여 음향정보를 추출하고, 임베디드용 음성인식기를 이용하여 텍스트를 단어별로 인식하는 단계;상기 추출된 음향정보와 상기 인식된 단어를 의도분류기로 보내어, 요청문과 의문문 그리고 평서문으로 분류하는 단계;상기 의도분류기에서 평서문으로 분류된 음성에 대해 비응대로 결정하고, 요청문과 의문문은 토픽분류기로 보내는 단계; 및상기 요청문과 의문문을 토픽분류기에서 미리 정한 클래스의 토픽 및 기타로 분류하여 기타는 비응대로 결정하고, 상기 미리 정한 클래스의 토픽을 응대대상으로 판단하는 단계를 포함하고, 상기 토픽분류기 및 상기 의도분류기는, 자연어처리 툴킷 Fasttext의 문장분류 알고리즘인 Linear Bag of Words Classifier를 이용하는,자연어 문장에서 응대 여부를 판단하는 음성인식 방법
|
2 |
2
제 1항에 있어서,상기 의도분류기는, 음향정보로 음고(Pitch)와 포먼트(Forment)정보가 포함된 단어 인식을 위한 문장 데이터베이스를 포함하고, 상기 문장 데이터베이스는, 입력된 문장을 요청문, 평서문 및 의문문으로 분류하기 위한 음고와 포먼트 정보가 포함된 요청문, 평서문 및 의문문별 문장 데이터를 포함하며, 상기 음고와 포먼트 정보가 포함된 요청문, 평서문, 및 의문문별 문장 데이터는 미리 정한 기간 단위로 갱신하여 저장하는,자연어 문장에서 응대 여부를 판단하는 음성인식 방법
|
3 |
3
제 2항에 있어서,상기 문장 데이터베이스는, 상기 판단하는 단계에 따른 토픽별 답변을 상기 미리 정한 클래스의 토픽을 포함하는 요청문 및 의문문에 응대하는 평서문 문장 데이터로 더 포함하고,상기 판단하는 단계는, 스피커로 상기 응대하는 평서문 문장을 발화하는 단계를 더 포함하는, 자연어 문장에서 응대 여부를 판단하는 음성인식 방법
|
4 |
4
제 1항에 있어서,상기 미리 정한 클래스의 토픽은 이메일(email), 주택 제어(house control), 날씨(weather), 및 일정(schedule)이며,상기 토픽분류기는, 상기 미리 정한 클래스의 토픽에 새로운 토픽을 추가하는 토픽추가부를 더 포함하는,자연어 문장에서 응대 여부를 판단하는 음성인식 방법
|
5 |
5
제 4항에 있어서,상기 토픽분류기는, 단어 데이터베이스를 포함하고, 상기 단어 데이터베이스는 각 토픽별 임베딩 데이터를 포함하며, 상기 각 토픽별 단어 및 유사단어 데이터는 미리 정한 기간 단위로 갱신하여 저장하는,자연어 문장에서 응대 여부를 판단하는 음성인식 방법
|
6 |
6
사용자가 발화한 음성을 음성입력 장치에서 디지털 음성신호로 변환하도록 프로그램된 코드 부분;상기 변환된 디지털 음성신호에서 음향정보 추출 툴킷인 LIBROSA python library를 이용하여 음향정보를 추출하고, 임베디드용 음성인식기를 이용하여 텍스트를 단어별로 인식하도록 프로그램된 코드 부분;상기 추출된 음향정보와 상기 인식된 단어를 의도분류기로 보내어, 요청문과 의문문 그리고 평서문으로 분류하도록 프로그램된 코드 부분;상기 의도분류기에서 평서문으로 분류된 음성에 대해 비응대로 결정하고, 요청문과 의문문은 토픽분류기로 보내도록 프로그램된 코드 부분; 및상기 요청문과 의문문을 토픽분류기에서 미리 정한 클래스의 토픽 및 기타로 분류하여 기타는 비응대로 결정하고, 상기 미리 정한 클래스의 토픽을 응대대상으로 판단하도록 프로그램된 코드 부분을 포함하고, 상기 토픽분류기 및 상기 의도분류기는, 자연어처리 툴킷 Fasttext의 문장분류 알고리즘인 Linear Bag of Words Classifier를 이용하는,자연어 문장에서 응대 여부를 판단하도록 프로그램된 음성인식 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능 저장매체
|