1 |
1
입력 문장을 수신하는 단계;상기 입력 문장에 포함된 언레이블된 단어(unlabeled word)를 검출(detect)하는 단계;상기 입력 문장에 포함된 레이블된 단어들(labeled words)에 기초하여, 상기 언레이블된 단어를 임베딩(embedding)하는 단계; 및 상기 임베딩 결과에 따른 특징 벡터를 출력하는 단계를 포함하는, 단어 임베딩 방법
|
2 |
2
제1항에 있어서,상기 언레이블된 단어를 임베딩하는 단계는상기 언레이블된 단어에 대응하는 적어도 하나의 레이블된 단어를 검색하는 단계; 및상기 입력 문장에 포함된 레이블된 단어들과 상기 검색된 적어도 하나의 레이블된 단어에 기초하여, 상기 언레이블된 단어를 임베딩하는 단계를 포함하는, 단어 임베딩 방법
|
3 |
3
제2항에 있어서, 상기 적어도 하나의 레이블된 단어를 검색하는 단계는웹 서치(web search) 또는 미리 저장된 사전 데이터베이스 중 적어도 하나를 이용하여 상기 적어도 하나의 레이블된 단어를 검색하는 단계를 포함하는, 단어 임베딩 방법
|
4 |
4
제1항에 있어서,상기 언레이블된 단어는상기 입력 문장에 포함된 복수의 단어들 중 미리 정해진 유형의 특징 벡터에 대응되는 레이블된 단어를 제외한 나머지 단어를 포함하는, 단어 임베딩 방법
|
5 |
5
제1항에 있어서,상기 언레이블된 단어를 검출하는 단계는상기 입력 문장에 포함된 복수의 단어들 각각에 대하여,해당 단어에 대응하는 미리 정해진 유형의 특징 벡터를 획득하는 단계; 및상기 해당 단어에 대응하여 상기 미리 정해진 유형의 특징 벡터를 획득할 수 없는 경우, 상기 해당 단어를 상기 언레이블된 단어로 검출하는 단계를 포함하는, 단어 임베딩 방법
|
6 |
6
제5항에 있어서,상기 해당 단어에 대응하는 미리 정해진 유형의 특징 벡터를 획득하는 단계는상기 해당 단어를 뉴럴 네트워크를 포함하는 제1 모델에 인가함으로써, 상기 해당 단어에 대응하는 미리 정해진 유형의 특징 벡터를 획득하는 단계를 포함하는, 단어 임베딩 방법
|
7 |
7
제6항에 있어서,상기 언레이블된 단어를 임베딩하는 단계는상기 언레이블된 단어를 상기 제1 모델과 구별되는 제2 모델에 인가함으로써 임베딩하는 단계를 포함하는, 단어 임베딩 방법
|
8 |
8
제1항에 있어서,상기 언레이블된 단어를 임베딩하는 단계는상기 입력 문장에 포함된 레이블된 단어들을 포함하는 유사 문장들을 검색하는 단계; 및상기 유사 문장들 중 최대 유사도를 가지는 최유사 문장을 이용하여 상기 언레이블된 단어를 임베딩하는 단계를 포함하는, 단어 임베딩 방법
|
9 |
9
제1항에 있어서,상기 언레이블된 단어를 임베딩하는 단계는상기 입력 문장에 포함된 레이블된 단어들을 포함하는 유사 문장들을 검색하는 단계; 상기 유사 문장들 중 설정된 임계치보다 큰 유사도를 가지는 적어도 하나의 유사 문장을 추출하는 단계; 및 상기 적어도 하나의 유사 문장을 이용하여 상기 언레이블된 단어를 임베딩하는 단계를 포함하는, 단어 임베딩 방법
|
10 |
10
제9항에 있어서,상기 적어도 하나의 유사 문장을 추출하는 단계는상기 임계치보다 큰 유사도를 가지는 적어도 하나의 유사 문장을 유사도 순으로 추출하는 단계를 포함하는, 단어 임베딩 방법
|
11 |
11
제1항에 있어서,상기 언레이블된 단어를 임베딩하는 단계는복수의 언레이블된 단어들에 대응하여 기 생성된 특징 벡터들을 저장하는 룩업 테이블을 참조함으로써, 상기 언레이블된 단어에 대응하는 특징 벡터를 검출하는 단계를 포함하는, 단어 임베딩 방법
|
12 |
12
사용자의 음성을 인식하여 입력 문장을 생성하는 단계;상기 입력 문장에 포함된 언레이블된 단어를 검출(detect)하는 단계;상기 입력 문장에 포함된 레이블된 단어들에 대응하는 제1 특징 벡터들을 획득하는 단계; 및상기 제1 특징 벡터들에 기초하여, 상기 언레이블된 단어에 대응하는 제2 특징 벡터를 획득하는 단계; 및상기 제1 특징 벡터들 및 상기 제2 특징 벡터에 기초하여, 상기 입력 문장에 대응하는 해석 정보(interpretation information)를 생성하는 단계를 포함하는, 음성 인식 방법
|
13 |
13
제12항에 있어서,상기 언레이블된 단어를 검출하는 단계는상기 입력 문장에 포함된 복수의 단어들 각각에 대하여,해당 단어에 대응하는 미리 정해진 유형의 상기 제1 특징 벡터를 획득할 수 없는 경우, 상기 해당 단어를 상기 언레이블된 단어로 검출하는 단계를 포함하는, 단어 임베딩 방법
|
14 |
14
제13항에 있어서,상기 제1 특징 벡터들을 획득하는 단계는 상기 입력 문장에 포함된 레이블된 단어들을 뉴럴 네트워크를 포함하는 제1 모델에 인가함으로써, 상기 해당 단어에 대응하는 미리 정해진 유형의 제1 특징 벡터를 획득하는 단계를 포함하는, 음성 인식 방법
|
15 |
15
제12항에 있어서,상기 제2 특징 벡터를 획득하는 단계는 상기 제1 특징 벡터들에 기초하여, 상기 언레이블된 단어를 상기 제1 모델과 구별되는 제2 모델에 인가하여 임베딩 함으로써 상기 제2 특징 벡터를 획득하는 단계를 포함하는, 음성 인식 방법
|
16 |
16
하드웨어와 결합되어 제1항 내지 제15항 중에서 어느 하나의 항의 방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램
|
17 |
17
입력 문장을 수신하는 송수신 인터페이스; 및 상기 입력 문장에 포함된 언레이블된 단어를 검출(detect)하고, 상기 입력 문장에 포함된 레이블된 단어들에 기초하여, 상기 언레이블된 단어를 임베딩(embedding)하는 프로세서를 포함하고, 상기 송수신 인터페이스는상기 임베딩 결과에 따른 특징 벡터를 출력하는, 단어 임베딩 장치
|
18 |
18
제17항에 있어서,상기 프로세서는 웹 서치 또는 미리 저장된 사전 데이터베이스 중 적어도 하나를 이용하여 상기 언레이블된 단어에 대응하는 적어도 하나의 레이블된 단어를 검색하고, 상기 입력 문장에 포함된 레이블된 단어들과 상기 검색된 적어도 하나의 레이블된 단어에 기초하여, 상기 언레이블된 단어를 임베딩하는, 단어 임베딩 장치
|
19 |
19
제17항에 있어서,상기 프로세서는 상기 입력 문장에 포함된 복수의 단어들 각각에 대하여, 해당 단어에 대응하는 미리 정해진 유형의 특징 벡터를 획득하고, 상기 해당 단어에 대응하여 상기 미리 정해진 유형의 특징 벡터를 획득할 수 없는 경우, 상기 해당 단어를 상기 언레이블된 단어로 검출하는, 단어 임베딩 장치
|
20 |
20
사용자의 음성을 인식하여 입력 문장을 생성하는 문장 생성기; 및상기 입력 문장에 포함된 언레이블된 단어를 검출(detect)하고, 상기 입력 문장에 포함된 레이블된 단어들에 대응하는 제1 특징 벡터들을 획득하며, 상기 제1 특징 벡터들에 기초하여, 상기 언레이블된 단어에 대응하는 제2 특징 벡터를 획득하는 단어 임베딩 장치를 포함하고, 상기 제1 특징 벡터들 및 상기 제2 특징 벡터에 기초하여, 상기 입력 문장에 대응하는 해석 정보(interpretation information)를 생성하는, 음성 인식 장치
|