1 |
1
입력음성에 대해 음성인식을 수행하여 단어 격자(word lattice)를 생성하는 단계;상기 단어 격자를 시간 중복성 및 음소 유사성에 기초해 클러스터링한 컨퓨젼(confusion) 세트들의 시간적 연결로 형성되는 단어 컨퓨젼 네트워크로 변환하는 단계;상기 단어 컨퓨젼 네트워크에 포함되는 각각의 상기 컨퓨젼 세트의 엔트로피(entropy) 값에 기초하여 서브 단어 컨퓨젼 네트워크 목록을 생성하는 단계; 및상기 서브 단어 컨퓨젼 네트워크 목록을 분산환경 리스코어링(rescoring)을 통하여 수정한 수정 단어 컨퓨젼 네트워크를 생성하는 단계를 포함하는 분산환경 리스코어링 방법
|
2 |
2
청구항 1에 있어서,상기 단어 격자는,상기 음성인식을 통하여 인식된 단어 후보들의 연결 및 방향성이 표시된 그래프인 것을 특징으로 하는 분산환경 리스코어링 방법
|
3 |
3
청구항 1에 있어서,상기 컨퓨젼 세트는,상기 음성인식을 통하여 인식된 단어들의 목록을 포함하고, 상기 인식된 단어 각각은 사후확률(posterior probability) 값을 갖는 것을 특징으로 하는 분산환경 리스코어링 방법
|
4 |
4
청구항 1에 있어서,상기 단어 컨퓨젼 네트워크에 포함되는 각각의 상기 컨퓨젼 세트의 엔트로피 값에 기초하여 서브 단어 컨퓨젼 네트워크 목록을 생성하는 단계는,상기 컨퓨젼 세트에 포함되는 단어들의 사후확률 값에 기초하여 상기 엔트로피 값을 산출하고, 상기 엔트로피 값에 기초하여 상기 컨퓨젼 세트를 상기 서브 단어 컨퓨젼 네트워크의 후보로 선정하는 단계; 및상기 서브 단어 컨퓨젼 네트워크의 후보로 선정된 상기 컨퓨젼 세트에 포함되는 단어의 컨텍스트(context)에 기초하여 서브 단어 컨퓨젼 네트워크 목록을 생성하는 단계를 포함하는 것을 특징으로 하는 분산환경 리스코어링 방법
|
5 |
5
청구항 4에 있어서,상기 서브 단어 컨퓨젼 네트워크 목록을 분산환경 리스코어링을 통하여 수정한 수정 단어 컨퓨젼 네트워크를 생성하는 단계는,상기 서브 단어 컨퓨젼 네트워크 목록에 기초하여 네트워크 환경에 분산된 복수의 분산 서버로 전송할 분산 쿼리(openquery) 목록을 생성하는 단계;상기 분산 쿼리 목록에 기초하여 상기 복수의 분산 서버가 처리할 수 있는 분산 쿼리 세트를 생성하는 단계;상기 복수의 분산 서버로 상기 분산 쿼리 세트를 전송하고, 상기 분산 쿼리 세트에 대한 스코어 값을 상기 복수의 분산 서버로부터 수신하는 단계; 및상기 분산 쿼리 세트에 대한 스코어 값에 기초하여 상기 서브 단어 컨퓨젼 네트워크 목록을 리스코어링하고, 리스코어링된 상기 서브 단어 컨퓨젼 네트워크 목록 및 상기 단어 컨퓨젼 네트워크를 통합하여 상기 수정 단어 컨퓨젼 네트워크를 생성하는 단계를 포함하는 것을 특징으로 하는 분산환경 리스코어링 방법
|
6 |
6
청구항 5에 있어서,상기 분산 쿼리 목록은,n-gram 목록이고,상기 분산 쿼리 세트는,n-gram 목록으로 분류된 세트인 것을 특징으로 하는 분산환경 리스코어링 방법
|
7 |
7
입력음성에 대해 음성인식을 수행하여 단어 격자(word lattice)를 생성하는 음성 인식부;상기 단어 격자를 시간 중복성 및 음소 유사성에 기초해 클러스터링한 컨퓨젼(confusion) 세트들의 시간적 연결로 형성되는 단어 컨퓨젼 네트워크로 변환하는 단어 컨퓨젼 네트워크 생성부;상기 단어 컨퓨젼 네트워크에 포함되는 각각의 상기 컨퓨젼 세트의 엔트로피(entropy) 값에 기초하여 서브 단어 컨퓨젼 네트워크 목록을 생성하는 서브 단어 컨퓨젼 네트워크 목록 생성부; 및상기 서브 단어 컨퓨젼 네트워크 목록을 분산환경 리스코어링(rescoring)을 통하여 수정한 수정 단어 컨퓨젼 네트워크를 생성하는 분산환경 리스코어링부를 포함하는 분산환경 리스코어링 장치
|
8 |
8
청구항 7에 있어서,상기 단어 격자는,상기 음성인식을 통하여 인식된 단어 후보들의 연결 및 방향성이 표시된 그래프인 것을 특징으로 하는 분산환경 리스코어링 장치
|
9 |
9
청구항 7에 있어서,상기 컨퓨젼 세트는,상기 음성인식을 통하여 인식된 단어들의 목록을 포함하고, 상기 인식된 단어 각각은 사후확률(posterior probability) 값을 갖는 것을 특징으로 하는 분산환경 리스코어링 장치
|
10 |
10
청구항 7에 있어서,상기 서브 단어 컨퓨젼 네트워크 목록 생성부는,상기 컨퓨젼 세트에 포함되는 단어들의 사후확률 값에 기초하여 상기 엔트로피 값을 산출하고, 상기 엔트로피 값에 기초하여 상기 컨퓨젼 세트를 상기 서브 단어 컨퓨젼 네트워크의 후보로 선정하고, 상기 서브 단어 컨퓨젼 네트워크의 후보로 선정된 상기 컨퓨젼 세트에 포함되는 단어의 컨텍스트(context)에 기초하여 서브 단어 컨퓨젼 네트워크 목록을 생성하는 것을 특징으로 하는 분산환경 리스코어링 장치
|
11 |
11
청구항 10에 있어서,상기 분산환경 리스코어링부는,상기 서브 단어 컨퓨젼 네트워크 목록에 기초하여 네트워크 환경에 분산된 복수의 분산 서버로 전송할 분산 쿼리(openquery) 목록을 생성하고, 상기 분산 쿼리 목록에 기초하여 상기 복수의 분산 서버가 처리할 수 있는 분산 쿼리 세트를 생성하고, 상기 복수의 분산 서버로 상기 분산 쿼리 세트를 전송하고, 상기 분산 쿼리 세트에 대한 스코어 값을 상기 복수의 분산 서버로부터 수신하고, 상기 분산 쿼리 세트에 대한 스코어 값에 기초하여 상기 서브 단어 컨퓨젼 네트워크 목록을 리스코어링하고, 리스코어링된 상기 서브 단어 컨퓨젼 네트워크 목록 및 상기 단어 컨퓨젼 네트워크를 통합하여 상기 수정 단어 컨퓨젼 네트워크를 생성하는 것을 특징으로 하는 분산환경 리스코어링 장치
|
12 |
12
청구항 11에 있어서,상기 분산 쿼리 목록은,n-gram 목록이고,상기 분산 쿼리 목록 세트는,n-gram 목록으로 분류된 세트인 것을 특징으로 하는 분산환경 리스코어링 장치
|