1 |
1
언어모델의 고유 명사 추가 장치에서 신규 고유명사와 분류어를 수집하는 수집부와,상기 신규 고유 명사 및 분류어를 텍스트 스코프에서 검색하여 매칭된 문장들을 후보 문장으로 선정하는 후보 문장 선정부와,상기 후보 문장으로부터 후보 문틀을 추출하는 후보 문틀 추출부와,상기 후보 문틀에서 엔그램 형식의 후보 문틀을 추출하는 엔그램의 후보 문틀 생성부와,상기 엔그램 형식의 후보 문틀 각각에 대한 점수 산정을 통해 높은 점수 별로 순위화하는 순위화부와,순위화 된 엔그램 형식의 후보 문틀에 수집된 고유 명사를 대입하여 엔그램 확장을 수행하는 엔그램 확장부와,상기 엔그램 확장을 통해 생성된 엔그램을 언어모델에 빈도와 함께 추가하는 반영부를 포함하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치
|
2 |
2
제1항에 있어서,상기 수집부는,훈련용 텍스트 코퍼스에서 출현하지 않는 고유 명사를 수집하고, 상기 고유 명사로부터 개념적으로 구분되는 카테고리를 분류어로 할당하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치
|
3 |
3
제1항에 있어서,상기 후보 문틀 추출부는,상기 후보 문장에서 상기 고유 명사를 포함한 일정한 길이의 지역 문맥을 문틀의 형식으로 추출하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치
|
4 |
4
제1항에 있어서,상기 순위화부는,상기 엔그램 형식의 후보 문틀 마다 고유 명사를 포함하는 문틀의 개수 및 전체 코퍼스에서 문틀의 개수를 토대로 문틀의 적합성을 측정하고, 고유 명사를 포함하는 문틀의 개수 및 문틀의 상태도수를 토대로 문틀의 엔트로피를 산출하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치
|
5 |
5
제1항에 있어서,상기 엔그램 확장부는,적어도 하나의 상위 점수 문틀을 선정하고, 수집한 각각의 고유 명사를 문틀의 해당 위치에 대입하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치
|
6 |
6
언어모델의 고유 명사 추가 장치에서 신규 고유명사와 분류어를 수집하는 과정과,수집된 상기 신규 고유 명사 및 분류어를 텍스트 스코프에서 검색하여 매칭된 문장들을 후보 문장으로 선정하는 과정과,선정된 상기 후보 문장으로부터 후보 문틀을 추출하는 과정과,추출된 상기 후보 문틀에서 엔그램 형식의 후보 문틀을 추출하는 과정과,추출된 상기 엔그램 형식의 후보 문틀 각각에 대한 점수 산정을 통해 높은 점수 별로 순위화하는 과정과,순위화 된 엔그램 형식의 문틀에 수집된 고유 명사를 대입하여 엔그램 확장을 수행하는 과정과,상기 엔그램 확장을 통해 생성된 엔그램을 언어모델에 빈도와 함께 추가하는 과정을 포함하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 방법
|
7 |
7
제 6항에 있어서,상기 수집하는 과정은,훈련용 텍스트 코퍼스에서 출현하지 않는 고유 명사를 수집하고, 상기 고유 명사로부터 개념적으로 구분되는 카테고리를 분류어로 할당하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 방법
|
8 |
8
제 6항에 있어서, 상기 후보 문틀을 추출하는 과정은,상기 후보 문장에서 상기 고유 명사를 포함한 일정한 길이의 지역 문맥을 문틀의 형식으로 추출하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 방법
|
9 |
9
제 6항에 있어서,상기 점수 별로 순위화하는 과정은,상기 엔그램 형식의 후보 문틀 마다 고유 명사를 포함하는 문틀의 개수 및 전체 코퍼스에서 문틀의 개수를 토대로 문틀의 적합성을 측정하는 과정과, 고유 명사를 포함하는 문틀의 개수 및 문틀의 상태도수를 토대로 문틀의 엔트로피를 산출하는 과정을 포함하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 방법
|
10 |
10
제 6항에 있어서,상기 엔그램 확장을 수행하는 과정은,적어도 하나의 상위 점수 문틀을 선정하고, 수집한 각각의 고유 명사를 문틀의 해당 위치에 대입하는 것을 특징으로 하는 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 방법
|