1 |
1
통계적 음성 언어 이해 방법으로서,음성 발화 문장들을 상기 음성 발화 문장들에 포함된 유사한 화행(dialog act)들을 기초로 클러스터링하는 화행 클러스터링 단계;상기 화행 클러스터링 단계의 결과에서 개체명(named entity) 후보군을 추출하고 추출된 개체명 후보군의 주변 문맥 정보에 기초하여 개체명을 클러스터링하는 개체명 클러스터링 단계; 및상기 개체명 클러스터링 결과에 기초하여 영역별로 주행(main act)을 클러스터링하는 주행 클러스터링 단계를 순차적으로 수행하되,상기 통계적 음성 언어 이해 방법은 비모수 비교사 학습 방법을 기반으로 인위적인 수동 태깅 없이 수행되는, 통계적 음성 언어 이해 방법
|
2 |
2
삭제
|
3 |
3
청구항 1에 있어서,상기 화행 클러스터링 단계는, 상기 화행이 은닉 상태이며 상기 음성 발화 문장들에 포함된 단어들이 관측 값이라는 가정하에, 비모수 베이지안 은닉 마코프 모델(Non-parametric Bayesian Hidden Markov Model)을 이용하여 수행되는 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
4 |
4
청구항 3에 있어서,상기 비모수 베이지안 은닉 마코프 모델은 계층적 디리클레 프로세스 은닉 마코프 모델(Hierarchical Dirichlet Process Hidden Markov model; HDP-HMM)인 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
5 |
5
청구항 4에 있어서,상기 화행의 전이 확률은 디리클레(Dirichlet) 프로세스에 의해 결정되는 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
6 |
6
청구항 3에 있어서,상기 화행 클러스터 단계는, 상기 화행이 은닉 상태이며 상기 음성 발화 문장들에 포함된 단어들이 관측 값이라는 가정하에, 상기 단어들의 근원을 이용하여 화행 클러스터링을 수행하는 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
7 |
7
청구항 3에 있어서,상기 화행 클러스터링 단계는, 상기 화행을 깁스 샘플링(Gibbs sampling) 방법을 이용하여 최종적으로 유추하는 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
8 |
8
청구항 1에 있어서,상기 화행 클러스터링 단계에서 얻어진 영역별 단어 분포를 이용하여 상기 음성 발화 문장들의 영역을 분류하는 단계를 추가로 포함하는 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
9 |
9
청구항 1에 있어서,상기 개체명 클러스터링 단계는, 상기 음성 발화 문장들에 포함된 단어들의 근원을 이용하여 개체명 후보군을 추출하는 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
10 |
10
청구항 9에 있어서,상기 개체명 후보군이 복수의 연속된 단어들로 구성된 경우, 상기 복수의 연속된 단어들을 고착성 함수(stickiness function)를 이용하여 분리하는 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
11 |
11
청구항 10에 있어서,상기 고착성 함수는 포인트 상호 정보(Point Mutual Information; PMI) 함수인 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
12 |
12
청구항 9에 있어서,상기 추출된 개체명 후보군의 주변 문맥 정보는 상기 추출된 개체명 후보군의 앞뒤에 위치한 소정 개수의 단어들에 대하여 계층적 디리클레 프로세스(Hierarchical Dirichlet Process) 알고리즘을 적용하여 얻어지는 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
13 |
13
청구항 1에 있어서,상기 주행 클러스터링 단계는, 상기 주행이 은닉 상태이며 상기 음성 발화 문장들에 포함된 단어들, 상기 음성 발화 문장들로부터 추출된 개체명 및 상기 음성 발화 문장들에 대응되는 시스템 행동이 관측 값이라는 가정하에, 비모수 베이지안 은닉 마코프 모델을 이용하여 수행되는 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
14 |
14
청구항 13에 있어서,상기 비모수 베이지안 은닉 마코프 모델은 계층적 디리클레 프로세스 은닉 마코프 모델인 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
15 |
15
청구항 14에 있어서,상기 주행의 전이 확률은 디리클레 프로세스에 의해 결정되는 것을 특징으로 하는 통계적 음성 언어 이해 방법
|
16 |
16
청구항 15에 있어서,상기 주행 클러스터링 단계에서 도출된 주행들과 상기 전이 확률을 이용하여 아젠다(agenda) 그래프를 생성하는 단계를 추가로 포함한 것을 특징으로 하는 통계적 음성 언어 이해 방법
|