1 |
1
입력한 문장을 형태소 단위로 분석하는 형태소 분석부;어절 간 통사적 결합 패턴을 규칙의 조건부로 두어 운율구 경계를 결정하는 규칙인 운율구 예측 규칙을 이용하여 운율구 경계를 예측하는 규칙 기반 예측부;운율구 예측 규칙에 의한 예측 결과와 다른 언어정보에 기반을 둔 심층학습 기반 모형을 이용하여 운율구 경계를 예측하는 통계 기반 예측부;를 포함하고,상기 통계 기반 예측부는 입력 문장을 어절 단위의 벡터로 표현할 때 운율구 예측 규칙에 의한 예측 결과를 반영하고, 어절별로 첫 형태소의 벡터, 끝 형태소의 벡터, 첫 형태소 경계 분포 벡터, 끝 형태소 경계 분포 벡터를 갖고,경계 분포 벡터는 학습 데이터로 활용된 운율구 경계 분석 말뭉치에서 각 형태소를 포함한 어절 뒤에 어떤 경계가 나타나는지를 확인하고, 이를 확률화하여 구성하는 벡터이고, 한 어절에 대한 각 형태소 경계의 확률값은 모두 더했을 때 1이 되는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 장치
|
2 |
2
삭제
|
3 |
3
제 1 항에 있어서, 운율구 예측 규칙은 통사 구조에 따라 확정적으로 결정되는 운율구 경계를 시스템 내부에서 구현하기 위한 것으로,관측 어절의 마지막 형태소가 주제화 보조사 '은/는'일 경우 운율구 경계가 올 가능성이 큰 것으로 판단하는 제 1 윤율구 예측 규칙 및,문장 내 독립성분의 앞과 뒤는 강하게 끊어 읽을 확률이 높은 것으로 판단하는 제 2 운율구 예측 규칙을 포함하는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 장치
|
4 |
4
삭제
|
5 |
5
제 1 항에 있어서, 상기 형태소 분석부는,형태소 분석(Morphological Analysis)을 위하여 입력된 문자열을 분석하여 형태소(morpheme)라는 최소 의미 단위로 분리하는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 장치
|
6 |
6
제 1 항에 있어서, 심층학습 기반 모형은,Bidirectional LSTM(Long-Short Term Memory units)을 활용하여 운율구 경계 예측을 위한 자질정보를 추출하고, CRF(Conditional Random Field)를 활용하여 운율구 경계를 예측하는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 장치
|
7 |
7
제 6 항에 있어서, 심층학습 기반 모형은,단어의 분산표현을 위한 층으로 이후 층에서 처리하기 위해 입력 단어를 단어 벡터로 사상하는 입력층과,합성곱 신경망 또는 순환 신경망의 인공신경망 모형으로 심층학습 기반층이 되는 중간층과,입력 단어에 해당하는 강한 경계, 약한 경계, 비경계의 운율구 유형을 출력하는 출력층을 갖는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 장치
|
8 |
8
형태소 분석부에서 입력한 문장을 형태소 단위로 분석하는 단계;규칙 기반 예측부에서 어절 간 통사적 결합 패턴을 규칙의 조건부로 두어 운율구 경계를 결정하는 규칙인 운율구 예측 규칙을 활용하여 운율구 경계를 예측하는 단계;입력 문장을 어절 단위의 벡터로 표현할 때 운율구 예측 규칙에 의한 예측 결과를 반영하여 통계 기반 예측부에서 운율구 예측 규칙에 의한 예측 결과와 다른 언어정보에 기반을 둔 심층학습 기반 모형을 이용하여 운율구 경계를 예측하는 단계;를 포함하고,운율구 경계를 예측하는 단계에서 어절별로 첫 형태소의 벡터, 끝 형태소의 벡터, 첫 형태소 경계 분포 벡터, 끝 형태소 경계 분포 벡터를 갖고, 경계 분포 벡터는 학습 데이터로 활용된 운율구 경계 분석 말뭉치에서 각 형태소를 포함한 어절 뒤에 어떤 경계가 나타나는지를 확인하고, 이를 확률화하여 구성하는 벡터이고, 한 어절에 대한 각 형태소 경계의 확률값은 모두 더했을 때 1이 되는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 방법
|
9 |
9
제 8 항에 있어서, 운율구 예측 규칙은 통사 구조에 따라 확정적으로 결정되는 운율구 경계를 시스템 내부에서 구현하기 위한 것으로,관측 어절의 마지막 형태소가 주제화 보조사 '은/는'일 경우 운율구 경계가 올 가능성이 큰 것으로 판단하는 제 1 윤율구 예측 규칙 및,문장 내 독립성분의 앞과 뒤는 강하게 끊어 읽을 확률이 높은 것으로 판단하는 제 2 운율구 예측 규칙을 포함하는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 방법
|
10 |
10
제 8 항에 있어서, 심층학습 기반 모형은,Bidirectional LSTM(Long-Short Term Memory units)을 활용하여 운율구 경계 예측을 위한 자질정보를 추출하고, CRF(Conditional Random Field)를 활용하여 운율구 경계를 예측하는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 방법
|
11 |
11
제 10 항에 있어서, 심층학습 기반 모형은,단어의 분산표현을 위한 층으로 이후 층에서 처리하기 위해 입력 단어를 단어 벡터로 사상하는 입력층과,합성곱 신경망 또는 순환 신경망의 인공신경망 모형으로 심층학습 기반층이 되는 중간층과,입력 단어에 해당하는 강한 경계, 약한 경계, 비경계의 운율구 유형을 출력하는 출력층을 갖는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 방법
|
12 |
12
제 8 항에 있어서, 운율구 경계를 예측하는 단계에서,형태소 분석에서 사용하는 품사 집합보다 더 세분화한 품사 집합을 사용하고, 어절의 품사 정보를 이용할 때 운율구 경계 예측에 더 많이 관여하는 첫 형태소와 끝 형태소의 품사 정보만을 이용하는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 방법
|
13 |
13
삭제
|
14 |
14
삭제
|