1 |
1
입력된 문장을 음절 단위로 분리하는 음절 분리부와,상기 음절 분리부에서 분리된 음절을 기반으로 음절에 대한 벡터를 통해 bi-LSTM-CRFs를 이용한 음절 단위 품사 태깅을 진행하여 음절이 포함된 형태소의 품사 태그를 할당하는 분류부와,상기 분류부에서 음절 단위로 품사 태그가 결정된 결과에 대해 기분석 사전을 통해 학습 말뭉치에서 중의성이 없는 변환을 처리하여 오류를 제거하는 오류 제거부와,상기 오류 제거부에서 오류를 제거하여 음절 단위로 품사 태그가 부착된 결과를 원형복원을 통해 형태소 단위로 변환하는 원형 복원부를 포함하여 구성되는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석기
|
2 |
2
제 1 항에 있어서, 상기 분류부는 음절에 대한 벡터를 생성하기 위해 단어 임베딩(word embedding) 알고리즘인 word2vec를 사용하여 64차원의 음절 단위의 임베딩 벡터를 학습하여 입력 벡터로 사용하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석기
|
3 |
3
제 1 항에 있어서, 상기 오류 제거부의 기분석 사전은 어절사전과 명사사전을 사용하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석기
|
4 |
4
제 1 항에 있어서,상기 원형 복원부는 불규칙 변환이 존재하는 경우 불규칙 변환 사전을 통해 이를 보정하여 변환하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석기
|
5 |
5
(A) 입력된 문장을 음절 분리부에서 음절 단위로 분리하는 단계와,(B) 상기 음절 분리부에서 분리된 음절을 기반으로 분류부에서 음절에 대한 벡터를 통해 bi-LSTM-CRFs를 이용한 음절 단위 품사 태깅을 진행하여 음절이 포함된 형태소의 품사 태그를 할당하는 단계와,(C) 상기 음절 단위로 품사 태그가 결정된 결과에 대해 오류 제거부에서 기분석 사전을 통해 학습 말뭉치에서 중의성이 없는 변환을 처리하여 오류를 제거하는 단계와,(D) 상기 오류를 제거하여 음절 단위로 품사 태그가 부착된 결과를 원형 복원부에서 원형복원을 통해 형태소 단위로 변환하는 단계를 포함하여 이루어지는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
|
6 |
6
제 5 항에 있어서, 상기 음절 분리부에서 수행되는 (A) 단계는CRF 학습을 위해 음절단위 자질과 어절 단위 자질을 사용하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
|
7 |
7
제 6 항에 있어서,상기 어절 단위 자질은 전체 말뭉치에서 유일한 어절들을 추출하는 단계와,상기 추출된 각 어절 별로 ID를 할당하는 단계와,상기 할당된 ID를 자질로 표현하여 사용하는 단계를 포함하여 이루어지는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
|
8 |
8
제 5 항에 있어서, 상기 분류부에서 수행되는 (B) 단계는상기 음절에 대한 벡터를 생성하기 위해 단어 임베딩(word embedding) 알고리즘인 word2vec를 사용하여 64차원의 음절 단위의 임베딩 벡터를 학습하여 입력 벡터로 사용하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
|
9 |
9
제 5 항에 있어서, 상기 오류 제거부에서 수행되는 (C) 단계는기분석 사전을 어절사전과 명사사전을 사용하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
|
10 |
10
제 9 항에 있어서,상기 명사사전은 중의적 분석이 되지 않는 명사들로 구축하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
|
11 |
11
제 9 항에 있어서, 상기 어절사전은 문맥정보를 고려하지 않은 어절사전1과 문맥정보를 고려하여 모호성을 해결한 어절사전2를 구축하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
|
12 |
12
제 5 항에 있어서, 상기 원형 복원부에서 수행되는 (D) 단계는 원형 복원 시에 불규칙 변환이 필요한 경우 불규칙 변환 사전을 이용하여 변환하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
|
13 |
13
제 5 항에 있어서, 상기 원형 복원부에서 수행되는 (D) 단계는불규칙 변환에서 불규칙 변환 사전에 동일한 변환이 있을 시 가장 높은 빈도의 결과를 선택하는 단계와,불규칙 변환을 적용한 후 최종적으로 동일한 품사 태그를 가지는 형태소들은 결합하여 형태소 품사 태깅을 완료하는 단계를 포함하여 이루어지는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
|