1 |
1
사용자의 검색어 입력에 따른 다수의 제 1 단어(Wordxi)를 추출하는 전처리 기능 수행부(110);미리 산출되는 학습 데이터 및 단어 임베딩 모델을 이용하여 다수의 상기 제 1 단어(Wordxi)와 유사도를 갖는 다수의 제 2 단어(Wordxi)를 추출하는 단어 추천 기능 수행부(120); 및 다수의 상기 제 1 단어(Wordxi) 및 다수의 상기 제 2 단어(Wordyi)를 이용하여 추천 문서를 선정하는 문서 추천 기능 수행부(130);를 포함하는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 시스템
|
2 |
2
제 1 항에 있어서,상기 전처리 기능 수행부(110)는,다수의 상기 제 1 단어(Wordxi)를 구분하는 단위의 각 토큰으로 분리하는 토큰화 모듈(111);상기 각 토큰에 대한 품사를 붙여주는 품사 태깅 모듈(112); 및상기 품사 중에서 다수의 상기 제 1 단어(Wordxi)에 대응하는 다수의 명사를 추출하는 명사 추출 모듈(130);을 포함하는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 시스템
|
3 |
3
제 1 항에 있어서,상기 단어 추천 기능 수행부(120)는,미리 수집한 다수의 발전 운전 전문가 지식 문서에 대한 학습 데이터를 저장하는 학습 데이터베이스(121); 및상기 학습 데이터 및 다수의 상기 제 1 단어(Wordxi)에 상기 단어 임베딩 모델 중 스킵-그램(Skip-gram) 모델을 적용하여 다수의 상기 제 1 단어(Wordxi)와 유사도를 갖는 다수의 제 2 단어(Wordxi)를 추출하는 워드 임베딩 모듈(122);을 포함하는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 시스템
|
4 |
4
제 3 항에 있어서,상기 스킵-그램(Skip-gram) 모델의 로그함수(L(θ))는 수학식 (여기서, , , P(+|t,c)는 다수의 상기 제 1 단어(Wordxi)가 긍정 샘플일 확률이고, P(-|t,c)는 다수의 상기 제 1 단어(Wordxi)가 부정 샘플일 확률이고,+는 긍정 샘플을 나타내고, t는 타겟 단어이고, c는 문맥 단어이며, vc는 입력층-은닉층을 잇는 가중치 행렬 W의 행벡터, ut는 은닉층-출력층을 잇는 가중치 행렬 W의 열벡터, cp는 중심 단어이다)으로 정의되는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 시스템
|
5 |
5
제 3 항에 있어서,상기 학습 데이터는 발전기 진단시 위치에 따라 보일러(Boiler), 발전기(Electric Generator), 성능(Performance), 가스터빈(Gas Turbine), 및 증기터빈(Steam Turbine)을 갖는 카테고리, 상기 카테고리를 고장진단, 정밀진단, 예방진단, 및 절연진단으로 분류하는 서브 카테고리, 및 상기 서브 카테고리에 해당하는 문서의 개수를 포함하는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 시스템
|
6 |
6
제 3 항에 있어서,상기 유사도는 코사인 유사도(Cos(θ))(여기서, θ는 상기 제 1 단어(Wordxi)와 상기 제 2 단어(Wordyi)간의 각도값이다)이고, 다수의 상기 제 2 단어(Wordyi)는 상기 코사인 유사도가 큰 순서대로 출력되는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 시스템
|
7 |
7
제 6 항에 있어서, 다수의 상기 제 2 단어(Wordyi)중 중복되는 단어는 제외되는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 시스템
|
8 |
8
제 6 항에 있어서,상기 코사인 유사도(Cos(θ)는 수학식 (여기서, WordAi는 제 1 단어(Wordxi), WordBi는 제 2 단어(Wordyi)이다)으로 정의되는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 시스템
|
9 |
9
제 4 항에 있어서,상기 문서 추천 기능 수행부(130)는, 다수의 상기 제 1 단어(Wordxi) 및 다수의 상기 제 2 단어(Wordyi)를 기반으로 각 문서(d)의 가중치를 산출하는 문서 가중치 모듈(131); 및상기 각 문서(d)로부터 가중치를 더하여 스코어를 나타내는 문서 점수화를 통해 상기 추천 문서를 선정하는 문서 점수화 모듈(132);을 포함하는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 시스템
|
10 |
10
제 9 항에 있어서,상기 가중치 (Gen2Vecweight)는 수학식 (여기서, d는 각 문서이고, D는 전체 문서의 개수며, 이고, t는 Wordxi 또는 Wordyi이고, f()는 총빈도이고, w는 각 문서가 포함하는 각 단어이다)으로 정의되는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 시스템
|
11 |
11
제 10 항에 있어서,상기 문서 점수화는 수학식 (여기서, T는 Wordxi와 Wordyi의 총 개수이고, K는 양의 자연수이며, Top()은 조회 함수이다)으로 정의되는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 시스템
|
12 |
12
제 11 항에 있어서,다수의 상기 제 2 단어 (Wordyi)는 수학식 (여기서, N003e#K이다)으로 정의되는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 시스템
|
13 |
13
(a) 전처리 기능 수행부(110)가 사용자의 검색어 입력에 따른 다수의 제 1 단어(Wordxi)를 추출하는 단계;(b) 단어 추천 기능 수행부(120)가 미리 산출되는 학습 데이터 및 단어 임베딩 모델을 이용하여 다수의 상기 제 1 단어(Wordxi)와 유사도를 갖는 다수의 제 2 단어(Wordxi)를 추출하는 단계; 및 (c) 문서 추천 기능 수행부(130)가 다수의 상기 제 1 단어(Wordxi) 및 다수의 상기 제 2 단어(Wordyi)를 이용하여 추천 문서를 선정하는 단계;를 포함하는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 방법
|
14 |
14
제 13 항에 있어서,상기 (a) 단계는, (a-1) 토큰화 모듈(111)이 다수의 상기제 1 단어(Wordxi)를 구분하는 단위의 각 토큰으로 분리하는 단계;(a-2) 품사 태깅 모듈(112)이 상기 각 토큰에 대한 품사를 붙여주는 단계; 및(a-3) 명사 추출 모듈(130)이 상기 품사 중에서 다수의 상기제 1 단어(Wordxi)에 대응하는 다수의 명사를 추출하는 단계;를 포함하는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 방법
|
15 |
15
제 13 항에 있어서,상기 (b) 단계는, (b-1) 미리 수집한 다수의 발전 운전 전문가 지식 문서에 대한 학습 데이터를 학습 데이터베이스(121)에 저장하는 단계;(b-2) 워드 임베딩 모듈(122)이 상기 학습 데이터 및 다수의 상기 제 1 단어(Wordxi)에 상기 단어 임베딩 모델 중 스킵-그램(Skip-gram) 모델을 적용하는 단계;(b-3) 상기 워드 임베딩 모듈(122)이 다수의 상기 제 1 단어(Wordxi)와 유사도를 갖는 다수의 제 2 단어(Wordxi)를 추출하는 단계;를 포함하는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 방법
|
16 |
16
제 15 항에 있어서,상기 스킵-그램(Skip-gram) 모델의 로그함수(L(θ))는 수학식 (여기서, , , P(+|t,c)는 다수의 상기 제 1 단어(Wordxi)가 긍정 샘플일 확률이고, P(-|t,c)는 다수의 상기 제 1 단어(Wordxi)가 부정 샘플일 확률이고, +는 긍정 샘플을 나타내고, t는 타겟 단어이고, c는 문맥 단어이며, vc는 입력층-은닉층을 잇는 가중치 행렬 W의 행벡터, ut는 은닉층-출력층을 잇는 가중치 행렬 W의 열벡터, cp는 중심 단어이다)으로 정의되는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 방법
|
17 |
17
제 15 항에 있어서,상기 유사도는 코사인 유사도(Cos(θ)(여기서, θ는 상기 제 1 단어(Wordxi)와 상기 제 2 단어(Wordyi) 간의 각도 값이다)이고, 다수의 상기 제 2 단어(Wordyi)는 상기 코사인 유사도가 큰 순서대로 출력되는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 방법
|
18 |
18
제 16 항에 있어서,상기 (c) 단계는, (c-1) 문서 가중치 모듈(131)이 다수의 상기 제 1 단어(Wordxi) 및 다수의 상기 제 2 단어(Wordyi)를 기반으로 각 문서(d)의 가중치를 산출하는 단계; 및(c-2) 문서 점수화 모듈(132)이 상기 각 문서(d)로부터 가중치를 더하여 스코어를 나타내는 문서 점수화를 통해 상기 추천 문서를 선정하는 단계;를 포함하는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 방법
|
19 |
19
제 18 항에 있어서,상기 가중치 (Gen2Vecweight)는 수학식 (여기서, d는 각 문서이고, D는 전체 문서의 개수며, 이고, t는 Wordxi 또는 Wordyi이고, f()는 총빈도이고, w는 각 문서가 포함하는 각 단어이다)으로 정의되는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 방법
|
20 |
20
제 19 항에 있어서,다수의 상기 제 2 단어 (Wordyi)는 수학식 (여기서, N003e#K이다)으로 정의되는 것을 특징으로 하는 발전 운전 지식 서비스를 위한 딥러닝 기반 자연어 처리 방법
|