1 |
1
컴퓨터로 구현되는 키워드 추출 장치에 의해 수행되는 키워드 추출 방법에 있어서,텍스트 데이터로부터 자연어 처리를 위한 임베딩을 수행하는 단계; 및상기 임베딩이 수행된 텍스트 데이터를 사용하여 개체명 인식(Named Entity Recognition)을 위하여 구성된 딥러닝 기반의 키워드 추출 모델을 학습시킴에 따라 키워드를 추출하는 단계를 포함하는 키워드 추출 방법
|
2 |
2
제1항에 있어서,상기 텍스트 데이터는, 문자 메시지이고, 상기 임베딩을 수행하는 단계는, 상기 문자 메시지로부터 임베딩을 수행함에 따라 단어 또는 문장으로 분할하고, 상기 분할된 단어 또는 문장을 벡터화하는 단계를 포함하는 키워드 추출 방법
|
3 |
3
제2항에 있어서,상기 임베딩을 수행하는 단계는,CBOW(Continuous Bag of Words) 방식 및 Skip-Gram 방식을 포함하는 Word2Vec를 사용하여 임베딩을 수행하는 단계 를 포함하는 키워드 추출 방법
|
4 |
4
제2항에 있어서,상기 임베딩을 수행하는 단계는, 상기 문자 메시지로부터 CBOW(Continuous Bag of Words) 방식의 임베딩을 수행함에 따라 상기 문자 메시지에서 각각의 단어의 주변에 있는 단어들을 이용하여 중심 단어들을 예측하고, 상기 예측된 중심 단어들을 벡터화하는 단계를 포함하는 키워드 추출 방법
|
5 |
5
제1항에 있어서,상기 텍스트 데이터는, 문자 메시지이고, 상기 키워드를 추출하는 단계는,상기 문자 메시지에 대한 문장의 시퀀스가 Word2Vec를 사용하여 임베딩을 수행함에 따라 생성된 임베딩 레이어를 통과하여 상기 키워드 추출 모델을 학습시키고, 상기 키워드 추출 모델을 학습시킴에 따라 결과값으로 장소, 시간 또는 행사 중 적어도 하나 이상의 키워드를 출력하고, 상기 출력된 적어도 하나 이상의 키워드를 조합하여 문장을 생성하는 단계 를 포함하는 키워드 추출 방법
|
6 |
6
제1항에 있어서,상기 키워드를 추출하는 단계는,Word2Vec를 사용하여 임베딩을 수행함에 따라 획득된 유사도로 변경된 데이터를 입력으로 사용하여 상기 키워드 추출 모델을 학습시키고, 상기 키워드 추출 모델을 학습시킴에 따라 결과값으로 각 문장값을 추출할 키워드의 라벨링 값을 출력하는 단계 를 포함하는 키워드 추출 방법
|
7 |
7
제5항 또는 제6항 중 어느 한 항에 있어서,상기 키워드를 추출하는 단계는,개체명 인식(Named Entity Recognition)을 위하여 딥러닝 기반의 키워드 추출 모델을 구성하는 단계를 포함하고,상기 키워드 추출 모델은, RNN, LSTM(Long Short-Term Memory), GRU(Gated Recurrent Unit) 중 어느 하나로 구성되는 것을 특징으로 하는 키워드 추출 방법
|
8 |
8
컴퓨터로 구현되는 키워드 추출 장치에 있어서,텍스트 데이터로부터 자연어 처리를 위한 임베딩을 수행하는 임베딩부; 및상기 임베딩이 수행된 텍스트 데이터를 사용하여 개체명 인식(Named Entity Recognition)을 위하여 구성된 딥러닝 기반의 키워드 추출 모델을 학습시킴에 따라 키워드를 추출하는 키워드 추출부를 포함하는 키워드 추출 장치
|