1 |
1
상품의 가격 예측 모델을 학습시키기 위한 데이터셋 생성방법에 있어서,상기 상품과 관련된 뉴스 기사 및 상기 상품의 가격 정보를 획득하는 과정;상기 뉴스 기사로부터 키워드가 할당된 토픽을 추출하는 과정;상기 토픽을 기초로 상기 뉴스 기사의 대표 토픽을 각각 선정하는 과정;상기 대표 토픽에 할당된 키워드의 중요도(importance)를 각각 연산하는 과정; 및상기 가격 정보 중 상기 대표 토픽에 대응하는 가격 정보를 추출하고, 상기 대표 토픽에 할당된 키워드의 중요도와 추출된 가격 정보를 결합하여 데이터셋을 생성하는 과정을 포함하는 것을 특징으로 하는 데이터셋 생성방법
|
2 |
2
제1항에 있어서,상기 데이터셋을 생성하는 과정은,상기 중요도 및 상기 중요도에 결합된 가격 정보 간 상관관계를 기초로 상기 데이터셋에 포함시키기 위한 키워드를 선별하는 것을 특징으로 하는 데이터셋 생성방법
|
3 |
3
제1항에 있어서,상기 대표 토픽에 할당된 키워드의 중요도는, 상기 대표 토픽에 할당된 키워드가 상기 뉴스 기사 중 특정 뉴스 기사 내에서 나타나는 빈도와, 상기 대표 토픽에 할당된 키워드가 상기 뉴스 기사 전부에서 나타나는 빈도의 역수를 기초로 연산되는 것을 특징으로 하는 데이터셋 생성방법
|
4 |
4
제1항에 있어서, 상기 키워드가 할당된 토픽을 추출하는 과정은,상기 뉴스 기사 전부로부터 동사(verb) 및/또는 명사(noun)인 단어를 키워드로서 추출하고, 각 키워드를 상기 뉴스 기사 전부에 포함된 것으로 기 지정된 K(K는 1 이상의 자연수) 개의 토픽에 할당하며, 상기 뉴스 기사 전부 또는 일부에서의 상기 각 키워드의 발생 횟수를 기초로 K 개의 토픽에 대한 토픽 출현 확률을 각각 연산함으로써 수행되는 것을 특징으로 하는 데이터셋 생성방법
|
5 |
5
제4항에 있어서,상기 토픽 출현 확률의 연산은, 상기 뉴스 기사 각각에서의 상기 K 개의 토픽의 각 분포와, 상기 K 개의 토픽 각각에서의 상기 각 키워드의 분포를 추정하여 수행되는 것을 특징으로 하는 데이터셋 생성방법
|
6 |
6
제1항에 있어서,상기 토픽은, 할당된 키워드 간 공통되거나 유사한 단어로서 라벨링되는 것을 특징으로 하는 데이터셋 생성방법
|
7 |
7
상품의 가격 예측 모델을 학습시키는 방법에 있어서,제1항의 데이터셋 생성방법에서 생성된 데이터셋을 이용하여 상기 가격 예측 모델을 트레이닝시키는 과정을 포함하는 것을 특징으로 하는 가격 예측 모델 학습방법
|
8 |
8
제7항에 있어서,상기 가격 예측 모델은, LSTM(Long Short-Term Memory)의 단일 히든 레이어(single hidden layer) 및 출력 레이어(output layer)를 포함하는 신경망 기반의 모델인 것을 특징으로 하는 가격 예측 모델 학습방법
|
9 |
9
제8항에 있어서,상기 가격 예측 모델은, 상기 데이터셋의 크기, 윈도우 컴포넌트(window component)의 크기 및 상기 데이터셋에 포함된 키워드의 갯수를 상기 LSTM의 단일 히든 레이어의 입력 파라미터로 하는 것을 특징으로 하는 가격 예측 모델 학습방법
|
10 |
10
제8항에 있어서,상기 가격 예측 모델은, 매트릭스-벡터 곱(matrix--vector multiplication)을 수행하여 트레이닝 중 하이퍼파라미터를 갱신시키는 덴스 레이어(dense layer)를 더 포함하는 것을 특징으로 하는 가격 예측 모델 학습방법
|
11 |
11
상품의 가격 예측 모델을 이용하여 상품의 가격을 예측하는 방법에 있어서,제7항의 가격 예측 모델 학습방법에서 트레이닝된 가격 예측 모델을 이용하여 상기 상품의 가격을 예측하는 과정을 포함하는 것을 특징으로 하는 상품의 가격 예측방법
|