1 |
1
줄거리로 구성된 텍스트 데이터에 대하여 전처리를 수행하는 단계;제1 모델을 이용하여, 상기 전처리된 데이터로부터 감정점수를 산출하는 단계;상기 산출된 감정점수를 이용하여 제1 입력데이터를 생성하는 단계;제2 모델을 이용하여, 상기 전처리된 데이터로부터 제2 입력데이터를 생성하는 단계; 및상기 제1 입력데이터와 상기 제2 입력데이터를 미리 학습된 제3 모델에 적용하여, 상기 줄거리에 상응하는 컨텐츠의 후보클래스를 결정하는 단계;를 포함하되,상기 후보클래스는, 흥행을 나타내는 제1 클래스와 비흥행을 나타내는 제2 클래스를 포함하는 것을 특징으로 하는, 방법
|
2 |
2
제1 항에 있어서,,상기 줄거리는,영화, 뮤지컬, 콘서트, 연극, 스포츠, 전시, 서적 또는 음악 중 적어도 하나를 포함하는 것을 특징으로 하는, 방법
|
3 |
3
제1 항에 있어서,상기 전처리를 수행하는 단계는,상기 줄거리로 구성된 텍스트 데이터를 문장 단위로 분할하는 단계를 포함하는 것을 특징으로 하는, 방법
|
4 |
4
제3 항에 있어서,상기 전처리를 수행하는 단계는,상기 문장 단위로 분할된 텍스트 데이터에 관한 리스트를 생성하는 단계를 더 포함하는 것을 특징으로 하는, 방법
|
5 |
5
제1 항에 있어서,상기 감정점수는,긍정점수(positive score), 부정점수(negative score), 중립점수(neutral score), 또는 혼합점수(compound score)를 포함하는 것을 특징으로 하는, 방법
|
6 |
6
제1 항에 있어서,상기 제1 모델은 감정점수에 관한 정보와 상기 전처리된 데이터를 학습 데이터로 제공하여 학습된 신경망 모델인 것을 특징으로 하는, 방법
|
7 |
7
제1 항에 있어서,상기 제1 모델은 VADER sentiment Analyzer인 것을 특징으로 하는, 방법
|
8 |
8
제1 항에 있어서,상기 감정점수는 N 차원의 벡터이고,상기 감정점수를 산출하는 단계는,상기 줄거리를 구성하는 복수의 문장 중 가장 마지막에 위치한 문장부터 역순으로 상기 복수의 문장 각각에 대한 감정점수를 산출하되, 상기 복수의 문장의 수(=M)가 N 미만인 경우, (N-M)만큼의 나머지 차원에는 제로패딩(zero-padding)을 적용하는 것을 특징으로 하는, 방법
|
9 |
9
제1 항에 있어서,상기 제2 모델은 ELMO 모델인 것을 특징으로 하는, 방법
|
10 |
10
제1 항에 있어서,제1 입력데이터를 생성하는 단계는,상기 감정점수를 Merged 1D CNN에 적용하여, 제1 특징벡터를 생성하는 것을 특징으로 하는, 방법
|
11 |
11
제1 항에 있어서,제1 입력데이터를 생성하는 단계는,상기 감정점수를 제1 Bidirectional LSTM에 적용하여 제1 벡터를 생성하는 단계,상기 제1 벡터를 제2 Bidirectional LSTM에 적용하여 제2 벡터를 생성하는 단계; 및상기 제1 벡터와 상기 제2 벡터를 합(add)하여 제2 특징벡터를 생성하는 단계;를 포함하는 것을 특징으로 하는, 방법
|
12 |
12
제1 항에 잇어서,상기 후보클래스를 결정하는 단계는,상기 제1 입력데이터와 상기 제2 입력데이터를 결합(concatenate)하여 결합벡터(concatenated vector)를 생성하는 단계;상기 결합벡터를 상기 미리 학습된 제3 모델에 적용하여, 상기 줄거리에 상응하는 컨텐츠의 후보 클래스를 결정하는 단계;를 포함하는 것을 특징으로 하는, 방법
|
13 |
13
제1 항에 있어서,상기 제3 모델은,컨텐츠에 관한 흥행점수가 레이블링된 학습용 줄거리에 기반하여 미리 학습된 분류모델이고,상기 학습용 줄거리는 전처리가 수행된 텍스트 데이터인 것을 특징으로 하는, 방법
|
14 |
14
제13 항에 있어서,상기 컨텐츠에 관한 흥행점수는,상기 학습용 줄거리에 관한 수요자의 평가점수이며,상기 평가점수가 X점 이상이면 흥행을 나타내는 상기 제1 클래스, Y점 미만이면 비흥행을 나타내는 상기 제2 클래스인 것을 특징으로 하는, 방법
|
15 |
15
제14 항에 있어서,상기 X와 상기 Y는 서로 다른 값인 것을 특징으로 하는, 방법
|
16 |
16
제1 항 내지 제14 항 중 어느 한 항의 방법을 컴퓨터 시스템에서 실행하기 위한 프로그램이 기록된 컴퓨터 시스템이 판독 가능한 기록매체
|