1 |
1
온라인 콘텐츠를 수집하고, 수집된 온라인 콘텐츠를 온라인 콘텐츠의 종류, 주제 및 댓글을 기준으로 구분하여 학습 데이터를 생성하는 학습 데이터 생성부;상기 학습 데이터 생성부에서 제공된 학습 데이터를 기반으로 머신러닝 학습을 수행하여, 온라인 콘텐츠의 종류, 주제 및 댓글 각각에 대한 개별적인 확률을 학습하는 머신러닝 학습모델; 및사용자로부터 요청된 요청 콘텐츠에 대하여 상기 머신러닝 학습 모델을 적용하여 상기 요청 콘텐츠의 종류 및 주제를 식별하고, 온라인 콘텐츠의 종류 및 주제에 따른 댓글의 진위 성향을 이용하여 상기 요청 콘텐츠의 댓글의 진위를 판별하는 진위 판별부;를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
|
2 |
2
제1항에 있어서, 상기 학습 데이터는, 온라인 콘텐츠의 종류를 학습하기 위한 학습 데이터로서, 온라인 콘텐츠의 제목, 퍼블리셔 정보 및 오너 정보를 포함하는 종류 학습데이터;온라인 콘텐츠의 주제를 학습하기 위한 학습 데이터로서, 온라인 콘텐츠의 내용, 퍼블리셔 정보 및 오너 정보를 포함하는 주제 학습데이터; 및온라인 콘텐츠의 댓글을 학습하기 위한 학습 데이터로서, 온라인 콘텐츠의 종류, 주제, 가짜댓글 정보를 포함하는 댓글 학습데이터; 를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
|
3 |
3
제2항에 있어서, 상기 학습 데이터 생성부는, 온라인 콘텐츠를 수집하는 온라인 콘텐츠 수집모듈;상기 온라인 콘텐츠 수집모듈에서 수집된 온라인 콘텐츠 중에서, 상기 종류 학습데이터로 적용 가능한 온라인 콘텐츠를 선별하여 수집하는 종류 학습데이터 수집모듈;상기 수집된 온라인 콘텐츠 중에서, 상기 주제 학습데이터로 적용 가능한 온라인 콘텐츠를 선별하여 수집하는 주제 학습데이터 수집모듈; 및상기 수집된 온라인 콘텐츠 중에서, 상기 댓글 학습데이터로 적용 가능한 온라인 콘텐츠를 선별하여 수집하는 댓글 학습데이터 수집모듈;을 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
|
4 |
4
제2항에 있어서, 상기 머신러닝 학습모델은, 온라인 콘텐츠의 텍스트에 대한 불용어를 제거하고 표제어를 추출하고, 상기 학습데이터 별로 다르게 설정된 온라인 콘텐츠의 각 기준 항목을 대상으로 N-gram 언어모델을 적용하고 벡터화를 적용하여 분류 학습을 수행하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
|
5 |
5
제2항에 있어서, 상기 머신러닝 학습모델은, 종류 학습데이터를 기초로 온라인 콘텐츠의 제목을 학습하여 온라인 콘텐츠의 종류 확률을 산출하는 종류 학습모델; 주제 학습데이터를 기초로 온라인 콘텐츠의 내용을 학습하여 온라인 콘텐츠의 주제 확률을 산출하는 주제 학습모델; 및댓글 학습데이터를 기초로 온라인 콘텐츠의 종류 및 주제 별 가짜 댓글의 확률을 산출하는 댓글 학습모델;을 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
|
6 |
6
제5항에 있어서, 상기 머신러닝 학습모델은, 음성 기반 온라인 콘텐츠를 식별하고, 음성 인식을 이용하여 음성 기반 온라인 콘텐츠를 텍스트 콘텐츠로 변환하며, 상기 텍스트 콘텐츠에 대하여 불용어를 제거하고 표제어를 추출하는 전처리를 수행하는 전처리 모듈;을 더 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
|
7 |
7
제5항에 있어서, 상기 진위 판별부는, 상기 종류 학습모델을 이용하여 상기 요청 콘텐츠의 종류를 판별하는 종류 판별모듈;상기 주제 학습모델을 이용하여 상기 요청 콘텐츠의 주제를 판별하는 주제 판별모듈; 및상기 댓글 학습모델을 이용하여, 판별된 상기 요청 콘텐츠의 종류 및 주제에 따른 댓글 진위 확률을 산출하는 댓글 진위 판별모듈;을 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
|
8 |
8
제7항에 있어서, 상기 진위 판별부는,음성 기반 온라인 콘텐츠를 식별하고, 음성 인식을 이용하여 음성 기반 온라인 콘텐츠를 텍스트 콘텐츠로 변환하는 전처리 모듈;을 더 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
|
9 |
9
제7항에 있어서, 상기 진위 판별부는,상기 종류 학습데이터를 대상으로 퍼블리셔와 오너 간의 연관성을 기초로 종류 보정치를 설정하고, 상기 종류 판별모듈의 판별 결과에 상기 종류 보정치를 반영하는 종류 보정모듈; 및상기 주제 학습데이터를 대상으로 퍼블리셔와 오너 간의 연관성을 기초로 주제 보정치를 설정하고, 상기 주제 판별모듈의 판별 결과에 상기 주제 보정치를 반영하는 주제 보정모듈;을 더 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
|
10 |
10
제7항에 있어서, 상기 진위 판별부는, 수학식 및수학식 을 이용하여 상기 댓글 진위 판별모듈의 판별 결과를 보정하는 댓글 진위 보정모듈;을 더 포함하고,여기에서, 는 상기 댓글 진위 판별모듈의 판별 결과를, 는 상기 댓글 진위 보정모듈에 의한 보정된 확률을 의미하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
|
11 |
11
온라인 콘텐츠를 수집하고, 수집된 온라인 콘텐츠를 온라인 콘텐츠의 종류, 주제 및 댓글을 기준으로 구분하여 학습 데이터를 생성하는 단계;상기 학습 데이터를 기반으로 머신러닝 학습을 수행하여, 온라인 콘텐츠의 종류, 주제 및 댓글 각각에 대한 개별적인 확률을 학습하여 머신러닝 학습 모델을 생성하는 단계;사용자로부터 요청된 요청 콘텐츠에 대하여 상기 머신러닝 학습 모델을 적용하여 상기 요청 콘텐츠의 종류 및 주제를 식별하는 단계; 및 온라인 콘텐츠의 종류 및 주제에 따른 댓글의 진위 성향을 이용하여 상기 요청 콘텐츠의 댓글의 진위를 판별하는 단계;를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
|
12 |
12
제11항에 있어서, 상기 학습 데이터는, 온라인 콘텐츠의 종류를 학습하기 위한 학습 데이터로서, 온라인 콘텐츠의 제목, 퍼블리셔 정보 및 오너 정보를 포함하는 종류 학습데이터;온라인 콘텐츠의 주제를 학습하기 위한 학습 데이터로서, 온라인 콘텐츠의 내용, 퍼블리셔 정보 및 오너 정보를 포함하는 주제 학습데이터; 및온라인 콘텐츠의 댓글을 학습하기 위한 학습 데이터로서, 온라인 콘텐츠의 종류, 주제, 가짜댓글 정보를 포함하는 댓글 학습데이터; 를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
|
13 |
13
제12항에 있어서, 상기 학습 데이터를 생성하는 단계는, 온라인 콘텐츠를 수집하는 단계;상기 수집된 온라인 콘텐츠 중에서, 상기 종류 학습데이터로 적용 가능한 온라인 콘텐츠를 선별하여 종류 학습데이터를 수집하는 단계;상기 수집된 온라인 콘텐츠 중에서, 상기 주제 학습데이터로 적용 가능한 온라인 콘텐츠를 선별하여 주제 학습데이터를 수집하는 단계; 및상기 수집된 온라인 콘텐츠 중에서, 상기 댓글 학습데이터로 적용 가능한 온라인 콘텐츠를 선별하여 댓글 학습데이터를 수집하는 단계;를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
|
14 |
14
제12항에 있어서, 상기 머신러닝 학습모델은, 온라인 콘텐츠의 텍스트에 대한 불용어를 제거하고 표제어를 추출하고, 상기 학습데이터 별로 다르게 설정된 온라인 콘텐츠의 각 기준 항목을 대상으로 N-gram 언어모델을 적용하고 벡터화를 적용하여 분류 학습을 수행하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
|
15 |
15
제12항에 있어서, 상기 머신러닝 학습 모델을 생성하는 단계는, 종류 학습데이터를 기초로 온라인 콘텐츠의 제목을 학습하여 온라인 콘텐츠의 종류 확률을 산출하는 종류 학습모델을 생성하는 단계; 주제 학습데이터를 기초로 온라인 콘텐츠의 내용을 학습하여 온라인 콘텐츠의 주제 확률을 산출하는 주제 학습모델을 생성하는 단계; 및댓글 학습데이터를 기초로 온라인 콘텐츠의 종류 및 주제 별 가짜 댓글의 확률을 산출하는 댓글 학습모델을 생성하는 단계;를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
|
16 |
16
제15항에 있어서, 상기 머신러닝 학습 모델을 적용하여 상기 요청 콘텐츠의 종류 및 주제를 식별하는 단계는, 상기 종류 학습모델을 이용하여 상기 요청 콘텐츠의 종류를 판별하는 단계;상기 주제 학습모델을 이용하여 상기 요청 콘텐츠의 주제를 판별하는 단계; 및상기 댓글 학습모델을 이용하여, 판별된 상기 요청 콘텐츠의 종류 및 주제에 따른 댓글 진위 확률을 산출하는 단계;를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
|
17 |
17
제16항에 있어서, 상기 머신러닝 학습 모델을 적용하여 상기 요청 콘텐츠의 종류 및 주제를 식별하는 단계는,상기 종류 학습데이터를 대상으로 퍼블리셔와 오너 간의 연관성을 기초로 종류 보정치를 설정하고, 상기 종류 판별모듈의 판별 결과에 상기 종류 보정치를 반영하는 단계; 및상기 주제 학습데이터를 대상으로 퍼블리셔와 오너 간의 연관성을 기초로 주제 보정치를 설정하고, 상기 주제 판별모듈의 판별 결과에 상기 주제 보정치를 반영하는 단계;를 더 포함하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
|
18 |
18
제16항에 있어서, 상기 요청 콘텐츠의 댓글의 진위를 판별하는 단계는,수학식 및수학식 을 이용하여 상기 댓글 진위 판별모듈의 판별 결과를 보정하는 단계;를 더 포함하고,여기에서, 는 상기 댓글 진위 판별모듈의 판별 결과를, 는 상기 댓글 진위 보정모듈에 의한 보정된 확률을 의미하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
|