맞춤기술찾기

이전대상기술

머신 러닝을 이용한 댓글 판별 서버 및 그를 이용한 가짜 댓글 판별 방법

  • 기술번호 : KST2022014268
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명의 일 기술적 측면에 따른 머신 러닝을 이용한 가짜 댓글 판별 시스템은, 온라인 콘텐츠를 수집하고, 수집된 온라인 콘텐츠를 온라인 콘텐츠의 종류, 주제 및 댓글을 기준으로 구분하여 학습 데이터를 생성하는 학습 데이터 생성부, 상기 학습 데이터 생성부에서 제공된 학습 데이터를 기반으로 머신러닝 학습을 수행하여, 온라인 콘텐츠의 종류, 주제 및 댓글 각각에 대한 개별적인 확률을 학습하는 머신러닝 학습모델 및 사용자로부터 요청된 요청 콘텐츠에 대하여 상기 머신러닝 학습 모델을 적용하여 상기 요청 콘텐츠의 종류 및 주제를 식별하고, 온라인 콘텐츠의 종류 및 주제에 따른 댓글의 진위 성향을 이용하여 상기 요청 콘텐츠의 댓글의 진위를 판별하는 진위 판별부를 포함 할 수 있다. 본 발명의 일 실시형태에 따르면, 온라인 콘텐츠에 대한 머신러닝 학습을 기반으로 사용자가 요청한 온라인 컨텐츠의 댓글에 대한 진위 확률을 산출하여, 온라인 콘텐츠의 댓글에 대한 진위 여부를 판별할 수 있는 효과가 있다.
Int. CL G06F 40/30 (2020.01.01) G06F 16/951 (2019.01.01) G06F 16/33 (2019.01.01) G06F 40/258 (2020.01.01) G10L 15/26 (2006.01.01) G06N 20/00 (2019.01.01)
CPC G06F 40/30(2013.01) G06F 16/951(2013.01) G06F 16/3335(2013.01) G06F 40/258(2013.01) G10L 15/26(2013.01) G06N 20/00(2013.01)
출원번호/일자 1020210006025 (2021.01.15)
출원인 세종대학교산학협력단
등록번호/일자
공개번호/일자 10-2022-0103427 (2022.07.22) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.01.15)
심사청구항수 16

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 세종대학교산학협력단 대한민국 서울특별시 광진구 능동로 *** (군

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박종현 서울특별시 광진구
2 오유원 서울특별시 광진구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김준석 대한민국 서울특별시 금천구 가산디지털*로 ***(가산동) 에이스비즈포레 ***-***호(키움특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.01.15 수리 (Accepted) 1-1-2021-0056193-56
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2021.02.22 수리 (Accepted) 4-1-2021-5068226-87
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2021.02.23 수리 (Accepted) 4-1-2021-5068232-51
4 선행기술조사의뢰서
Request for Prior Art Search
2021.11.15 수리 (Accepted) 9-1-9999-9999999-89
5 선행기술조사보고서
Report of Prior Art Search
2022.02.22 발송처리완료 (Completion of Transmission) 9-6-2022-0072483-16
6 의견제출통지서
Notification of reason for refusal
2022.04.25 발송처리완료 (Completion of Transmission) 9-5-2022-0307649-76
7 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2022.05.19 수리 (Accepted) 1-1-2022-0528645-19
8 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2022.05.19 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2022-0528646-65
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
온라인 콘텐츠를 수집하고, 수집된 온라인 콘텐츠를 온라인 콘텐츠의 종류, 주제 및 댓글을 기준으로 구분하여 학습 데이터를 생성하는 학습 데이터 생성부;상기 학습 데이터 생성부에서 제공된 학습 데이터를 기반으로 머신러닝 학습을 수행하여, 온라인 콘텐츠의 종류, 주제 및 댓글 각각에 대한 개별적인 확률을 학습하는 머신러닝 학습모델; 및사용자로부터 요청된 요청 콘텐츠에 대하여 상기 머신러닝 학습 모델을 적용하여 상기 요청 콘텐츠의 종류 및 주제를 식별하고, 온라인 콘텐츠의 종류 및 주제에 따른 댓글의 진위 성향을 이용하여 상기 요청 콘텐츠의 댓글의 진위를 판별하는 진위 판별부;를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
2 2
제1항에 있어서, 상기 학습 데이터는, 온라인 콘텐츠의 종류를 학습하기 위한 학습 데이터로서, 온라인 콘텐츠의 제목, 퍼블리셔 정보 및 오너 정보를 포함하는 종류 학습데이터;온라인 콘텐츠의 주제를 학습하기 위한 학습 데이터로서, 온라인 콘텐츠의 내용, 퍼블리셔 정보 및 오너 정보를 포함하는 주제 학습데이터; 및온라인 콘텐츠의 댓글을 학습하기 위한 학습 데이터로서, 온라인 콘텐츠의 종류, 주제, 가짜댓글 정보를 포함하는 댓글 학습데이터; 를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
3 3
제2항에 있어서, 상기 학습 데이터 생성부는, 온라인 콘텐츠를 수집하는 온라인 콘텐츠 수집모듈;상기 온라인 콘텐츠 수집모듈에서 수집된 온라인 콘텐츠 중에서, 상기 종류 학습데이터로 적용 가능한 온라인 콘텐츠를 선별하여 수집하는 종류 학습데이터 수집모듈;상기 수집된 온라인 콘텐츠 중에서, 상기 주제 학습데이터로 적용 가능한 온라인 콘텐츠를 선별하여 수집하는 주제 학습데이터 수집모듈; 및상기 수집된 온라인 콘텐츠 중에서, 상기 댓글 학습데이터로 적용 가능한 온라인 콘텐츠를 선별하여 수집하는 댓글 학습데이터 수집모듈;을 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
4 4
제2항에 있어서, 상기 머신러닝 학습모델은, 온라인 콘텐츠의 텍스트에 대한 불용어를 제거하고 표제어를 추출하고, 상기 학습데이터 별로 다르게 설정된 온라인 콘텐츠의 각 기준 항목을 대상으로 N-gram 언어모델을 적용하고 벡터화를 적용하여 분류 학습을 수행하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
5 5
제2항에 있어서, 상기 머신러닝 학습모델은, 종류 학습데이터를 기초로 온라인 콘텐츠의 제목을 학습하여 온라인 콘텐츠의 종류 확률을 산출하는 종류 학습모델; 주제 학습데이터를 기초로 온라인 콘텐츠의 내용을 학습하여 온라인 콘텐츠의 주제 확률을 산출하는 주제 학습모델; 및댓글 학습데이터를 기초로 온라인 콘텐츠의 종류 및 주제 별 가짜 댓글의 확률을 산출하는 댓글 학습모델;을 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
6 6
제5항에 있어서, 상기 머신러닝 학습모델은, 음성 기반 온라인 콘텐츠를 식별하고, 음성 인식을 이용하여 음성 기반 온라인 콘텐츠를 텍스트 콘텐츠로 변환하며, 상기 텍스트 콘텐츠에 대하여 불용어를 제거하고 표제어를 추출하는 전처리를 수행하는 전처리 모듈;을 더 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
7 7
제5항에 있어서, 상기 진위 판별부는, 상기 종류 학습모델을 이용하여 상기 요청 콘텐츠의 종류를 판별하는 종류 판별모듈;상기 주제 학습모델을 이용하여 상기 요청 콘텐츠의 주제를 판별하는 주제 판별모듈; 및상기 댓글 학습모델을 이용하여, 판별된 상기 요청 콘텐츠의 종류 및 주제에 따른 댓글 진위 확률을 산출하는 댓글 진위 판별모듈;을 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
8 8
제7항에 있어서, 상기 진위 판별부는,음성 기반 온라인 콘텐츠를 식별하고, 음성 인식을 이용하여 음성 기반 온라인 콘텐츠를 텍스트 콘텐츠로 변환하는 전처리 모듈;을 더 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
9 9
제7항에 있어서, 상기 진위 판별부는,상기 종류 학습데이터를 대상으로 퍼블리셔와 오너 간의 연관성을 기초로 종류 보정치를 설정하고, 상기 종류 판별모듈의 판별 결과에 상기 종류 보정치를 반영하는 종류 보정모듈; 및상기 주제 학습데이터를 대상으로 퍼블리셔와 오너 간의 연관성을 기초로 주제 보정치를 설정하고, 상기 주제 판별모듈의 판별 결과에 상기 주제 보정치를 반영하는 주제 보정모듈;을 더 포함하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
10 10
제7항에 있어서, 상기 진위 판별부는, 수학식 및수학식 을 이용하여 상기 댓글 진위 판별모듈의 판별 결과를 보정하는 댓글 진위 보정모듈;을 더 포함하고,여기에서, 는 상기 댓글 진위 판별모듈의 판별 결과를, 는 상기 댓글 진위 보정모듈에 의한 보정된 확률을 의미하는 것을 특징으로 하는 머신 러닝을 이용한 댓글 판별 서버
11 11
온라인 콘텐츠를 수집하고, 수집된 온라인 콘텐츠를 온라인 콘텐츠의 종류, 주제 및 댓글을 기준으로 구분하여 학습 데이터를 생성하는 단계;상기 학습 데이터를 기반으로 머신러닝 학습을 수행하여, 온라인 콘텐츠의 종류, 주제 및 댓글 각각에 대한 개별적인 확률을 학습하여 머신러닝 학습 모델을 생성하는 단계;사용자로부터 요청된 요청 콘텐츠에 대하여 상기 머신러닝 학습 모델을 적용하여 상기 요청 콘텐츠의 종류 및 주제를 식별하는 단계; 및 온라인 콘텐츠의 종류 및 주제에 따른 댓글의 진위 성향을 이용하여 상기 요청 콘텐츠의 댓글의 진위를 판별하는 단계;를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
12 12
제11항에 있어서, 상기 학습 데이터는, 온라인 콘텐츠의 종류를 학습하기 위한 학습 데이터로서, 온라인 콘텐츠의 제목, 퍼블리셔 정보 및 오너 정보를 포함하는 종류 학습데이터;온라인 콘텐츠의 주제를 학습하기 위한 학습 데이터로서, 온라인 콘텐츠의 내용, 퍼블리셔 정보 및 오너 정보를 포함하는 주제 학습데이터; 및온라인 콘텐츠의 댓글을 학습하기 위한 학습 데이터로서, 온라인 콘텐츠의 종류, 주제, 가짜댓글 정보를 포함하는 댓글 학습데이터; 를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
13 13
제12항에 있어서, 상기 학습 데이터를 생성하는 단계는, 온라인 콘텐츠를 수집하는 단계;상기 수집된 온라인 콘텐츠 중에서, 상기 종류 학습데이터로 적용 가능한 온라인 콘텐츠를 선별하여 종류 학습데이터를 수집하는 단계;상기 수집된 온라인 콘텐츠 중에서, 상기 주제 학습데이터로 적용 가능한 온라인 콘텐츠를 선별하여 주제 학습데이터를 수집하는 단계; 및상기 수집된 온라인 콘텐츠 중에서, 상기 댓글 학습데이터로 적용 가능한 온라인 콘텐츠를 선별하여 댓글 학습데이터를 수집하는 단계;를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
14 14
제12항에 있어서, 상기 머신러닝 학습모델은, 온라인 콘텐츠의 텍스트에 대한 불용어를 제거하고 표제어를 추출하고, 상기 학습데이터 별로 다르게 설정된 온라인 콘텐츠의 각 기준 항목을 대상으로 N-gram 언어모델을 적용하고 벡터화를 적용하여 분류 학습을 수행하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
15 15
제12항에 있어서, 상기 머신러닝 학습 모델을 생성하는 단계는, 종류 학습데이터를 기초로 온라인 콘텐츠의 제목을 학습하여 온라인 콘텐츠의 종류 확률을 산출하는 종류 학습모델을 생성하는 단계; 주제 학습데이터를 기초로 온라인 콘텐츠의 내용을 학습하여 온라인 콘텐츠의 주제 확률을 산출하는 주제 학습모델을 생성하는 단계; 및댓글 학습데이터를 기초로 온라인 콘텐츠의 종류 및 주제 별 가짜 댓글의 확률을 산출하는 댓글 학습모델을 생성하는 단계;를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
16 16
제15항에 있어서, 상기 머신러닝 학습 모델을 적용하여 상기 요청 콘텐츠의 종류 및 주제를 식별하는 단계는, 상기 종류 학습모델을 이용하여 상기 요청 콘텐츠의 종류를 판별하는 단계;상기 주제 학습모델을 이용하여 상기 요청 콘텐츠의 주제를 판별하는 단계; 및상기 댓글 학습모델을 이용하여, 판별된 상기 요청 콘텐츠의 종류 및 주제에 따른 댓글 진위 확률을 산출하는 단계;를 포함하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
17 17
제16항에 있어서, 상기 머신러닝 학습 모델을 적용하여 상기 요청 콘텐츠의 종류 및 주제를 식별하는 단계는,상기 종류 학습데이터를 대상으로 퍼블리셔와 오너 간의 연관성을 기초로 종류 보정치를 설정하고, 상기 종류 판별모듈의 판별 결과에 상기 종류 보정치를 반영하는 단계; 및상기 주제 학습데이터를 대상으로 퍼블리셔와 오너 간의 연관성을 기초로 주제 보정치를 설정하고, 상기 주제 판별모듈의 판별 결과에 상기 주제 보정치를 반영하는 단계;를 더 포함하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
18 18
제16항에 있어서, 상기 요청 콘텐츠의 댓글의 진위를 판별하는 단계는,수학식 및수학식 을 이용하여 상기 댓글 진위 판별모듈의 판별 결과를 보정하는 단계;를 더 포함하고,여기에서, 는 상기 댓글 진위 판별모듈의 판별 결과를, 는 상기 댓글 진위 보정모듈에 의한 보정된 확률을 의미하는 것을 특징으로 하는 머신 러닝을 이용한 가짜 댓글 판별 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.