1 |
1
웹로그를 분석하여 사용자 단말기에 기 설치된 웹 브라우저를 통해 접속된 적어도 하나 이상의 URL(uniform resource locator)을 수집하는 URL 수집부;상기 수집된 URL들의 웹 콘텐츠들에 각각 포함된 다수의 텍스트를 크롤링(crawling)하여 추출하는 텍스트 추출부;기 정의된 카테고리 분류 데이터 및 감성 분류 데이터를 각각 이용하여 상기 추출된 다수의 텍스트와 가장 높은 문서유사도를 가지는 카테고리 및 감성을 각각의 웹 콘텐츠별 대표 카테고리 및 대표 감성으로 판단하는 대표 카테고리 및 대표 감성 판단부;복수의 사용자 단말기에서 각각 일별 최대 횟수로 판단된 대표 카테고리 및 대표 감성을 해당 날짜에 대한 해당 사용자 단말기의 대표 카테고리 및 대표 감성으로 판단하여 설정 일수 동안 수집하는 대표 카테고리 및 대표 감성 수집부; 및 상기 복수의 사용자 단말기를 적어도 둘 이상씩 그룹핑하되, 모든 경우의 수만큼 그룹핑하여 복수개의 동기화 그룹을 생성하고, 상기 동기화 그룹 내 사용자 단말기들이 동일한 날짜에 동일한 대표 카테고리 및 대표 감성을 가지는 횟수를 카운팅하여 각 그룹별 연결 횟수를 포함하는 동기화 데이터를 생성하는 동기화 데이터 생성부를 포함하는 웹 콘텐츠의 소비 행태 분석 장치
|
2 |
2
제1항에 있어서, 상기 동기화 그룹 중 한 쌍의 사용자 단말기로 이루어진 동기화 그룹을 추출하고, 해당 그룹에 대응하는 동기화 데이터의 대표 카테고리 및 대표 감성 각각의 연결 횟수로부터 연결 지수를 측정하여 상기 추출된 각 그룹별 사회적 연결성 정도를 표시하는 사회적 연결성 표시부를 더 포함하는 웹 콘텐츠의 소비 행태 분석 장치
|
3 |
3
제2항에 있어서, 상기 연결 지수는,아래의 수학식을 이용하여 측정되는 웹 콘텐츠의 소비 행태 분석 장치:여기서, CI(Connection Index)는 연결 지수, CF(Connection Frequency)는 연결 횟수, CP(Connection Pair)는 상기 추출된 각 그룹을 의미한다
|
4 |
4
제2항에 있어서, 상기 사회적 연결성 표시부는,상기 추출된 각 그룹간 관계를 선으로 표시하여 출력하되, 상기 측정된 연결 지수가 높을수록 두꺼운 선으로 표시하는 웹 콘텐츠의 소비 행태 분석 장치
|
5 |
5
제1항에 있어서, 상기 대표 카테고리 및 대표 감성 판단부는, 기 선정된 대표 URL에 포함된 다수의 텍스트가 크롤링된 후, 자연어처리(NLP)를 통해 형태소 단위로 분리되어 생성된 대표 카테고리 어휘 집합이 각 카테고리별 하위 분류로 정의되어 있는 상기 기 정의된 카테고리 분류 데이터를 이용하여, 상기 대표 카테고리 어휘 집합과 상기 추출된 다수의 텍스트간의 문서유사도를 비교하여 가장 높은 문서유사도를 가지는 카테고리를 해당 웹 콘텐츠의 대표 카테고리로 판단하는 웹 콘텐츠의 소비 행태 분석 장치
|
6 |
6
제1항에 있어서,상기 대표 카테고리 및 대표 감성 판단부는,9개의 감성 키워드를 쾌-불쾌의 X축과 각성-이완의 Y축으로 분리된 이차원 그래프에 각각 배치하고, 각각의 감성을 대표하는 대표 감성 어휘 집합이 각 감성별 하위 분류로 정의되어 있는 상기 기 정의된 감성 분류 데이터를 이용하여, 상기 대표 감성 어휘 집합과 상기 추출된 다수의 텍스트간의 문서유사도를 비교하되 개인화된 문서유사도를 반영하여 결정된 가장 높은 최종 문서유사도를 가지는 감성을 해당 웹 콘텐츠의 대표 감성으로 판단하는 웹 콘텐츠의 소비 행태 분석 장치
|
7 |
7
제6항에 있어서,상기 대표 카테고리 및 대표 감성 판단부는, 사용자 단말기에 의해 접속된 URL의 웹 콘텐츠로부터 추출된 상위 20개의 감성 키워드를 상기 X축과 상기 Y축에 7점 척도로 더 배치하고, 아래의 수학식을 이용하여 상기 개인화된 문서유사도를 산출하는 웹 콘텐츠의 소비 행태 분석 장치:여기서, PDS는 상기 개인화된 문서유사도, R(e)는 9개의 감성에 대한 각 대표 어휘 집합, C는 소비된 웹 콘텐츠의 텍스트, DS(R(e), C)는 감성별 대표 어휘 집합과 소비된 웹 콘텐츠의 문서유사도, KPI(e)는 개인별 매핑된 감성 키워드와 소비된 웹 콘텐츠의 문서유사도이다
|
8 |
8
웹 콘텐츠의 소비 행태 분석 장치를 이용한 소비 행태 분석 방법에 있어서,웹로그를 분석하여 사용자 단말기에 기 설치된 웹 브라우저를 통해 접속된 적어도 하나 이상의 URL(uniform resource locator)을 수집하는 단계;상기 수집된 URL들의 웹 콘텐츠들에 각각 포함된 다수의 텍스트를 크롤링(crawling)하여 추출하는 단계;기 정의된 카테고리 분류 데이터 및 감성 분류 데이터를 각각 이용하여 상기 추출된 다수의 텍스트와 가장 높은 문서유사도를 가지는 카테고리 및 감성을 각각의 웹 콘텐츠별 대표 카테고리 및 대표 감성으로 판단하는 단계;복수의 사용자 단말기에서 각각 일별 최대 횟수로 판단된 대표 카테고리 및 대표 감성을 해당 날짜에 대한 해당 사용자 단말기의 대표 카테고리 및 대표 감성으로 판단하여 설정 일수 동안 수집하는 단계; 및 상기 복수의 사용자 단말기를 적어도 둘 이상씩 그룹핑하되, 모든 경우의 수만큼 그룹핑하여 복수개의 동기화 그룹을 생성하고, 상기 동기화 그룹 내 사용자 단말기들이 동일한 날짜에 동일한 대표 카테고리 및 대표 감성을 가지는 횟수를 카운팅하여 각 그룹별 연결 횟수를 포함하는 동기화 데이터를 생성하는 단계를 포함하는 소비 행태 분석 방법
|
9 |
9
제8항에 있어서,상기 동기화 그룹 중 한 쌍의 사용자 단말기로 이루어진 동기화 그룹을 추출하고, 해당 그룹에 대응하는 동기화 데이터의 대표 카테고리 및 대표 감성 각각의 연결 횟수로부터 연결 지수를 측정하여 상기 추출된 각 그룹별 사회적 연결성 정도를 표시하는 단계를 더 포함하는 소비 행태 분석 방법
|
10 |
10
제9항에 있어서,상기 연결 지수는,아래의 수학식을 이용하여 측정되는 소비 행태 분석 방법:여기서, CI(Connection Index)는 연결 지수, CF(Connection Frequency)는 연결 횟수, CP(Connection Pair)는 상기 추출된 각 그룹을 의미한다
|
11 |
11
제9항에 있어서, 상기 사회적 연결성 정도를 표시하는 단계는,상기 추출된 각 그룹간 관계를 선으로 표시하여 출력하되, 상기 측정된 연결 지수가 높을수록 두꺼운 선으로 표시하는 소비 행태 분석 방법
|
12 |
12
제8항에 있어서,상기 웹 콘텐츠별 대표 카테고리 및 대표 감성으로 판단하는 단계는, 기 선정된 대표 URL에 포함된 다수의 텍스트가 크롤링된 후, 자연어처리(NLP)를 통해 형태소 단위로 분리되어 생성된 대표 카테고리 어휘 집합이 각 카테고리별 하위 분류로 정의되어 있는 상기 기 정의된 카테고리 분류 데이터를 이용하여, 상기 대표 카테고리 어휘 집합과 상기 추출된 다수의 텍스트간의 문서유사도를 비교하여 가장 높은 문서유사도를 가지는 카테고리를 해당 웹 콘텐츠의 대표 카테고리로 판단하는 소비 행태 분석 방법
|
13 |
13
제8항에 있어서, 상기 웹 콘텐츠별 대표 카테고리 및 대표 감성으로 판단하는 단계는,다수개의 감성 키워드를 쾌-불쾌의 X축과 각성-이완의 Y축으로 분리된 이차원 그래프에 각각 배치하고, 각각의 감성을 대표하는 대표 감성 어휘 집합이 각 감성별 하위 분류로 정의되어 있는 상기 기 정의된 감성 분류 데이터를 이용하여, 상기 대표 감성 어휘 집합과 상기 추출된 다수의 텍스트간의 문서유사도를 비교하되 개인화된 문서유사도를 반영하여 결정된 가장 높은 최종 문서유사도를 가지는 감성을 해당 웹 콘텐츠의 대표 감성으로 판단하는 소비 행태 분석 방법
|
14 |
14
제13항에 있어서,상기 웹 콘텐츠별 대표 카테고리 및 대표 감성으로 판단하는 단계는, 사용자 단말기에 의해 접속된 URL의 웹 콘텐츠로부터 추출된 상위 20개의 감성 키워드를 상기 X축과 상기 Y축에 7점 척도로 더 배치하고, 아래의 수학식을 이용하여 상기 개인화된 문서유사도를 산출하는 소비 행태 분석 방법:여기서, PDS는 상기 개인화된 문서유사도, R(e)는 9개의 감성에 대한 각 대표 어휘 집합, C는 소비된 웹 콘텐츠의 텍스트, DS(R(e), C)는 감성별 대표 어휘 집합과 소비된 웹 콘텐츠의 문서유사도, KPI(e)는 개인별 매핑된 감성 키워드와 소비된 웹 콘텐츠의 문서유사도이다
|