1 |
1
토픽 유사도 결정 시스템으로서,복수의 콘텐츠들의 확장자에 기초하여 콘텐츠별 유형을 결정하고, 콘텐츠별 유형에 따라 서로 다른 토픽 모델링을 수행하여 콘텐츠별 하나 이상의 토픽들을 결정하는 토픽 결정부,콘텐츠별 토픽들을 바탕으로, 통합 분류 체계의 각각의 카테고리들과 하나의 콘텐츠 사이의 연관값들을 결정하고, 상기 연관값을 색깔로 시각화하여 각 콘텐츠마다 하나의 2차원 토픽 히스토그램을 생성하는 토픽 히스토그램 생성부, 그리고콘텐츠별 토픽 히스토그램들을 비교하여, 색깔이 동일한 부분의 위치가 같은 콘텐츠들을 토픽 유사도가 높은 것으로 결정하는 토픽 유사도 결정부를 포함하고,상기 통합 분류 체계는 모든 콘텐츠들에 동일하게 적용되는 표준분류체계이고,상기 토픽 모델링은 콘텐츠 유형이 문서이면, 문서의 형태소를 분석한 이후 토픽들을 추출하고, 콘텐츠 유형이 사진이면, 사진에서 곧바로 토픽들을 추출하고, 콘텐츠 유형이 미디어이면, 음성인식(Speech to Text, STT) 알고리즘을 이용하여 미디어의 음성 부분을 문서화하고, 문서화된 부분의 토픽들을 추출하는, 토픽 유사도 결정 시스템
|
2 |
2
제1항에서,상기 토픽 결정부는상기 복수의 콘텐츠들이 서로 다른 언어로 기재된 문서들인 경우, 연동된 번역 엔진을 이용하여 해당 문서들을 특정 언어로 번역하고, 번역된 문서들에 대해 토픽 모델링을 수행하는 토픽 유사도 결정 시스템
|
3 |
3
삭제
|
4 |
4
삭제
|
5 |
5
삭제
|
6 |
6
삭제
|
7 |
7
제1항에서,상기 토픽 히스토그램 생성부는상기 통합 분류 체계의 각각의 카테고리들과 각 콘텐츠에서 추출된 하나 이상의 토픽들 사이의 연관도를 이용하여 상기 연관값들을 결정하는, 토픽 유사도 결정 시스템
|
8 |
8
제1항에서,상기 토픽 히스토그램 생성부는상기 연관값을 표준화하고, 표준화된 연관값을 명도에 대응시켜 상기 연관값을 시각화하여 나타내는, 토픽 유사도 결정 시스템
|
9 |
9
삭제
|
10 |
10
토픽 유사도 결정 시스템이 2차원 토픽 히스토그램을 생성하는 방법으로서,복수의 콘텐츠들의 확장자에 기초하여 콘텐츠별 유형을 결정하고, 콘텐츠별 유형에 따라 서로 다른 토픽 모델링을 수행하여 콘텐츠별 하나 이상의 토픽들을 결정하는 단계,콘텐츠별 토픽들을 바탕으로, 통합 분류 체계의 각각의 카테고리들과 하나의 콘텐츠 사이의 연관값들을 결정하는 단계, 그리고상기 연관값을 색깔로 시각화하여 콘텐츠마다 하나의 2차원 토픽 히스토그램을 생성하는 단계, 그리고콘텐츠별 토픽 히스토그램들을 비교하여, 색깔이 동일한 부분의 위치가 같은 콘텐츠들을 토픽 유사도가 높은 것으로 결정하는 단계를 포함하고,상기 통합 분류 체계는 모든 콘텐츠들에 동일하게 적용되는 표준분류체계이고,상기 토픽 모델링은 콘텐츠 유형이 문서이면, 문서의 형태소를 분석한 이후 토픽들을 추출하고, 콘텐츠 유형이 사진이면, 사진에서 곧바로 토픽들을 추출하고, 콘텐츠 유형이 미디어이면, 음성인식(Speech to Text, STT) 알고리즘을 이용하여 미디어의 음성 부분을 문서화하고, 문서화된 부분의 토픽들을 추출하는, 토픽 히스토그램 생성 방법
|
11 |
11
제10항에서,상기 하나 이상의 토픽들을 결정하는 단계는상기 복수의 콘텐츠들이 서로 다른 언어로 기재된 문서들인 경우, 연동된 번역 엔진을 이용하여 해당 문서들을 특정 언어로 번역하고, 번역된 문서들에 대해 토픽 모델링을 수행하는, 토픽 히스토그램 생성 방법
|
12 |
12
삭제
|
13 |
13
삭제
|
14 |
14
삭제
|
15 |
15
제10항에서,상기 연관값들을 결정하는 단계는상기 통합 분류 체계에 포함된 각각의 카테고리들과 각 콘텐츠에서 추출된 하나 이상의 토픽들 사이의 연관도를 이용하여 상기 연관값들을 결정하는, 토픽 히스토그램 생성 방법
|
16 |
16
제10항에서,상기 토픽 히스토그램을 생성하는 단계는상기 연관값을 표준화하고, 표준화된 연관값을 명도에 대응시켜 상기 연관값을 시각화하여 나타내는, 토픽 히스토그램 생성 방법
|
17 |
17
삭제
|