1 |
1
휴대용 단말에 있어서,특정 카테고리를 나타내는 명사 및 상기 명사와 연관된 동사를 포함하는 주제 분류 트리가 저장된 저장부;상기 주제 분류 트리를 이용하여, 상기 휴대용 단말에 저장된 텍스트 데이터를 분석하고 사용자의 의도를 명사 및 동사 형태로 추론하는 사용자 의도 추론부;상기 주제 분류 트리를 이용하여, 인터넷에서 수집한 컨텐츠를 분석하고 상기 컨텐츠의 의미를 명사 및 동사 형태로 추론하는 컨텐츠 의미 분석부; 및상기 사용자의 의도 및 상기 컨텐츠의 의미 사이의 유사도를 계산하여 가장 유사도가 높은 컨텐츠를 랭킹하고 추천하는 컨텐츠 랭킹부를 포함하며,상기 주제 분류 트리는,공개된 디렉토리 데이터(Open Directory Project)가 가공된 하나 이상의 중심 벡터가 트리 형태로 포함되며, 각 카테고리를 나타내는 명사 및 상기 각 카테고리와 연관된 행동을 나타내되 다른 외부 지식 베이스로부터 추출된 동사를 포함하고,상기 사용자 의도 추론부는,상기 휴대용 단말에 저장된 데이터로부터 추출한 제 1 텍스트 데이터를 단어로 구분하여 제 1 단어 벡터를 생성하고, 상기 주제 분류 트리의 카테고리에 있는 중심 벡터와 상기 제 1 단어 벡터 간 유사도를 계산하여 유사도가 가장 높은 카테고리에 해당하는 제 1 명사를 선택하고, 상기 주제 분류 트리에 상기 제 1 명사와 연관되어 저장된 적어도 하나의 동사와 상기 제 1 단어 벡터 간의 연관성을 계산하여 연관성이 가장 높은 제 1 동사를 선택하고,상기 컨텐츠 의미 분석부는,인터넷에서 수집한 컨텐츠로부터 추출한 제 2 텍스트 데이터를 단어로 구분하여 제 2 단어 벡터를 생성하고, 상기 주제 분류 트리의 카테고리에 있는 중심 벡터와 상기 제 2 벡터 간 유사도를 계산하여 유사도가 가장 높은 카테고리에 해당하는 제 2 명사를 선택하고, 상기 주제 분류 트리에 상기 제 2 명사와 연관되어 저장된 적어도 하나의 동사와 상기 제 2 단어 벡터 간의 연관성을 계산하여 연관성이 가장 높은 제 2 동사를 선택하고,상기 컨텐츠 랭킹부는,상기 사용자 의도 추론부 및 상기 컨텐츠 의미 분석부에서 각각 추론된 명사 간 유사도 및 동사 간 유사도를 계산하여, 상기 명사 간 유사도 및 상기 동사 간 유사도를 합산하여 컨텐츠를 랭킹하고 추천하는 휴대용 단말
|
2 |
2
제 1 항에 있어서,상기 명사 및 동사 형태는 명사와 동사가 쌍을 이루는 형태인 휴대용 단말
|
3 |
3
제 1 항에 있어서,상기 사용자 의도 추론부는,상기 제 1 텍스트 데이터가 포함하는 각 단어의 빈도수를 기반으로 각 단어의 가중치 값을 계산하여 상기 제 1 단어 벡터를 생성하는 휴대용 단말
|
4 |
4
제 3 항에 있어서,상기 사용자 의도 추론부는,상기 제 1 텍스트 데이터가 포함하는 단어의 빈도수, 학습될 때 사용된 전체 문서 수, 및 학습될 때 사용된 전체 문서 중에서 단어가 발생한 문서의 빈도수에 기반하여 상기 단어의 가중치 값을 계산하는 휴대용 단말
|
5 |
5
삭제
|
6 |
6
제 1 항에 있어서,상기 사용자 의도 추론부는,상기 유사도를 계산하는 경우,상기 주제 분류 트리의 학습 데이터를 구성하는 단어 집합, 상기 제 1 단어 벡터가 포함하는 단어의 가중치 값, 및 상기 중심 벡터가 포함하는 단어의 가중치 값을 기반으로 계산하고,상기 연관성을 계산하는 경우, 상기 제 1 단어 벡터가 포함하는 동사의 가중치 값, 및 상기 동사와 상기 중심 벡터 간의 유사도를 기반으로 계산하거나, 또는상기 제 1 단어 벡터, 및 상기 주제 분류 트리가 생성되는 과정에서 해당 카테고리 중심 벡터에 연관된 동사가 추출될 때 사용된 학습 데이터의 단어 벡터 간의 유사도를 기반으로 계산하는 휴대용 단말
|
7 |
7
제 1 항에 있어서,상기 컨텐츠 의미 분석부는,상기 컨텐츠가 포함하는 각 단어의 빈도수를 기반으로 각 단어의 가중치 값을 계산하여 상기 제 2 단어 벡터를 생성하는 휴대용 단말
|
8 |
8
제 7 항에 있어서,상기 컨텐츠 의미 분석부는,상기 제 2 텍스트 데이터가 포함하는 단어의 빈도수, 학습될 때 사용된 전체 문서 수, 및 학습될 때 사용된 전체 문서 중에서 단어가 발생한 문서의 빈도수에 기반하여 상기 단어의 가중치 값을 계산하는 휴대용 단말
|
9 |
9
삭제
|
10 |
10
제 1 항에 있어서,상기 컨텐츠 의미 분석부는,상기 유사도를 계산하는 경우,상기 주제 분류 트리의 학습 데이터를 구성하는 단어 집합, 상기 제 2 단어 벡터가 포함하는 단어의 가중치 값, 및 상기 중심 벡터가 포함하는 단어의 가중치 값을 기반으로 계산하고,상기 연관성을 계산하는 경우, 상기 제 2 단어 벡터가 포함하는 동사의 가중치 값, 및 상기 동사와 상기 중심 벡터 간의 유사도를 기반으로 계산하거나, 또는상기 제 2 단어 벡터, 및 상기 주제 분류 트리가 생성되는 과정에서 해당 카테고리 중심 벡터에 연관된 동사가 추출될 때 사용된 학습 데이터의 단어 벡터 간의 유사도를 기반으로 계산하는 휴대용 단말
|
11 |
11
삭제
|
12 |
12
제 1 항에 있어서,상기 컨텐츠 랭킹부는,상기 동사 간의 유사도를 계산하는 경우,상기 사용자 의도 추론부로부터 선택된 명사, 및 상기 컨텐츠 의미 분석부로부터 선택된 명사가 동일한 경우, 기 계산된 동사 간의 유사도를 상기 동사 간의 유사도로서 산출하는 휴대용 단말
|
13 |
13
제 1 항에 있어서,상기 컨텐츠 랭킹부는,상기 명사 간 유사도 및 상기 동사 간 유사도의 선형 조합에 대한 가중치 값을 이용하여 상기 명사 간의 유사도 및 상기 동사 간의 유사도를 합산하는 휴대용 단말
|
14 |
14
휴대용 단말을 통해 컨텐츠를 추천하는 방법에 있어서,상기 휴대용 단말에 저장된 텍스트 데이터를 분석하고 사용자의 의도를 명사 및 동사 형태로 추론하는 단계;인터넷에서 수집한 컨텐츠를 분석하고 상기 컨텐츠의 의미를 명사 및 동사 형태로 추론하는 단계; 및상기 사용자의 의도 및 상기 컨텐츠의 의미 사이의 유사도를 계산하여 컨텐츠를 랭킹하고 추천하는 단계를 포함하며,상기 사용자의 의도를 명사 및 동사 형태로 추론하는 단계는,상기 휴대용 단말에 저장된 데이터로부터 제 1 텍스트 데이터를 추출하는 단계;상기 제 1 텍스트 데이터를 단어로 구분하여 제 1 단어 벡터를 생성하는 단계; 및기저장된 명사 및 동사 형태의 주제 분류 트리의 카테고리에 있는 중심 벡터와 상기 제 1 단어 벡터 간 유사도를 계산하여 유사도가 가장 높은 카테고리에 해당하는 제 1 명사를 선택하고, 상기 주제 분류 트리에 상기 제 1 명사와 연관되어 저장된 적어도 하나의 동사 중 상기 제 1 단어 벡터와의 연관성을 계산하여 연관성이 가장 높은 제 1 동사를 선택하는 단계를 포함하고,상기 컨텐츠의 의미를 명사 및 동사 형태로 추론하는 단계는,인터넷에서 컨텐츠를 수집하여 제 2 텍스트 데이터를 추출하는 단계;상기 제 2 텍스트 데이터를 단어로 구분하여 제 2 단어 벡터를 생성하는 단계; 및상기 주제 분류 트리의 카테고리에 있는 중심 벡터와 상기 제 2 단어 벡터의 유사도를 계산하여 유사도가 가장 높은 카테고리에 해당하는 제 2 명사를 선택하고, 상기 주제 분류 트리에 상기 제 2 명사와 연관되어 저장된 적어도 하나의 동사와 상기 제 2 단어 벡터 간의 연관성을 계산하여 연관성이 가장 높은 제 2 동자를 선택하는 단계를 포함하며,상기 컨텐츠를 랭킹하고 추천하는 단계는,상기 사용자의 의도 및 상기 컨텐츠의 의미로서 각각 추론된 명사 간 유사도 및 동사 간 유사도를 계산하는 단계; 및상기 명사 간의 유사도 및 상기 동사 간의 유사도를 합산하여 컨텐츠를 랭킹하고 추천하는 단계를 포함하고,상기 주제 분류 트리는,공개된 디렉토리 데이터(Open Directory Project)가 가공된 하나 이상의 중심 벡터가 트리 형태로 포함되며, 각 카테고리를 나타내는 명사 및 상기 각 카테고리와 연관된 행동을 나타내되 다른 외부 지식 베이스로부터 추출된 동사를 포함하는 것인 컨텐츠 추천 방법
|
15 |
15
제 14 항에 있어서,상기 제 1 단어 벡터를 생성하는 단계는,상기 추출한 제1 텍스트 데이터가 포함하는 각 단어의 빈도수를 기반으로 각 단어의 가중치 값을 계산하여 상기 제 1 단어 벡터를 생성하는 컨텐츠 추천 방법
|
16 |
16
제 14 항에 있어서,상기 제 2 단어 벡터를 생성하는 단계는,상기 컨텐츠가 포함하는 각 단어의 빈도수를 기반으로 각 단어의 가중치 값을 계산하여 상기 제 2 단어 벡터를 생성하는 컨텐츠 추천 방법
|
17 |
17
삭제
|