1 |
1
의미 기반으로 명사의 유사도를 계산하는 방법에 있어서,문장 또는 문서로부터 추출한 복수의 명사구에 각각 포함되어 있는 복수의 형용사에 대한 속성 벡터 맵을 확인하는 단계;상기 복수의 명사구에 각각 포함되어 있는 복수의 명사를 기준으로 복수의 제1 속성 벡터 집합을 생성하는 단계;상기 생성한 복수의 제1 속성 벡터 집합에 포함되어 있는 적어도 하나 이상의 형용사들 각각에 대응하는 속성 벡터를 상기 속성 벡터 맵으로부터 확인하고, 상기 제1 속성 벡터 집합에 포함된 형용사들을 각각 확인한 속성 벡터로 변환하여 복수의 제2 속성 벡터 집합을 생성하는 단계;상기 생성한 제2 속성 벡터 집합을 토대로, 두 명사 각각에 대한 두 개의 제2 속성 벡터 집합을 이용하여 형용사 유사도를 계산하는 단계; 및상기 계산한 형용사 유사도를 토대로 상기 두 명사에 대한 의미 유사도를 계산하는 단계를 포함하는 의미 기반 명사 유사도 계산 방법
|
2 |
2
제1항에 있어서,상기 제1 속성 벡터 집합을 생성하는 단계는,추출한 복수의 명사구에 포함되어 있는 명사를 기준으로, 임의의 명사를 수식하며 상기 복수의 명사구에 포함되어 있는 적어도 하나 이상의 형용사를 확인하는 단계; 및하나 이상의 형용사들을 상기 임의의 명사에 대한 제1 속성 벡터 집합으로 생성하는 단계를 포함하는 의미 기반 명사 유사도 계산 방법
|
3 |
3
삭제
|
4 |
4
제1항에 있어서,상기 속성 벡터 맵은 형용사, 상기 형용사에 대한 형용사 범주, 상기 형용사 범주에 대한 확률 분포 그래프 및 복수개의 확률 값을 포함하는 의미 기반 명사 유사도 계산 방법
|
5 |
5
제4항에 있어서,상기 복수개의 확률 값을 토대로 상기 형용사에 대한 벡터 값이 형성되는 의미 기반 명사 유사도 계산 방법
|
6 |
6
제1항에 있어서,상기 제2 속성 벡터 집합을 생성하는 단계 이후에,상기 제2 속성 벡터 집합에 포함되어 있는 복수의 속성 벡터들 중, 미리 설정된 기준치 이상의 확률 값을 가지는 속성 벡터만 제2 속성 벡터 집합 내에 포함하도록 필터링하는 단계를 더 포함하는 의미 기반 명사 유사도 계산 방법
|
7 |
7
제6항에 있어서,상기 제2 속성 벡터 집합을 생성하는 단계 이후에,제2 속성 벡터 집합 내 속성 벡터들을 유사한 형태의 속성 벡터 군으로 분류하는 단계; 및분류한 속성 벡터 군 중 많은 수의 속성 벡터들을 포함하는 속성 벡터 군을 선택하는 단계를 더 포함하는 의미 기반 명사 유사도 계산 방법
|
8 |
8
제1항에 있어서,상기 형용사 유사도를 계산하는 단계는,상기 두 명사 단어 각각에 대한 두 개의 제2 속성 벡터 집합 각각에 대해, 제2 속성 벡터 집합 내 복수의 속성 벡터가 동일한 값을 갖도록 제2 속성 벡터 집합을 형성하는 단계;동일한 속성 벡터 값을 가지는 두 개의 제2 속성 벡터 집합의 크기가 같아지도록 하는 단계;크기가 같은 두 개의 제2 속성 벡터 집합 내 속성 벡터간 일대 일 매칭하여 적어도 하나 이상의 속성 벡터 쌍을 생성하는 단계;상기 적어도 하나 이상의 속성 벡터 쌍 사이의 유사도를 계산하는 단계; 및상기 속성 벡터 쌍 사이의 유사도를 토대로 상기 두 개의 제2 속성 벡터 집합에 대한 속성 벡터 유사도를 계산하는 단계를 포함하는 의미 기반 명사 유사도 계산 방법
|
9 |
9
제8항에 있어서,상기 속성 벡터가 동일한 값을 갖도록 제2 속성 벡터 집합을 형성하는 단계는,제2 속성 벡터 집합 내에 동일한 속성 벡터가 반복하여 포함되어 있는지 확인하는 단계; 및반복하여 포함되어 있는 속성 벡터가 있으면, 해당 속성 벡터를 하나만 포함되도록 설정하고 삭제된 수만큼 속성 벡터에 가중치를 부여하는 단계를 포함하는 의미 기반 명사 유사도 계산 방법
|
10 |
10
제9항에 있어서,상기 두 개의 제2 속성 벡터 집합의 크기가 같아지도록 하는 단계는,상기 제2 속성 벡터 집합의 크기는 제2 속성 벡터 집합에 포함된 속성 벡터 수로 하는 제1 속성 벡터 집합 크기와 제2 속성 벡터 집합 크기를 확인하는 단계;제1 속성 벡터 집합 크기와 제2 속성 벡터 집합 크기가 상이하면, 속성 벡터 집합 크기가 큰 속성 제2 속성 벡터 집합을 크기가 작은 제2 속성 벡터 집합의 크기가 되도록 속성 벡터들을 병합하는 단계; 및크기가 동일해진 제2 속성 벡터 집합 내 속성 벡터들을 가중치에 따라 정렬하는 단계를 포함하는 의미 기반 명사 유사도 계산 방법
|
11 |
11
제8항에 있어서,상기 두 개의 제2 속성 벡터 집합에 대한 속성 벡터 유사도를 계산하는 단계는,여기서 simav(i,j)는 속성 벡터 i와 j 사이의 유사도를 나타내고, 이며, wi와 wj는 속성 벡터 i와 j에 대한 가중치를 의미함으로 계산되는 의미 기반 명사 유사도 계산 방법
|
12 |
12
제1항에 있어서,상기 두 명사에 대한 의미 유사도를 계산하는 단계는,simword(A, B) = simWE(A, B)+α*simattr(A, B)여기서, simWE(A, B)는 벡터 공간 단어 표현상에서 단어 A와 B 사이의 코사인 유사도를 의미하고, α는 경험적으로 결정되는 계수를 의미함로 계산되는 의미 기반 명사 유사도 계산 방법
|
13 |
13
의미 기반으로 명사의 유사도를 계산하는 장치에 있어서,문장이나 문서로부터 형용사-명사로 이루어진 적어도 하나 이상의 명사구를 추출하는 명사구 추출부;상기 명사구 추출부가 추출한 명사구 내에 포함되어 있는 복수의 형용사에 각각 해당하는 속성 벡터 맵을 미리 저장된 형용사들에 대한 속성 벡터 맵에서 확인하는 속성 벡터 저장부;상기 하나 이상의 명사구에 대하여 동일한 명사를 수식하는 형용사들에 대한 속성 벡터를 포함하여 속성 벡터 집합을 생성하고, 의미 유사도 계산 대상인 두 명사 각각에 대한 두 개의 속성 벡터 집합을 이용하여 형용사 유사도를 계산하는 형용사 집합 유사도 계산부; 및상기 형용사 집합 유사도 계산부가 계산한 형용사 유사도를 토대로 상기 두 명사에 대한 의미 유사도를 계산하는 의미 유사도 계산부를 포함하는 의미 기반 명사 유사도 계산 장치
|
14 |
14
제13항에 있어서,상기 형용사 집합 유사도 계산부는,상기 하나 이상의 명사구에서 동일한 명사를 수식하는 형용사들을 모아 제1 속성 벡터 집합을 생성하고, 제1 속성 벡터 집합의 형용사들을 상기 속성 벡터 저장부가 확인한 속성 벡터 맵에 따라 속성 벡터로 변경하여 상기 속성 벡터 집합을 생성하는 의미 기반 명사 유사도 계산 장치
|
15 |
15
제14항에 있어서,상기 형용사 집합 유사도 계산부는,상기 속성 벡터 집합 내 형용사들 중, 속성 벡터에서 미리 설정된 기준치 이상의 확률 값을 가지는 속성 벡터만이 상기 속성 벡터 집합 내에 포함되도록 필터링하는 의미 기반 명사 유사도 계산 장치
|
16 |
16
제14항에 있어서,상기 형용사 집합 유사도 계산부는,명사 유사도 계산 대상인 두 명사에 대한 두 개의 속성 벡터 집합 내에 속성 벡터들이 동일한 값을 가지도록 수정하여 속성 벡터들 각각에 대한 가중치를 설정하고, 가중치가 설정된 속성 벡터들을 가지는 두 개의 속성 벡터 집합을 동일한 크기를 가지는 두 개의 속성 벡터 집합으로 생성하며, 크기가 같은 두 개의 속성 벡터 집합 내 속성 벡터들을 매칭하여 적어도 하나 이상의 속성 벡터 쌍을 생성하는 의미 기반 명사 유사도 계산 장치
|
17 |
17
제16항에 있어서, 상기 형용사 집합 유사도 계산부는,상기 적어도 하나 이상의 속성 벡터 쌍 사이의 유사도를 각각 계산한 후 평균을 구하는 의미 기반 명사 유사도 계산 장치
|
18 |
18
제16항에 있어서,상기 두 개의 속성 벡터 집합에 대한 속성 벡터 유사도는,여기서 simav(i,j)는 속성 벡터 i와 j 사이의 유사도를 나타내고, 이며, wi와 wj는 속성 벡터 i와 j에 대한 가중치를 의미함으로 계산되는 의미 기반 명사 유사도 계산 장치
|
19 |
19
제13항에 있어서,상기 의미 유사도 계산부는,simword(A, B) = simWE(A, B)+α*simattr(A, B)여기서, simWE(A, B)는 벡터 공간 단어 표현상에서 단어 A와 B 사이의 코사인 유사도를 의미하고, α는 경험적으로 결정되는 계수를 의미함으로 상기 두 명사에 대한 의미 유사도를 계산하는 의미 기반 명사 유사도 계산 장치
|