1 |
1
문서 내의 중요 단어를 추출하기 위한 장치로서,문서 내의 각 단어를 좌표 축으로 하는 다차원 공간을 생성하고, 그에 상응하는 문장-단어 행렬을 생성하기 위한 행렬 생성 수단;상기 행렬 생성 수단에서 생성한 문장-단어 행렬을 주성분 분석하고, 그 결과로 선택된 각 주성분을 상응하는 고유벡터의 계수로 표현한 후, 고유값으로 정량화하기 위한 주성분 분석 수단; 및상기 주성분 분석 수단에서 정량화한 각 주성분에 대응하는 고유값의 누적비율 및 주성분적재계수를 고려하여 주성분 가운데 중요 단어를 추출하기 위한 중요 단어 추출 수단을 포함하는 문서 중요 단어 추출 장치
|
2 |
2
문서 내의 중요 단어를 추출하기 위한 장치로서,문서 내의 각 단어를 좌표 축으로 하는 다차원 공간을 생성하고, 그에 상응하는 문장-단어 행렬을 생성하기 위한 행렬 생성 수단;상기 행렬 생성 수단에서 생성한 문장-단어 행렬을 비정칙치 분해하여 노이즈를 제거하기 위한 비정칙치 분해 수단;상기 비정칙치 분해 수단에서 노이즈를 제거한 문장-단어 행렬을 주성분 분석하고, 그 결과로 선택된 각 주성분을 상응하는 고유벡터의 계수로 표현한 후, 고유값으로 정량화하기 위한 주성분 분석 수단; 및상기 주성분 분석 수단에서 정량화한 각 주성분에 대응하는 고유값의 누적비율 및 주성분적재계수를 고려하여 주성분 가운데 중요 단어를 추출하기 위한 중요 단어 추출 수단을 포함하는 문서 중요 단어 추출 장치
|
3 |
3
제 1 항 또는 제 2 항에 있어서,상기 주성분 분석 수단은,의 식을 이용하여 주성분을 선택하는문서 중요 단어 추출 장치
|
4 |
4
제 1 항 또는 제 2 항에 있어서,상기 중요 단어 추출 수단은,상기 주성분 분석 수단에서 정량화한 각 주성분에 대응하는 고유값의 누적비율이 제 1 기설정치 이상인 주성분을 선택한 후, 그 주성분의 적재계수가 제 2 기설정치 이상인 단어들을 중요 단어로 선택하는문서 중요 단어 추출 장치
|
5 |
5
제 4 항에 있어서,상기 제 1 기설정치는 90% 이고, 상기 제 2 기설정치는 0
|
6 |
6
문서 내의 중요 단어를 추출하기 위한 방법으로서,문서 내의 각 단어를 좌표 축으로 하는 다차원 공간을 생성하고, 그에 상응하는 문장-단어 행렬을 생성하는 행렬 생성 단계;상기 생성한 문장-단어 행렬을 주성분 분석하는 주성분 분석 단계;상기 주성분 분석 결과 선택된 각 주성분을 상응하는 고유벡터의 계수로 표현하는 고유벡터 표현 단계;각 주성분의 고유벡터를 상응하는 고유값으로 정량화화는 정량화 단계; 및상기 정량화한 각 주성분에 대응하는 고유값의 누적비율 및 주성분적재계수를 고려하여 주성분 가운데 중요 단어를 추출하는 중요 단어 추출 단계를 포함하는 문서 중요 단어 추출 방법
|
7 |
7
문서 내의 중요 단어를 추출하기 위한 방법으로서,문서 내의 각 단어를 좌표 축으로 하는 다차원 공간을 생성하고, 그에 상응하는 문장-단어 행렬을 생성하는 행렬 생성 단계;상기 생성한 문장-단어 행렬을 문장-단어 행렬을 비정칙치 분해하여 노이즈를 제거하는 노이즈 제거 단계;상기 노이즈를 제거한 문장-단어 행렬을 주성분 분석하는 주성분 분석 단계;상기 주성분 분석 결과 선택된 각 주성분을 상응하는 고유벡터의 계수로 표현하는 고유벡터 표현 단계;각 주성분의 고유벡터를 상응하는 고유값으로 정량화화는 정량화 단계; 및상기 정량화한 각 주성분에 대응하는 고유값의 누적비율 및 주성분적재계수를 고려하여 주성분 가운데 중요 단어를 추출하는 추출 단계를 포함하는 문서 중요 단어 추출 방법
|
8 |
8
제 6 항 또는 제 7 항에 있어서,상기 주성분 분석 단계는,의 식을 이용하여 주성분을 선택하는문서 중요 단어 추출 방법
|
9 |
9
제 6 항 또는 제 7 항에 있어서,상기 중요 단어 추출 단계는,상기 정량화한 각 주성분에 대응하는 고유값의 누적비율이 제 1 기설정치 이상인 주성분을 선택한 후, 그 주성분의 적재계수가 제 2 기설정치 이상인 단어들을 중요 단어로 선택하는문서 중요 단어 추출 방법
|
10 |
10
제 9 항에 있어서,상기 제 1 기설정치는 90% 이고, 상기 제 2 기설정치는 0
|