1 |
1
텍스트 기반의 문서를 탐색하는 문서 수집 모듈;상기 탐색한 문서 안의 텍스트 내용을 입력 가능한 형식으로 변환시키는 전처리 모듈;상기 전처리 모듈이 전처리(preprocess)한 문서 중 의미정보를 선별하여 저장하는 변환/추출 모듈;상기 의미정보를 기반으로, 유사도 계수를 이용한 문서를 군집하거나 문서를 분류하여 재생산하며, 문서 안의 내용 중 업종, 대표 제품, 제품 생산 기업을 서로 연결하는 분석 모듈;상기 분석 모듈이 재생산한 문서 내용을 이용하여 업종별 대표 순수 기업을 선정하는 선정 모듈;을 포함하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
2 |
2
제 1항에 있어서,상기 문서 수집 모듈은,상기 순수 기업 선정 장치와 연결된 외부 저장 장치, 인터넷 검색 포털, 외부 클라우드 장치 중 적어도 하나를 포함하는 문서 저장 장치에서 텍스트 기반의 문서를 탐색하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
3 |
3
제 1항에 있어서,상기 문서 수집 모듈은,기 설정된 주기마다 또는 이미 탐색한 문서가 수정되어 업로드 된 경우, 텍스트 기반의 문서를 업데이트하여 탐색 저장하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
4 |
4
제 1항에 있어서,상기 전처리 모듈은,상기 탐색한 문서 안에 표현되어 있는 단어, 구, 절 중 적어도 하나를 포함하는 형태소를 언어분석하여, 구조화되지 않은 텍스트 내용을 입력 가능한 형식으로 변환시키는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
5 |
5
제 4항에 있어서,상기 전처리 모듈은,상기 탐색한 문서 안의 형태소를 언어분석하는 경우, 한 언어 안에서 의미를 내포하고 있는 가장 작은 단위로 형태소를 추출하며, 상기 형태소를 자립성 여부와 의미의 허실에 따라 분류하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
6 |
6
제 4항에 있어서,상기 전처리 모듈의 형태소 언어분석하는 경우, 또는 상기 변환/추출 모듈의 의미정보를 선별하는 경우, 종래 용어에 대한 정보를 저장하여 사용하는 사전 데이터베이스 모듈;을 더 포함하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
7 |
7
제 1항에 있어서,상기 전처리 모듈은,복수의 변형 패턴이 존재하는 언어 표현을 기 설정된 정규화를 통해 표현하고, 상기 정규화된 언어 표현을 유한상태기계(FSM)를 통해 확인하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
8 |
8
제 1항에 있어서,상기 분석 모듈은,상기 의미정보를 기반으로, 유사도 계수를 이용하여 문서를 군집하는 클러스터링부;상기 의미정보를 기반으로, 적합성 값의 크기에 따라 설정된 범주에 배정하는지 결정하고, 상기 적합성 값의 정도에 따라 설정된 범주들의 순위를 매기는 텍스트 분류부;를 포함하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
9 |
9
제 8항에 있어서,상기 클러스터링부는,상기 의미정보를 기반으로 복수의 클러스터를 구분하고, 상기 복수의 클러스터간 유사도의 관계에 따른 계층적 클러스터링을 이용하여 문서를 군집하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
10 |
10
제 9항에 있어서,상기 클러스터링부는,단일 연결, 완전 연결, 집단평균연결, 와드 기법 중 적어도 하나의 계층적 클러스터링을 이용하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
11 |
11
제 8항에 있어서,상기 클러스터링부는,초기 클러스터의 선정 방법과 재배치 과정의 중지 시점을 결정하는 비계층적 클러스터링을 이용하여 문서를 군집하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
12 |
12
제 8항에 있어서,상기 텍스트 분류부는,분류 대상 문서를 분류기에 입력하고, 예비 검증 또는 교차 검증 방법을 이용하여 문서의 분류 정확도를 측정하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
13 |
13
제 12항에 있어서,상기 분류기는,PSA(Probablistic Sementic Analysis), 베이즈 분류기(naive bayes, bayesien networks, LDA), kNN 분류기, 선형 분류기, 로치오 분류기, SVM 분류기, 신경망 분류기, 다계층 역전파 분류기, 퍼셉트론 분류기 중 적어도 하나를 포함하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
14 |
14
제 1항에 있어서,재생산된 데이터를 시각화하여 표현하는 정보 출력 모듈;을 더 포함하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
15 |
15
제 1항에 있어서,상기 순수 기업 선정 장치의 텍스트 마이닝 처리 과정을 평가하고, 기 설정된 기준에 따라 오류가 발생한 부분을 수정 또는 보완하는 평가 모듈;을 더 포함하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
16 |
16
제 15항에 있어서,상기 평가 모듈은,상기 분석 모듈의 클러스터링 결과 생성된 데이터 구조가 순수 기업 선정에 대한 통계적 증거를 제공하는지 판단하는 클러스터 타당성 평가와, 외적 품질 척도 및 내적 품질 척도를 통해 판단하는 클러스터 성능 평가를 수행하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
17 |
17
제 15항에 있어서,상기 평가 모듈은,중복도 검사, 최근접 이웃 검사, 용어 밀도 검사 중 적어도 하나를 포함하는 클러스터링 경향 검사를 이용하여 의미 있는 클러스터가 생성되는지 평가하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
18 |
18
제 15항에 있어서,상기 평가 모듈은,상기 분석 모듈이 분류한 문서의 분류 재현율 및 분류 정확률을 통하여 분류 성과를 평가하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
19 |
19
제 1항에 있어서,상기 선정 모듈은,단일 업종 여부, 단일 제품 생산 여부, 연구 수행 여부, 재무 정보, 재무 성과 창출 결과 중 적어도 하나를 포함하는 선정 기준에 따라 업종별 대표 순수 기업을 선정하는 것을 특징으로 하는 텍스트 마이닝을 활용한 순수 기업 선정 장치
|
20 |
20
텍스트 기반의 문서를 탐색하는 단계;상기 탐색한 문서 안의 텍스트 내용을 입력 가능한 형식으로 변환하는 단계;상기 전처리 모듈이 전처리(preprocess)한 문서 중 의미정보를 선별하여 저장하는 단계;상기 의미정보를 기반으로, 유사도 계수를 이용한 문서를 군집하거나 문서를 분류하여 재생산하는 단계;문서 안의 내용 중 업종, 대표 제품, 제품 생산 기업을 서로 연결하는 단계;상기 분석 모듈이 재생산한 문서 내용을 이용하여 업종별 대표 순수 기업을 선정하는 단계;를 포함하는 텍스트 마이닝을 활용한 순수 기업 선정 방법
|