1 |
1
필드 목록 정보 및 파일 정보가 저장된 데이터베이스;
파일이 입력되면, 상기 입력된 파일을 분석하여 상기 데이터베이스에 포함된 필드 목록 정보에 해당하는 필드 목록을 추출하고, 상기 추출된 필드 목록을 포함하는 요약 테이블을 생성하는 요약 테이블 생성부;
상기 요약 테이블 생성부에서 생성된 요약 테이블의 필드에 대하여 필드 정제, 그룹 생성, 서브데이터 셋 생성 중 적어도 하나를 포함하는 전처리를 수행하는 전처리 모듈;
상기 요약 테이블 생성부 또는 상기 전처리 모듈에서 생성된 필드에 대해 사용자에 의해 입력된 행렬 설정 정보에 따라 행렬을 생성하는 행렬 생성부;
상기 요약 테이블 생성부 또는 상기 전처리 모듈에서 생성된 필드 중에서 상기 사용자에 의해 선택된 필드에 대해 상기 사용자에 의해 입력된 군집 분석 방법에 따라 해당 필드의 군집을 분석하는 군집 분석부;및
상기 행렬 생성부, 상기 전처리 모듈, 상기 군집 분석부 중 적어도 하나에 의해 생성된 데이터에 대해 상기 사용자에 의해 선택된 시각화 방법에 따라 시각화 데이터를 생성하는 시각화 데이터 생성부를 포함하며,
상기 시각화 방법은 챠트, FDP, 전략 맵 중 적어도 하나를 포함하는 것을 특징으로 하며,
상기 파일은 웹문서, 텍스트, 워드, 행렬 중 적어도 하나의 형태로 입력되는 것을 특징으로 하며,
상기 요약 테이블 생성부에서 생성된 요약 테이블은 필드 목록별 내용 건수 및 충실도가 포함된 것을 특징으로 하며
상기 전처리 모듈은,
상기 사용자에 의해 입력된 필드 정제 방법에 따라 선택된 필드를 정제하는 필드 정제부;
상기 사용자에 의해 입력된 그룹 설정 방법에 따라 그룹을 설정하는 그룹 설정부;및
상기 사용자에 의해 입력된 서브데이터 셋 생성 방법에 따라 서브데이터 셋을 생성하는 서브데이터 셋 생성부를 포함하며,
상기 필드 정제 방법은 그룹을 이용하여 필드 생성(Group-Field), 시소러스를 이용하여 필드 생성(Thesaurus-Field), 클러스터를 이용하여 필드 생성(Cluster-Field), 리파인 필드(Refine Field), 컴바인 필드(Combine Field) 생성 방법 중 적어도 하나인 것을 특징으로 하며,
상기 그룹 설정 방법은 New Grouping, Add to Group, Edit Group, Thesaurus를 이용한 그룹 생성, stemming을 이용하여 그룹 생성 중 적어도 하나인 것을 특징으로 하며,
상기 서브데이터 셋 생성 방법은 그룹을 이용하여 서브데이터 셋 생성 방법, 필드 데이터를 이용하여 서브데이터 셋 생성 방법 중 하나인 것을 특징으로 하며,
상기 행렬 설정 정보는 행렬 방식, 행렬 생성 방식, 유사도 계산 방법을 포함하며,
상기 행렬 방식은 발생 행렬 방식, 동시 발생 행렬 방식, 유사도 행렬 방식을 포함하며,
상기 행렬 생성 방식은 레코드 기반 행렬 생성 방식, 레코드에 필드 데이터의 출현 개수 계산을 이용한 행렬 생성 방식을 포함하며
상기 군집 분석부는 상기 사용자에 의해 선택된 필드에 해당하는 개체를 상기 데이터베이스에서 추출한 후 각 개체간의 유사도를 구하여 군집을 분석하는 것을 특징으로 하며,
상기 군집 분석 방법은 Single, Complete, Average, Ward, K-Means 중 적어도 하나를 포함하는 것을 특징으로 하는 정보 분석 시스템
|
14 |
14
(a)파일이 입력되면, 상기 입력된 파일을 분석하여 필드 목록을 추출하고, 상기 추출된 필드 목록별 고유 아이템 수와 데이터 충실도를 포함하는 요약 테이블을 생성하는 단계;
(b)상기 생성된 요약 테이블의 필드에 대해 행렬 생성 명령, 전처리 명령, 군집 분석 명령 중 적어도 하나가 입력되면, 상기 입력된 명령에 대한 설정 화면을 제공하고, 상기 제공된 설정 화면을 통해 해당 설정 정보가 입력되면, 해당 필드에 대해 상기 설정 정보에 따라 처리를 수행하는 단계;및
(c)상기 수행된 처리 결과에 대한 시각화 명령이 입력되면, 선택된 시각화 방법에 따라 상기 처리 결과에 대한 시각화 데이터를 생성하여 출력하는 단계를 포함하며,
상기 (a)단계는,
정보 분석 메뉴가 선택되면, 파일 입력 화면을 제공하는 단계;
상기 파일 입력 화면을 통해 파일이 입력되면, 상기 입력된 파일을 분석하여 상기 파일 입력 화면을 통해 선택된 필드에 해당하는 필드 목록을 추출하는 단계;및
상기 추출된 필드 목록별 고유 아이템 수와 데이터 충실도를 포함하는 요약 테이블을 생성하는 단계를 포함하며,
상기 (b)단계에서,
상기 행렬 생성 명령이 입력되면, 행렬 설정 화면을 제공하는 단계;
상기 행렬 설정 화면을 통해 행렬 설정 정보가 입력되면, 상기 생성된 요약 테이블의 필드에 대해 상기 행렬 설정 정보에 따라 행렬을 생성하는 단계를 포함하며,
상기 행렬 설정 화면은 행렬 방식 선택 영역, 행렬 생성 방식 선택 영역, 유사도 계산 방법 선택 영역으로 구성하되,
상기 행렬 방식 선택 영역에는 발생 행렬, 동시 발생 행렬, 유사도 행렬 방식이 표시되고, 상기 행렬 생성 방식 선택 영역에는 레코드 기반 행렬 생성 및 레코드에 필드 데이터의 출현 유/무를 계산하여 행렬 생성 방식이 표시되는 것을 특징으로 하며,
상기 (b)단계에서,
필드 정제, 그룹 생성, 서브데이터 셋 생성 중 적어도 하나를 포함하는 전처리 명령이 입력되면, 해당 전처리 설정 화면을 제공하는 단계;
상기 전처리 설정 화면을 통해 전처리 설정 정보가 입력되면, 해당 필드에 상기 전처리 설정 정보에 따라 전처리를 수행하는 단계를 포함하는 것을 특징으로 하며,
상기 (b)단계에서,
상기 생성된 요약 테이블의 특정 필드에 대해 군집 분석 명령이 입력되면, 군집 분석 방법 선택 화면을 제공하는 단계;
상기 군집 분석 방법 선택 화면을 통해 선택된 군집 분석 방법에 따라 상기 필드 항목에 대하여 군집을 분석하는 단계를 포함하는 것을 특징으로 하는 정보 분석 방법
|