1 |
1
대용량의 문헌 데이터를 수집하도록 구성된 데이터 수집부;수집된 상기 대용량의 문헌 데이터를 텍스트 전처리 기법을 이용하여 처리하여서 모델링에 적합한 텍스트 데이터를 추출하도록 구성된 전처리부;추출된 상기 텍스트 데이터에 잠재 디리클레 할당(Latent Dirichlet Allocation)을 적용하여 설정된 개수(K)만큼 주제를 자동으로 분류하고 문헌별 주제의 확률분포 및 주제별 단어의 확률분포를 생성하도록 구성된 모델링부;생성된 상기 문헌별 주제의 확률분포 및 주제별 단어의 확률분포를 확인하여 주제의 개수(K)를 업데이트하도록 구성된 클러스터링부;생성된 상기 문헌별 주제의 확률분포와 해당 문헌의 발행연도를 기초로 시간에 따른 주제별 동향을 확인하도록 구성된 관심도 분석부;생성된 상기 문헌별 주제의 확률분포를 사용하여 일반성을 계산함으로써 특정 주제의 연구범위를 정량적으로 확인하도록 구성된 일반성 분석부;생성된 상기 주제별 단어의 확률분포를 기초로 주제 간 유사도를 정량적으로 확인하도록 구성된 유사도 분석부; 생성된 상기 문헌별 주제의 확률분포를 기초로 주제 간 연관성을 정량적으로 확인하도록 구성된 네트워크 분석부; 및상기 관심도 분석부, 일반성 분석부, 유사도 분석부 및 네트워크 분석부에서 확인된 시간에 따른 주제별 동향, 정략적인 특정 주제의 연구범위, 정량적인 주제 간 유사도, 및 정량적인 주제 간 연관성을 디스플레이하도록 구성된 표시부;를 포함하며,상기 클러스터링부는 상기 모델링부에서 소정의 분류 결과가 도출될 때까지 주제의 개수 업데이트를 반복하며,상기 관심도 분석부는생성된 상기 문헌별 주제의 확률분포와 해당 문헌의 발행연도를 사용하여 단순선형회귀분석을 실시함으로써 시간에 따른 주제별 동향을 확인하도록 더욱 구성되며, 여기서 선형회귀계수는 다음의 [수학식 1]을 통해 계산되며,상기 유사도 분석부는 상기 주제별 단어의 확률분포를 이용하여 주제 간 유클리디언 거리를 계산함으로써 주제 간 유사도를 정량적으로 확인하도록 더욱 구성되며, 상기 주제 간 유클리디언 거리는 다음의 [수학식 4]에 의해 계산되는, 잠재 디리클레 할당을 이용한 문헌 검토 장치
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
제1 항에 있어서,상기 네트워크 분석부는상기 문헌별 주제의 확률분포와 해당 행렬의 전치행렬 간 내적을 통해 주제-주제 동시출현행렬을 계산함으로써 주제 간 연관성을 정량적으로 확인하도록 더욱 구성된, 잠재 디리클레 할당을 이용한 문헌 검토 장치
|
5 |
5
잠재 디리클레 할당을 이용한 문헌 검토 장치를 이용한 문헌 검토 방법으로서,데이터 수집부에 의해 대용량의 문헌 데이터가 수집되는 단계;전처리부가 수집된 상기 대용량의 문헌 데이터를 텍스트 전처리 기법을 이용하여 처리하여서 모델링에 적합한 텍스트 데이터를 추출하는 단계;모델링부가 추출된 상기 텍스트 데이터에 잠재 디리클레 할당(Latent Dirichlet Allocation)을 적용하여 설정된 개수(K)만큼 주제를 자동으로 분류하고 문헌별 주제의 확률분포 및 주제별 단어의 확률분포를 생성하는 단계;클러스터링부가 생성된 상기 문헌별 주제의 확률분포 및 주제별 단어의 확률분포를 확인하여 주제의 개수(K)를 업데이트하는 단계;관심도 분석부가 생성된 상기 문헌별 주제의 확률분포와 해당 문헌의 발행연도를 기초로 시간에 따른 주제별 동향을 확인하는 단계;일반성 분석부가 생성된 상기 문헌별 주제의 확률분포를 사용하여 일반성을 계산함으로써 특정 주제의 연구범위를 정량적으로 확인하는 단계;유사도 분석부가 생성된 상기 주제별 단어의 확률분포를 기초로 주제 간 유사도를 정량적으로 확인하는 단계; 네트워크 분석부가 생성된 상기 문헌별 주제의 확률분포를 기초로 주제 간 연관성을 정량적으로 확인하는 단계; 및표시부를 통해 상기 관심도 분석부, 일반성 분석부, 유사도 분석부 및 네트워크 분석부에서 확인된 시간에 따른 주제별 동향, 정략적인 특정 주제의 연구범위, 정량적인 주제 간 유사도, 및 정량적인 주제 간 연관성이 디스플레이되는 단계;를 포함하며,상기 클러스터링부는 상기 모델링부에서 소정의 분류 결과가 도출될 때까지 주제의 개수 업데이트를 반복하며,상기 관심도 분석부는생성된 상기 문헌별 주제의 확률분포와 해당 문헌의 발행연도를 사용하여 단순선형회귀분석을 실시함으로써 시간에 따른 주제별 동향을 확인하도록 더욱 구성되며, 여기서 선형회귀계수는 다음의 [수학식 1]을 통해 계산되며,상기 유사도 분석부는 상기 주제별 단어의 확률분포를 이용하여 주제 간 유클리디언 거리를 계산함으로써 주제 간 유사도를 정량적으로 확인하도록 더욱 구성되며, 상기 주제 간 유클리디언 거리는 다음의 [수학식 4]에 의해 계산되는 문헌 검토 방법
|