1 |
1
수집부에서 외부 서버로부터 설화 데이터를 수집하는 제1단계;상기 제1단계로부터 수집된 설화 데이터를 분석 및 필터링하여 명사추출부에서 설화 데이터 내에 포함된 명사를 추출하는 제2단계;명사 선정부에서 상기 제2단계로부터 추출된 명사 중 유의미한 서사정보 명사를 선정하는 제3단계; 및관계 형성부에서 상기 제3단계로부터 선정된 각 서사정보 명사들에 대한 관계 정의 및 토픽맵을 도출을 통해 각 서사정보 명사들의 관계를 시각화시키는 제4단계; 를 포함하며,상기 제4단계는, 토픽분류부분에서 상기 3단계를 통해 선정된 서사정보 명사들을 영웅 서사구조 기반의 관계 모델링을 통해 토픽 타입을 분류 및 정의하는 제4-1단계; 맵핑부분에서 상기 분류 및 정의된 토픽 타입에 대하여 서사정보 명사를 맵핑하는 제4-2단계; 확장부분에서 상기 맵핑된 서사정보 명사에 대해 내부DB 또는 외부DB를 참조하여 개별 토픽에 대한 개념을 확장하는 제4-3단계; 관계성 구축부분에서 상기 확장된 개념을 가지는 개별 토픽 간의 관계성을 구축하는 제4-4단계; 및 시각화부분에서 상기 관계성이 구축된 토픽을 토픽 타입에 따라 토픽맵 형태로 시각화시키는 제4-5단계; 를 포함하는 것을 특징으로 하는설화 데이터 내 서사정보 추출 방법
|
2 |
2
제1항에 있어서,상기 제2단계는, 특수문자 제거부분에서 상기 수집된 설화 데이터에 포함된 특수문자를 제거하는 제2-1단계; POS 태깅부분에서 상기 특수문자가 제거된 설화 데이터를 POS(Part-Of-Speech) 태깅을 통해 품사별로 분류하는 제2-2단계; 및 명사추출부분에서 상기 품사별로 분류된 설화 데이터 중 미리 정의된 패턴을 가지는 명사를 추출하는 제2-3단계; 를 포함하는 것을 특징으로 하는설화 데이터 내 서사정보 추출 방법
|
3 |
3
제2항에 있어서,상기 제2-1단계는 특수성 지정부분에서 특수문자 중 대괄호, 중괄호, 소괄호, 큰따옴표, 작은따옴표에 대해 식별기호를 부가하여 해당 특수문자에 대한 특수성을 지정하는 단계 및 문장 구분을 위하여 마침표를 제거하지 않는 단계를 더 포함하는 것을 특징으로 하는설화 데이터 내 서사정보 추출 방법
|
4 |
4
제1항에 있어서,상기 제3단계는, 후보명사 추출부분에서 상기 제2단계를 통해 추출된 명사의 출현 빈도수를 측정하여 서사정보 후보 명사를 추출하는 제3-1단계; 불용어 정의부분에서, 상기 제3-1단계에서 추출된 서사정보 후보 명사 중 둘 이상의 품사를 가지는 서사정보 후보 명사들의 불용어 명사 목록을 정의하는 제3-2단계; 및 명사선정부분에서, 상기 제3-2단계에서 적용된 불용어 명사 목록을 바탕으로 상기 제3-1단계에서 추출된 서사정보 후보 명사를 필터링하여 서사정보 명사를 선정하는 제3-3단계; 를 포함하는 것을 특징으로 하는설화 데이터 내 서사정보 추출 방법
|
5 |
5
제4항에 있어서,상기 제3-3단계는 선정된 서사정보 명사 중 출현 빈도수가 1 이하인 서사정보 명사를 제거하는 단계를 더 포함하는 것을 특징으로 하는설화 데이터 내 서사정보 추출 방법
|
6 |
6
삭제
|
7 |
7
제1항에 있어서,상기 제4-4단계는 개별 토픽 간에 대한 인물관계, 사건관계, 배경관계를 구축하고 상기 인물관계, 사건관계, 배경관계가 결합된 연계관계를 구축하는 단계인 것을 특징으로 하는설화 데이터 내 서사정보 추출 방법
|
8 |
8
외부 서버로부터 설화 데이터를 수집하는 수집부;상기 수집부로부터 수집된 설화 데이터를 분석 및 필터링하여 설화 데이터 내에 포함된 명사를 추출하는 명사추출부;상기 명사추출부로부터 추출된 명사 중 유의미한 서사정보 명사를 선정하는 명사선정부; 및상기 명사선정부로부터 선정된 각 서사정보 명사들에 대한 관계 정의 및 토픽맵을 도출을 통해 각 서사정보 명사들의 관계를 시각화시키는 관계형성부; 를 포함하며,상기 관계형성부는, 상기 명사선정부를 통해 선정된 서사정보 명사들을 영웅 서사구조 기반의 관계 모델링을 통해 토픽 타입을 분류 및 정의하는 토픽분류부분; 상기 분류 및 정의된 토픽 타입에 대하여 서사정보 명사를 맵핑하는 맵핑부분; 상기 맵핑된 서사정보 명사에 대해 내부DB 또는 외부DB를 참조하여 개별 토픽에 대한 개념을 확장하는 확장부분; 상기 확장된 개념을 가지는 개별 토픽 간의 관계성을 구축하는 관계성구축부분; 및 상기 관계성이 구축된 토픽을 토픽 타입에 따라 토픽맵 형태로 시각화시키는 시각화부분; 을 포함하는 것을 특징으로 하는설화 데이터 내 서사정보 추출 시스템
|
9 |
9
제8항에 있어서,상기 명사추출부는, 상기 수집된 설화 데이터에 포함된 특수문자를 제거하는 특수문자제거부분; 상기 특수문자가 제거된 설화 데이터를 POS(Part-Of-Speech) 태깅을 통해 품사별로 분류하는 POS태깅부분; 및 상기 품사별로 분류된 설화 데이터 중 미리 정의된 패턴을 가지는 명사를 추출하는 명사추출부분; 을 포함하는 것을 특징으로 하는설화 데이터 내 서사정보 추출 시스템
|
10 |
10
제9항에 있어서,상기 특수문자제거부분은 특수문자 중 대괄호, 중괄호, 소괄호, 큰따옴표, 작은따옴표에 대해 식별기호를 부가하여 해당 특수문자에 대한 특수성을 지정하는 특수성지정부분을 더 포함하는 것을 특징으로 하는설화 데이터 내 서사정보 추출 시스템
|
11 |
11
제8항에 있어서,상기 명사선정부는, 상기 명사추출부로부터 추출된 명사의 출현 빈도수를 측정하여 서사정보 후보 명사를 추출하는 후보명사추출부분; 상기 서사정보 후보 명사 중 둘 이상의 품사를 가지는 서사정보 후보 명사들의 불용어 명사 목록을 정의하는 불용어정의부분; 상기 불용어 명사 목록을 바탕으로 상기 후보명사추출부분으로부터 추출된 서사정보 후보 명사를 필터링하여 서사정보 명사를 선정하는 명사선정부분; 을 포함하는 것을 특징으로 하는설화 데이터 내 서사정보 추출 시스템
|
12 |
12
제11항에 있어서,상기 명사선정부분은 선정된 서사정보 명사 중 출현 빈도수가 1 이하인 서사정보 명사를 제거하는 것을 특징으로 하는설화 데이터 내 서사정보 추출 시스템
|
13 |
13
삭제
|
14 |
14
제8항에 있어서,상기 관계성구축부분은 개별 토픽 간에 대한 인물관계, 사건관계, 배경관계를 구축하고 상기 인물관계, 사건관계, 배경관계가 결합된 연계관계를 구축하는 것을 특징으로 하는설화 데이터 내 서사정보 추출 시스템
|