1 |
1
삭제
|
2 |
2
단어 및 단어의 출현 빈도수에 관한 온톨로지 스키마(schema)를 생성하는 단계;상기 온톨로지 스키마를 이용하여 입력된 텍스트에 대한 키워드 후보 그래프를 생성하는 단계;상기 키워드 후보 그래프를 온톨로지 기반의 데이터베이스부에 저장된 키워드 그래프를 이용하여 확장하는 단계; 및상기 확장된 키워드 후보 그래프로부터 키워드를 추출하는 단계;를 포함하고,상기 온톨로지 스키마를 생성하는 단계는단어 및 단어의 출현 빈도수를 포함하는 단어 인스턴스를 생성하는 단계;상기 단어가 키워드로 추출된 경우 관련 정보를 포함하는 키워드 인스턴스를 생성하는 단계;상기 키워드가 다른 키워드와 함께 출현한 경우 상기 키워드를 상기 다른 키워드와 관계를 지어주기 위한 코워드(co-word) 인스턴스 및 상기 키워드와 상기 다른 키워드의 함께 출현한 빈도를 나타내는 빈도 인스턴스를 생성하는 단계;를 더 포함하는 키워드 추출 방법
|
3 |
3
제2항에 있어서,상기 추출한 키워드를 상기 온톨로지 기반의 데이터베이스부에 저장된 키워드 그래프에 반영하는 단계;를 더 포함하는 키워드 추출 방법
|
4 |
4
제3항에 있어서,상기 키워드 후보 그래프를 생성하는 단계에 앞서,다양한 형태의 입력을 상기 텍스트로 변환하는 단계;를 더 포함하는 키워드 추출 방법
|
5 |
5
제4항에 있어서,상기 다양한 형태의 입력 중 하나는 실시간 음성대화인 키워드 추출 방법
|
6 |
6
제5항에 있어서,상기 키워드 후보 그래프를 생성하는 단계는상기 실시간 음성대화에서 구어체의 특징을 반영하여 불필요한 요소를 제거하는 단계;를 더 포함하는 키워드 추출 방법
|
7 |
7
제3항에 있어서,상기 키워드 후보 그래프를 생성하는 단계는단어 및 노드 스코어를 포함하는 노드를 생성하는 단계;두 노드 사이의 엣지를 상기 두 노드의 단어가 함께 출현한 빈도에 관한 값으로 설정하는 단계;를 더 포함하는 키워드 추출 방법
|
8 |
8
제3항에 있어서,상기 확장하는 단계는상기 온톨로지 기반의 데이터베이스부에 저장된 키워드 그래프에서 상기 키워드 후보 그래프의 각 노드와 동일한 단어를 갖는 노드의 인접 노드를상기 키워드 후보 그래프에 추가함으로써 상기 키워드 후보 그래프를 확장하는 키워드 추출 방법
|
9 |
9
제3항에 있어서,상기 키워드를 추출하는 단계는두 노드 사이의 엣지 스코어를 현재 시간과 단어가 출현했던 시간을 이용하여 시간에 따른 가중치를 고려하는 엣지 스코어로 재설정하는 단계;를 더 포함하는 키워드 추출 방법
|
10 |
10
삭제
|
11 |
11
단어 및 단어의 출현 빈도수에 관한 온톨로지 스키마(schema)에 따른 키워드 그래프를 저장하는 온톨로지 기반의 데이터베이스부;입력된 텍스트에서 하나 이상의 키워드 후보를 선정하는 입력 처리부; 및상기 온톨로지 스키마에 따라 상기 키워드 후보 단어의 인스턴스를 생성하여 상기 텍스트에 대응하는 키워드 후보 그래프를 생성하고, 상기 키워드 후보 그래프를 상기 온톨로지 기반의 데이터베이스부에 저장된 키워드 그래프를 이용하여 확장하며, 상기 확장된 키워드 후보 그래프로부터 키워드를 추출하는 키워드 추출부;를 포함하고,상기 온톨로지 스키마는단어 및 단어의 출현 빈도수를 포함하는 단어 인스턴스;상기 단어가 키워드로 추출된 경우 관련 정보를 포함하는 키워드 인스턴스;상기 키워드가 다른 키워드와 함께 출현한 경우 상기 키워드를 상기 다른 키워드와 관계를 지어주기 위한 코워드(co-word) 인스턴스 및;상기 키워드와 상기 다른 키워드의 함께 출현한 빈도를 나타내는 빈도 인스턴스;를 포함하는 키워드 추출 시스템
|
12 |
12
제11항에 있어서,상기 온톨로지 기반의 데이터베이스부는 상기 추출한 키워드를 상기 온톨로지 기반의 데이터베이스부에 저장된 키워드 그래프에 반영하는 키워드 추출 시스템
|
13 |
13
제12항에 있어서,상기 입력 처리부는 다양한 형태의 입력을 상기 텍스트로 변환하는 텍스트 변환부;를 더 포함하는 키워드 추출 시스템
|
14 |
14
제13항에 있어서,상기 다양한 형태의 입력은 실시간 음성대화인 키워드 추출 시스템
|
15 |
15
제14항에 있어서,상기 입력 처리부는 상기 실시간 음성대화에서 구어체의 특징을 반영하여 불필요한 요소를 제거하는 전처리부;를 더 포함하는 키워드 추출 시스템
|
16 |
16
제12항에 있어서,상기 키워드 후보 그래프는 하나 이상의 노드 및 두 노드 사이의 엣지를 포함하고상기 노드는 단어 및 노드의 스코어를 포함하고,상기 두 노드 사이의 엣지는 상기 두 노드의 단어가 함께 출현한 빈도에 관한 값으로 표현된 그래프인 키워드 추출 시스템
|
17 |
17
제12항에 있어서,상기 키워드 추출부는상기 온톨로지 기반의 데이터베이스부에 저장된 키워드 그래프에서 상기 키워드 후보 그래프의 각 노드와 동일한 단어를 갖는 노드의 인접 노드를상기 키워드 후보 그래프에 추가함으로써 상기 키워드 후보 그래프를 확장하는 키워드 추출 시스템
|
18 |
18
제12항에 있어서,상기 키워드 추출부는두 노드 사이의 엣지 스코어를 현재 시간과 단어가 출현했던 시간을 이용하여 시간에 따른 가중치를 고려하는 엣지 스코어로 재설정 하여 키워드를 추출하는 키워드 추출 시스템
|
19 |
19
상대방의 음성대화를 입력 받는 입력부;상기 음성대화를 텍스트로 변환하는 텍스트 변환부, 상기 텍스트에서 키워드 후보 단어를 선정하는 키워드 후보 선정부를 포함하는 입력 처리부;온톨로지 스키마(schema)에 따른 키워드 그래프를 저장하는 온톨로지 기반의 데이터베이스부;상기 온톨로지 스키마에 따라 상기 키워드 후보 단어의 인스턴스를 생성하여 상기 텍스트에 대응하는 키워드 후보 그래프를 생성하고, 상기 키워드 후보 그래프를 상기 온톨로지 기반의 데이터베이스부에 저장된 키워드 그래프를 이용하여 확장하며, 상기 확장된 키워드 후보 그래프로부터 키워드를 추출하고, 상기 추출한 키워드를 상기 온톨로지에 저장된 키워드 그래프에 반영하는 키워드 추출부; 및상기 추출된 키워드를 시각적으로 인지 가능한 방법으로 표시하는 출력부;를 포함하고,상기 온톨로지 스키마는단어 및 단어의 출현 빈도수를 포함하는 단어 인스턴스;상기 단어가 키워드로 추출된 경우 관련 정보를 포함하는 키워드 인스턴스;상기 키워드가 다른 키워드와 함께 출현한 경우 상기 키워드를 상기 다른 키워드와 관계를 지어주기 위한 코워드(co-word) 인스턴스 및;상기 키워드와 상기 다른 키워드의 함께 출현한 빈도를 나타내는 빈도 인스턴스;를 포함하는 대화 보조 장치
|