1 |
1
미리 정해진 웹 사이트로부터 특정 유형의 문서를 수집하고 상기 문서를 미리 정의된 구분에 따라 제1 언어로 작성되고 특정 주제를 갖는 글로 구성된 스크립트 부분과 제1 언어 또는 제2 언어로 작성되고 상기 스크립트 부분에서 포함하고 있는 표현들에 대한 설명을 포함하고 있는 설명 부분으로 분리하여 스크립트 문서 및 설명 문서를 생성하는 문서 수집부, 그리고
상기 설명 문서에 기초하여 표현 설명 문장을 추출하고 상기 표현 설명 문장이 상기 스크립트 문서 내에서 설명하고 있는 표현을 추출하는 표현 추출부
를 포함하는 문서 처리 장치
|
2 |
2
제1항에서,
상기 스크립트 문서에서 문장을 분리하여 복수의 스크립트 문장을 추출하고 상기 설명 문서에서 문장을 분리하여 복수의 설명 문장을 추출하는 문장 추출부를 더 포함하는 문서 처리 장치
|
3 |
3
제2항에서,
상기 문장 추출부는 각 설명 문장이 상기 복수의 스크립트 문장 중 어느 스크립트 문장에 대한 설명인지 분류하는 문서 처리 장치
|
4 |
4
제3항에서,
상기 문장 추출부는 조건부 랜덤 필드(conditional random field) 분류기를 사용하여 상기 분류를 수행하는 문서 처리 장치
|
5 |
5
제2항에서,
상기 표현 추출부는 레이블드 순차 패턴(labeled sequential pattern) 기법을 이용하여 상기 복수의 설명 문장으로부터 상기 표현 설명 문장을 추출하는 문서 처리 장치
|
6 |
6
제2항에서,
상기 표현 추출부는 상기 표현 설명 문장과 상기 스크립트 문장 내의 표현의 유사도를 측정하여 상기 표현 설명 문장이 상기 스크립트 문장 내에서 설명하고 있는 표현을 추출하는 문서 처리 장치
|
7 |
7
제6항에서,
상기 유사도는 코사인 유사도(cosine similarity) 기법이나 편집 거리(edit distance) 기법을 사용하여 측정되는 문서 처리 장치
|
8 |
8
제1항에서,
상기 문서 수집부는 상기 스크립트 부분 및 상기 설명 부분의 시작 또는 끝을 나타내는 식별자 또는 문장에 기반하여 상기 스크립트 문서 및 상기 설명 문서를 생성하는 문서 처리 장치
|
9 |
9
제1항에서,
상기 추출된 표현과 상기 추출된 표현을 설명하는 표현 설명 문장을 저장하는 데이터베이스를 더 포함하는 문서 처리 장치
|
10 |
10
제1항에서,
사용자로부터의 요청에 따라 상기 추출된 표현과 상기 추출된 표현을 설명하는 표현 설명 문장을 상기 사용자에게 제공하는 자료 제공부를 더 포함하는 문서 처리 장치
|
11 |
11
제1항에서,
상기 문서는 영어로 작성되어 있는 문서 처리 장치
|
12 |
12
제1항 내지 제11항 중 어느 한 항의 문서 처리 장치를 포함하는 어학 교육 시스템
|
13 |
13
미리 정해진 웹 사이트로부터 특정 유형의 문서를 수집하고 상기 문서를 미리 정의된 구분에 따라 제1 언어로 작성되고 특정 주제를 갖는 글로 구성된 스크립트 부분과 제1 언어 또는 제2 언어로 작성되고 상기 스크립트 부분에서 포함하고 있는 표현들에 대한 설명을 포함하고 있는 설명 부분으로 분리하여 스크립트 문서 및 설명 문서를 생성하는 단계, 그리고
상기 설명 문서에 기초하여 표현 설명 문장을 추출하고 상기 표현 설명 문장이 상기 스크립트 문서 내에서 설명하고 있는 표현을 추출하는 단계
를 포함하는 문서 처리 방법
|
14 |
14
제13항에서,
상기 스크립트 문서에서 문장을 분리하여 복수의 스크립트 문장을 추출하고 상기 설명 문서에서 문장을 분리하여 복수의 설명 문장을 추출하는 단계를 더 포함하는 문서 처리 방법
|
15 |
15
제14항에서,
상기 문장 추출 단계는 각 설명 문장이 상기 복수의 스크립트 문장 중 어느 스크립트 문장에 대한 설명인지 분류하는 단계를 포함하는 문서 처리 방법
|
16 |
16
제15항에서,
상기 분류 단계는 조건부 랜덤 필드(conditional random field) 분류기를 사용하는 단계를 포함하는 문서 처리 방법
|
17 |
17
제14항에서,
상기 표현 추출 단계는 레이블드 순차 패턴(labeled sequential pattern) 기법을 이용하여 상기 복수의 설명 문장으로부터 상기 표현 설명 문장을 추출하는 단계를 포함하는 문서 처리 방법
|
18 |
18
제14항에서,
상기 표현 추출 단계는 상기 표현 설명 문장과 상기 스크립트 문장 내의 표현의 유사도를 측정하여 상기 표현 설명 문장이 상기 스크립트 문장 내에서 설명하고 있는 표현을 추출하는 단계를 포함하는 문서 처리 방법
|
19 |
19
제18항에서,
상기 유사도는 코사인 유사도(cosine similarity) 기법이나 편집 거리(edit distance) 기법을 사용하여 측정되는 문서 처리 방법
|
20 |
20
제13항에서,
상기 문서 생성 단계는 상기 스크립트 부분 및 상기 설명 부분의 시작 또는 끝을 나타내는 식별자 또는 문장에 기반하여 상기 스크립트 문서 및 상기 설명 문서를 생성하는 문서 처리 방법
|
21 |
21
제13항에서,
상기 추출된 표현과 상기 추출된 표현을 설명하는 표현 설명 문장을 저장하는 단계를 더 포함하는 문서 처리 방법
|
22 |
22
제13항에서,
사용자로부터의 요청에 따라 상기 추출된 표현과 상기 추출된 표현을 설명하는 표현 설명 문장을 상기 사용자에게 제공하는 단계를 더 포함하는 문서 처리 방법
|
23 |
23
제13항에서,
상기 문서는 영어로 작성되어 있는 문서 처리 방법
|
24 |
24
제13항 내지 제23항 중 어느 한 항의 문서 처리 방법을 포함하는 어학 교육 방법
|
25 |
25
컴퓨터에 제13항 내지 제23항 중 어느 한 항의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체
|