1 |
1
입력된 코퍼스에 포함된 어절들에 대하여 러프 셋 이론을 적용한 커널을 이용하여 자질을 생성하는 자질생성부(120); 및상기 어절들 중 동일 어절에 대한 자질을 카운트하여 동일 어절들에 대한 자질들과 빈도수를 산출하는 것에 의해 품사 태깅 코퍼스 오류 데이터를 생성하는 자질통계부(130);을 포함하여 구성되는 형태소 태깅 코퍼스 오류 검출 장치
|
2 |
2
청구항 1에 있어서, 상기 커널은,입력된 코퍼스에서 분석 대상 어절에 대하여,분석 대상 어절의 이전 어절의 형태소, 이전 어절의 품사, 현재 어절의 형태소, 다음 어절의 형태소, 다음 어절의 품사의 순으로 자질을 생성하도록 구성되는 형태소 태깅 코퍼스 오류 검출 장치
|
3 |
3
청구항 1에 있어서,상기 자질통계부(130)에서 생성된 어절별 자질의 통계자료를 이용하여, 동일한 어절에 대하여 가장 빈도수가 높은 자질로 생성된 자질을 수정하는 코퍼스수정부(140);를 더 포함하여 구성되는 형태소 태깅 코퍼스 오류 검출 장치
|
4 |
4
청구항 1에 있어서,품사 태깅이 수행된 학습데이터로서의 코퍼스를 입력 받아서 분석을 위한 데이터로 변환하는 코퍼스분석부(110);를 더 포함하여 구성되는 형태소 태깅 코퍼스 오류 검출 장치
|
5 |
5
청구항 4에 있어서, 상기 코퍼스분석부(110)는,상기 입력된 코퍼스에 포함된 어절들 중 형태소와 수작업에 의한 형태소 입력 값을 하나의 어절라인으로 순차적으로 형성하여 출력하도록 구성되는 형태소 태깅 코퍼스 오류 검출 장치
|
6 |
6
코퍼스분석부(110), 자질생성부(120), 자질통계부(130) 및 코퍼스수정부(140)를 포함하는 형태소 품사 태깅 코퍼스 오류 검출 장치에 의한 형태소 품사 태킹 코퍼스 오류 검출 방법에 있어서,상기 자질생성부(120)가 입력된 코퍼스에 포함된 어절들에 대하여 러프 셋 이론을 적용한 커널을 이용하여 자질을 생성하는 자질생성과정(S120); 및상기 자질통계부(130)가 상기 어절들 중 동일 어절에 대한 자질을 카운트하여 동일 어절들에 대한 자질들과 빈도수를 산출하는 것에 의해 품사 태깅 코퍼스 오류 데이터를 생성하는 자질통계처리과정(S130);을 포함하여 구성되는 형태소 태깅 코퍼스 오류 검출 방법
|
7 |
7
청구항 6에 있어서, 상기 커널은,입력된 코퍼스에서 분석 대상 어절에 대하여,분석 대상 어절의 이전 어절의 형태소, 이전 어절의 품사, 현재 어절의 형태소, 다음 어절의 형태소, 다음 어절의 품사의 순으로 자질을 생성하도록 구성되는 형태소 태깅 코퍼스 오류 검출 방법
|
8 |
8
청구항 6에 있어서,상기 코퍼스수정부(140)가 상기 자질통계부(130)에서 생성된 어절별 자질의 통계자료를 이용하여, 동일한 어절에 대하여 가장 빈도수가 높은 자질로 생성된 자질을 수정하는 코퍼스수정과정(S140);을 더 포함하여 이루어지는 형태소 태깅 코퍼스 오류 검출 방법
|
9 |
9
청구항 6에 있어서,상기 코퍼스분석부(110)가 품사 태깅이 수행된 학습데이터로서의 코퍼스를 입력 받아서 분석을 위한 데이터로 변환한 후 상기 자질생성부(120)로 출력하는 코퍼스분석과정(S100);을 더 포함하는 형태소 태깅 코퍼스 오류 검출 방법
|
10 |
10
청구항 9에 있어서, 상기 코퍼스분석과정(S100)은,상기 코퍼스분석부(110)가, 상기 입력된 코퍼스에 포함된 어절들 중 형태소와 수작업에 의한 형태소 입력 값을 하나의 어절라인으로 순차적으로 형성하여 출력하는 코퍼스변환과정을 더 포함하는 형태소 태깅 코퍼스 오류 검출 방법
|