1 |
1
입력 데이터를 복수의 클래스 중 어느 하나의 클래스로 분류하기 위하여, 복수의 샘플 데이터를 기초로 각각의 상기 클래스에 대한 분류 조건을 설정하는 데이터 분류 장치에 의해 수행되는 데이터 분류 규칙 추정 방법에 있어서,상기 샘플 데이터를 구성하는 속성 정보를 분석하여, 복수의 상기 샘플 데이터 중 분류 조건을 설정하기 위한 어느 하나의 클래스와 관련된 샘플 데이터를 학습 데이터 그룹으로 추출하는 학습 데이터 추출 단계;상기 학습 데이터 그룹에 포함된 샘플 데이터의 어느 하나의 속성 정보 및 상기 속성 정보를 나타내는 판단값으로 구성된 속성-값 쌍을 추출하고, 추출된 각각의 상기 속성-값 쌍에 대한 정확도를 산출하는 정확도 산출 단계;산출된 복수의 정확도 중 가장 높은 정확도를 가진 어느 하나의 속성-값 쌍을 선택하고, 선택된 상기 속성-값 쌍을 기초로 조건 규칙을 생성하고, 분류 조건을 설정하기 위한 어느 하나의 클래스에 미리 설정된 초기 규칙에 상기 조건 규칙을 적용하는 규칙 설정 단계; 및상기 학습 데이터 그룹에 포함된 샘플 데이터 중 상기 조건 규칙이 적용된 초기 규칙에 의해 상기 어느 하나의 클래스로 분류된 샘플 데이터를 제거하는 샘플 데이터 제거 단계를 포함하는, 데이터 분류 규칙 추정 방법
|
2 |
2
제1항에 있어서, 상기 학습 데이터 추출 단계는,상기 샘플 데이터를 구성하는 속성 정보를 분석하여, 상기 어느 하나의 클래스가 포함된 샘플 데이터를 후보 데이터 그룹으로 추출하고, 상기 후보 데이터 그룹로부터 미리 정해진 조건을 만족하는 상기 학습 데이터 그룹을 추출하는 것인, 데이터 분류 규칙 추정 방법
|
3 |
3
제2항에 있어서, 상기 미리 정해진 조건은,제1 샘플 데이터의 i번째 속성에 대한 제1 판단값과 제2 샘플 데이터의 상기 i번째 속성에 대한 제2 판단값이 동일한 제1 조건, 상기 제1 샘플 데이터의 상기 i번째 속성에 대한 상기 제1 판단값이 결측값이 아닌 제2 조건 및 상기 제2 샘플 데이터의 상기 i번째 속성에 대한 상기 제2 판단값이 결측값이 아닌 제3 조건을 동시에 만족하는 조건인, 데이터 분류 규칙 추정 방법
|
4 |
4
제1항에 있어서, 상기 정확도 산출 단계에서, 상기 추출된 각각의 상기 속성-값 쌍에 대한 정확도를 산출하는 것은,상기 학습 데이터 그룹에 포함된 모든 샘플 데이터 중 동일한 속성-값 쌍을 가진 샘플 데이터의 개수를 제1 변수로 설정하고, 상기 동일한 속성-값 쌍을 가진 샘플 데이터 중 상기 초기 규칙에 대응되는 속성-값 쌍을 가진 샘플 데이터의 개수를 제2 변수로 설정하며, 상기 제1 변수에 대한 상기 제2 변수의 비율을 상기 동일한 속성-값 쌍에 대한 상기 정확도로 산출하는 것인, 데이터 분류 규칙 추정 방법
|
5 |
5
제1항에 있어서, 상기 규칙 설정 단계는,상기 정확도가 미리 설정된 임계값 이하인 것으로 확인되면, 상기 초기 규칙에 상기 조건 규칙을 적용한 후, 상기 조건 규칙에 적용 과정에서 사용된 상기 어느 하나의 속성-값 쌍을 포함하는 샘플 데이터를 제외하고 상기 규칙 설정 단계를 반복 수행하는, 데이터 분류 규칙 추정 방법
|
6 |
6
제5항에 있어서, 상기 규칙 설정 단계는,상기 정확도가 미리 설정된 임계값 이하인 것으로 확인되면, 상기 조건 규칙에 적용 과정에서 사용된 적어도 하나의 속성-값 쌍을 포함하는 샘플 데이터의 위치 정보를 기록하는 것을 더 포함하는, 데이터 분류 규칙 추정 방법
|
7 |
7
제1항에 있어서,상기 학습 데이터 그룹에 포함된 모든 샘플 데이터가 제거될 때까지 상기정확도 산출 단계, 규칙 설정 단계 및 상기 샘플 데이터 제거 단계를 반복 수행하는, 데이터 분류 규칙 추정 방법
|
8 |
8
제1항에 있어서,각각의 클래스별로 상기 학습 데이터 추출 단계, 상기 정확도 산출 단계 및 상기 규칙 설정 단계를 수행하여 모든 클래스에 대한 분류 조건을 설정한 후 상기 샘플 데이터를 클래스별로 분류하되,복수의 샘플 데이터 중 분류되지 않은 샘플 데이터에 포함된 속성 정보를 분석하여 클래스별 빈도수를 산출하고, 상기 빈도수가 가장 큰 어느 하나의 클래스를 기본 출력 클래스로 설정하는 기본 출력 클래스 설정 단계를 더 포함하는, 데이터 분류 규칙 추정 방법
|
9 |
9
제1항 내지 제8항 중 어느 하나의 항에 따른 데이터 분류 규칙 추정 방법을 수행하기 위한, 컴퓨터 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체
|
10 |
10
입력 데이터를 복수의 클래스 중 어느 하나의 클래스로 분류하기 위하여, 복수의 샘플 데이터를 기초로 각각의 상기 클래스에 대한 분류 조건을 설정하는 데이터 분류 규칙 추정 방법을 수행하는 데이터 분류 장치에 있어서,상기 샘플 데이터를 구성하는 속성 정보를 분석하여, 복수의 상기 샘플 데이터 중 분류 조건을 설정하기 위한 어느 하나의 클래스와 관련된 샘플 데이터를 학습 데이터 그룹으로 추출하는 학습 데이터 추출부;상기 학습 데이터 그룹에 포함된 샘플 데이터의 어느 하나의 속성 정보 및 상기 속성 정보를 나타내는 판단값으로 구성된 속성-값 쌍을 추출하고, 추출된 각각의 상기 속성-값 쌍에 대한 정확도를 산출하는 정확도 산출부;산출된 복수의 정확도 중 가장 높은 정확도를 가진 어느 하나의 속성-값 쌍을 선택하고, 선택된 상기 속성-값 쌍을 기초로 조건 규칙을 생성하고, 분류 조건을 설정하기 위한 어느 하나의 클래스에 미리 설정된 초기 규칙에 상기 조건 규칙을 적용하는 규칙 설정부; 및상기 학습 데이터 그룹에 포함된 샘플 데이터 중 상기 조건 규칙이 적용된 초기 규칙에 의해 상기 어느 하나의 클래스로 분류된 샘플 데이터를 제거하는 샘플 데이터 제거부를 포함하는, 데이터 분류 장치
|