1 |
1
얼굴 자세 추정 장치를 이용한 얼굴 자세 추정 방법에 있어서,입력 영상으로부터 사용자의 얼굴 영역을 검출하는 단계;상기 검출된 얼굴 영역의 화소를 ECSP(Exetended Center Symmetric Pattern) 값들로 변환하여 상기 얼굴 영역을 전처리하는 단계;상기 전처리된 얼굴 영역으로부터 NDM(Neighboring Dependence Matrix)을 사용하여 특징 정보를 추출하는 단계; 및 상기 특징 정보를 기 학습된 분류기에 반영하여 패치 영상의 사용자의 얼굴 자세를 추정하는 단계를 포함하며,상기 얼굴 자세를 추정하는 단계는,결정 트리 타입의 분류기들을 앙상블 형태로 결합한 랜덤 포레스트 분류기(Random Forest classifier)를 생성하는 데이터 학습단계를 포함하고,상기 데이터 학습 단계는,상기 특징 정보가 추출된 학습 데이터 집합에서 서브 집합을 랜덤하게 선택하는 단계;상기 결정 트리의 각 해당 노드에서 상기 서브 집합을 2개의 군으로 분류하는데 이용될 이진 분리 함수 집합을 랜덤하게 생성하는 단계;상기 이진 분리 함수에 대하여 상기 서브 집합을 상기 해당 노드에서 분기되는 좌측 노드와 우측 노드로 분할 한 뒤, 분할된 정도를 측정하는 정보 이득(Information Gain)을 계산하는 단계;상기 정보 이득 중에서 가장 큰 값을 가지는 이진 분리 함수를 해당 노드에 저장하는 단계; 및상기 이진 분리 함수에 의하여 분할된 좌측 노드 및 우측 노드에 대하여 상기 이진 분리 함수 집합의 생성, 정보 이득 계산 및 이진 분리 함수 저장의 과정을 반복하여 말단 노드를 생성하는 단계를 포함하는 얼굴 자세 추정 방법
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
제 1항에 있어서,상기 랜덤 포레스트 분류기는,상기 서브 집합의 상기 얼굴 영역에 대한 각각의 패치 영상이 입력되면, 상기 패치 영상을 상기 결정 트리의 각 해당 노드에 저장된 이진 분리 함수를 통해 이진 분류하여, 상기 결정 트리의 하위에 존재하는 하위 노드들 중 말단 노드에 각각 최종 도달하도록 하고,상기 이진 분리 함수(BP)는 아래의 수학식과 같이 상기 패치 영상을 구성하는 두 영역 내에 존재하는 각 화소별 NDM의 특징 정보의 평균값 차이를 기 저장된 임계값과 비교하여 이진 분류를 수행하는 얼굴 자세 추정 방법:여기서, R1 및 R2는 상기 패치 영상에서 랜덤하게 선택된 제1 및 제2 서브패치 영역을 나타내고, N1 및 N2는 상기 R1 및 R2의 화소 개수를 나타내고, F는 특징 정보를 나타내고 그리고 t는 상기 임계값을 나타낸다
|
5 |
5
제 4항에 있어서,상기 특징 정보를 추출하는 단계는,상기 패치 영상의 특정 화소의 주변에 동일한 화소가 적게 분포하는 특징 정보인 제1 특징 정보; 및상기 패치 영상의 특정 화소의 주변에 동일한 화소가 많이 분포하는 특징 정보인 제2 특징정보가 추출하며, 상기 제1 특징 정보와 제2 특징 정보는 각각 다음의 수학식을 이용하여 추출되는 얼굴 자세 추정 방법:,,,여기서, F1은 상기 제1 특징 정보이고, F2는 상기 제2 특징 정보이며, NDM(i, j|d, a)는 상기 특정 화소를 중심으로 반경(d)안의 주변 화소들 중에서 상기 특정 화소의 화소값과의 차이가 임계 값(a) 이하인 화소들의 개수를 나타내며, i는 상기 특정 화소가 갖는 화소값을 나타내고, j는 상기 주변 화소들의 개수를 나타내며, s는 상기 NDM 에서 상기i에 대응되는 전체 행을 나타내고, t는 상기 NDM 에서 상기 j에 대응되는 전체 열을 각각 나타낸다
|
6 |
6
제 5항에 있어서,상기 제 1 특징 정보는 상기 결정 트리의 깊이가 임계값보다 작은 경우에 상기 결정 트리 분할에 사용되고, 상기 제 2 특징 정보는 상기 결정 트리의 깊이가 임계값보다 큰 경우에 상기 결정 트리 분할에 사용되고,상기 정보 이득(Information Gain)은 다음 수학식으로 표현되는 얼굴 자세 추정 방법:여기서, T는 해당 노드, Tl 은 상기 해당 노드에 대한 좌측(L)의 하위 노드 그리고 Tr 은 상기 해당 노드에 대한 우측(R)의 하위 노드를 나타내고, cj는 상기 j 번째 패치 영상의 얼굴 자세 레벨, μl 및 μr 는 상기 하위 노드에 학습된 패치 영상들의 얼굴 자세 라벨의 평균을, NDM(s, t|d, a)는 특정 화소를 중심으로 d반경안의 화소에서 값의 차이가 a보다 작은 것들의 개수를, i는 입력 영상이 갖는 값, j는 상기 특징 정보에 해당하는 이웃 화소의 개수를 각각 나타낸다
|
7 |
7
제 6항에 있어서,상기 랜덤 포레스트 분류기는,상기 입력된 패치 영상이 최종 도달한 상기 말단 노드에 기 저장되어 있는 얼굴 자세 라벨들의 분산값이 기 설정된 기준값 이하이면, 상기 말단 노드에 저장된 대표 얼굴 자세 라벨을 추출하여 출력하며,상기 각각의 패치 영상이 개별 도달한 복수의 말단 노드들로부터 출력된 모든 대표 얼굴 자세 라벨들 중에서 최대 빈도로 출력된 얼굴 자세 라벨을 상기 사용자의 현재 얼굴 자세로 추정하는 얼굴 자세 추정 방법
|
8 |
8
입력 영상으로부터 사용자의 얼굴 영역을 검출하는 얼굴 영역 검출부;상기 검출된 얼굴 영역의 화소를 ECSP(Exetended Center Symmetric Pattern) 값들로 변환하여 상기 얼굴 영역을 전처리하는 영상 전처리부;상기 전처리된 얼굴 영역으로부터 NDM(Neighboring Dependence Matrix)을 사용하여 특징 정보를 추출하는 NDM 특징 추출부; 및상기 특징 정보를 기 학습된 분류기에 반영하여 패치 영상의 사용자의 얼굴 자세를 추정하는 얼굴 자세 추정부를 포함하며,상기 얼굴 자세 추정부는,결정 트리 타입의 분류기들을 앙상블 형태로 결합한 랜덤 포레스트 분류기(Random Forest classifier)를 생성하는 분류기 생성부를 포함하고,상기 분류기 생성부는,상기 특징 정보가 추출된 학습 데이터 집합에서 서브 집합을 랜덤하게 선택하는 서브 집합 선택부;상기 결정 트리의 각 해당 노드에서 상기 서브 집합을 2개의 군으로 분류하는데 이용될 이진 분리 함수 집합을 랜덤하게 생성하는 분리 함수 생성부;상기 이진 분리 함수에 대하여 상기 서브 집합을 상기 해당 노드에서 분기되는 좌측 노드와 우측 노드로 분할 한 뒤, 분할된 정도를 측정하는 정보 이득(Information Gain)을 계산하는 트리 생성부;상기 정보 이득 중에서 가장 큰 값을 가지는 이진 분리 함수를 해당 노드에 저장하는 제어부; 및상기 이진 분리 함수에 의하여 분할된 좌측 노드 및 우측 노드에 대하여 상기 이진 분리 함수 집합의 생성, 정보 이득 계산 및 이진 분리 함수 저장의 과정을 반복하여 말단 노드를 생성하는 학습부를 포함하는 얼굴 자세 추정 장치
|
9 |
9
삭제
|
10 |
10
삭제
|
11 |
11
제 8항에 있어서,상기 랜덤 포레스트 분류기는,상기 서브 집합의 상기 얼굴 영역에 대한 각각의 패치 영상이 입력되면, 상기 패치 영상을 상기 결정 트리의 각 해당 노드에 저장된 이진 분리 함수를 통해 이진 분류하여, 상기 결정 트리의 하위에 존재하는 하위 노드들 중 말단 노드에 각각 최종 도달하도록 하고,상기 이진 분리 함수(BP)는 아래의 수학식과 같이 상기 패치 영상을 구성하는 두 영역 내에 존재하는 각 화소별 NDM의 특징 정보의 평균값 차이를 기 저장된 임계값과 비교하여 이진 분류를 수행하는 얼굴 자세 추정 장치:여기서, R1 및 R2는 상기 패치 영상에서 랜덤하게 선택된 제1 및 제2 서브패치 영역을 나타내고, N1 및 N2는 상기 R1 및 R2의 화소 개수를 나타내고, F는 특징 정보를 나타내고 그리고 t는 상기 임계값을 나타낸다
|
12 |
12
제 11항에 있어서,상기 NDM 특징 추출부는,상기 패치 영상의 특정 화소의 주변에 동일한 화소가 적게 분포하는 특징 정보인 제1 특징 정보; 및상기 패치 영상의 특정 화소의 주변에 동일한 화소가 많이 분포하는 특징 정보인 제2 특징정보를 추출하며,상기 제1 특징 정보와 제2 특징 정보는 각각 다음의 수학식을 이용하여 추출되는 얼굴 자세 추정 장치:,,,여기서, F1은 상기 제1 특징 정보이고, F2는 상기 제2 특징 정보이며, NDM(i, j|d, a)는 상기 특정 화소를 중심으로 반경(d)안의 주변 화소들 중에서 상기 특정 화소의 화소값과의 차이가 임계 값(a) 이하인 화소들의 개수를 나타내며, i는 상기 특정 화소가 갖는 화소값을 나타내고, j는 상기 주변 화소들의 개수를 나타내며, s는 상기 NDM 에서 상기i에 대응되는 전체 행을 나타내고, t는 상기 NDM 에서 상기 j에 대응되는 전체 열을 각각 나타낸다
|
13 |
13
제 12항에 있어서,상기 제 1 특징 정보는 상기 결정 트리의 깊이가 임계값보다 작은 경우에 상기 결정 트리 분할에 사용되고, 상기 제 2 특징 정보는 상기 결정 트리의 깊이가 임계값보다 큰 경우에 상기 결정 트리 분할에 사용되고,상기 정보 이득(Information Gain)은 다음 수학식으로 표현되는 얼굴 자세 추정 장치:여기서, T는 해당 노드, Tl 은 상기 해당 노드에 대한 좌측(L)의 하위 노드 그리고 Tr 은 상기 해당 노드에 대한 우측(R)의 하위 노드를 나타내고, cj는 상기 j 번째 패치 영상의 얼굴 자세 레벨, μl 및 μr 는 상기 하위 노드에 학습된 패치 영상들의 얼굴 자세 라벨의 평균을, NDM(s, t|d, a)는 특정 화소를 중심으로 d반경안의 화소에서 값의 차이가 a보다 작은 것들의 개수를, i는 입력 영상이 갖는 값, j는 상기 특징 정보에 해당하는 이웃 화소의 개수를 각각 나타낸다
|
14 |
14
제 13항에 있어서,상기 랜덤 포레스트 분류기는,상기 입력된 패치 영상이 최종 도달한 상기 말단 노드에 기 저장되어 있는 얼굴 자세 라벨들의 분산값이 기 설정된 기준값 이하이면, 상기 말단 노드에 저장된 대표 얼굴 자세 라벨을 추출하여 출력하며,상기 각각의 패치 영상이 개별 도달한 복수의 말단 노드들로부터 출력된 모든 대표 얼굴 자세 라벨들 중에서 최대 빈도로 출력된 얼굴 자세 라벨을 상기 사용자의 현재 얼굴 자세로 추정하는 얼굴 자세 추정 장치
|