1 |
1
인터넷 상에 게재된 이미지를 수집하여 상기 이미지가 개인정보를 포함하는지 여부를 판단하는 개인정보 노출 검색 시스템에 있어서,제1 및 제2 샘플벡터 그룹을 구성하여 저장하되, 상기 제1 샘플벡터 그룹은 다수의 개인정보 이미지들의 특성벡터로 구성되고, 상기 제2 샘플벡터 그룹은 다수의 일반 이미지들의 특성벡터로 구성되는 샘플벡터 저장부;상기 특성벡터의 각 특성에 대하여 개별적으로 성능평가를 수행하여 통과된 특성들을 추출하고, 상기 제1 및 제2 샘플벡터 그룹의 특성벡터들을 추출된 특성들로만 재구성하는 샘플벡터 재구성부;인터넷 상에 게재된 이미지(이하 질의 이미지)를 수집하는 이미지 수집부;상기 질의 이미지의 특성(feature)들을 계산하여 특성벡터를 구성하는 특성벡터 구성부;상기 질의 이미지의 특성벡터(이하 대상 벡터)와 상기 제1 및 제2 샘플벡터 그룹의 특성벡터(이하 샘플 벡터)들과 매칭시켜, 2개의 그룹 중 어느 그룹에 더 매칭되는지를 판단하는 이미지 매칭부; 및,매칭의 판단 결과에 따라 상기 질의 이미지가 개인정보 이미지인지를 판단하는 이미지 판단부를 포함하고,상기 특성벡터 구성부 및 상기 이미지 매칭부는 상기 샘플벡터 재구성부에 의해 재구성된 특성벡터를 이용하고,상기 성능평가는 상기 제1 및 제2 샘플벡터 그룹의 특성벡터들을 테스트 그룹으로 평가되고,상기 이미지 매칭부는 상기 대상 벡터와 상기 샘플 벡터 간의 유사성을 평가하여 유사성이 가장 큰 샘플 벡터를 추출하고, 추출된 샘플벡터가 속하는 샘플벡터 그룹에, 상기 대상벡터가 매칭되는 것으로 판단하는 것을 특징으로 하는 개인정보 노출 검색 시스템
|
2 |
2
제1항에 있어서,상기 이미지 매칭부는 적어도 2개의 이미지 분류기를 이용하여 어느 그룹에 더 매칭되는지를 판단하고,상기 이미지 판단부는 상기 질의 이미지의 특성벡터가 제1 샘플벡터 그룹에 더 매칭되는 것으로 판단하는 이미지 분류기의 개수에 의해, 상기 질의 이미지의 개인정보 이미지 여부를 판단하는 것을 특징으로 하는 개인정보 노출 검색 시스템
|
3 |
3
삭제
|
4 |
4
제1항에 있어서,상기 성능평가는 재현율(recall rate), 긍정오류율(false positive rate), 및, 부정오류율(false negative rate)을 이용하는 것을 특징으로 하는 개인정보 노출 검색 시스템
|
5 |
5
제4항에 있어서,상기 특성의 재현율(recall rate)이 제1 기준율 이상이고 상기 특성의 긍정오류율(false positive rate), 또는, 부정오류율(false negative rate)이 제2 기준율 이하이면, 상기 특성이 상기 성능평가에서 통과되는 것을 특징으로 하는 개인정보 노출 검색 시스템
|
6 |
6
삭제
|
7 |
7
제1항에 있어서,상기 추출된 특성은 그레이 콘트래스트(Gray Contrast), 평균 강도(Intensity), 칼라 모멘트(Moments), 픽셀값의 자기상관도(Autocorrelation), 픽셀값의 상관도(Correlation), 클러스터 쉐이드(Cluster Shade), 비유사성(Dissimilarity),색상 에너지(Energy), 색상 엔트로피(Entropy), 동질성(Homogeneity), 분산도(Variance), 합계 평균(Sum average), 합계 분산(Sum variance), 색상차 분산(Difference variance), 색상차 엔트로피(Difference entropy), 정규화 역차분(INN, Inverse difference normalized), 정규화 역차분 모멘트, 제3 모멘트(Third Moments), 불변 모멘트(Invariant Moments) 중 어느 하나 이상인 것을 특징으로 하는 개인정보 노출 검색 시스템
|
8 |
8
삭제
|
9 |
9
제1항에 있어서,상기 이미지 매칭부는 상기 유사성을 유클리디안 거리(Euclidean Distance)로 계산하는 것을 특징으로 하는 개인정보 노출 검색 시스템
|
10 |
10
제2항에 있어서,상기 이미지 분류기는 히스토그램 기반의 분류기, 특성정보 매칭 기반의 분류기, PCA 기반의 분류기, 학습기반(Support Vector Machine) 기반의 분류기 중 어느 하나 이상을 포함하는 것을 특징으로 하는 개인정보 노출 검색 시스템
|