1 |
1
프로세서 및 메모리를 포함하는 장치를 통해 다크넷 마켓(Darknet Market) 사용자의 다중 계정을 탐지하는 방법에 있어서, (a) 다크넷 마켓에 상품을 판매하며, 서로 상이한 계정을 사용하는 제1 내지 제N(N은 2 이상의 자연수) 사용자가 업로드한 복수 개의 제1 이미지 데이터를 수집하는 단계;(b) 상기 수집한 제1 이미지 데이터를 전처리하여 복수 개의 제2 이미지 데이터를 생성하는 단계;(c) 상기 생성한 제2 이미지 데이터로부터 복수 개의 특징(Feature)을 산출하고, 상기 산출한 복수 개의 특징 각각에 대하여 상기 제1 사용자와 나머지 사용자 간의 사용자 유사도를 상기 나머지 사용자 별로 산출하는 단계; 및(d) 상기 복수 개의 특징 각각에 대하여 상기 나머지 사용자 별로 산출한 제1 사용자와 나머지 사용자 간의 사용자 유사도에 임계값을 적용하여 상기 제1 사용자와 상이한 계정을 사용하지만 동일한 사용자로 볼 수 있는 사용자를 하나 이상 산출하는 단계;를 포함하며, 상기 제2 이미지 데이터로부터 산출한 복수 개의 특징은, 상기 제2 이미지 데이터의 해시값에 대한 정보, 상기 제2 이미지 데이터가 포함하고 있는 상품이 속하는 대분류 카테고리(Main Category)에 대한 정보, 상기 대분류 카테고리에 속하는 소분류 카테고리(Sub Category)에 대한 정보 및 상기 제2 이미지 데이터가 포함하고 있는 텍스트에 대한 정보 중 어느 하나 이상인, 다크넷 마켓 사용자의 다중 계정을 탐지하는 방법
|
2 |
2
제1항에 있어서, 상기 (a) 단계는, (a-1) 상기 제1 내지 제N 사용자가 업로드한 복수 개의 제1 이미지 데이터를 상기 다크넷 마켓에서 직접 수집하는 단계; 및(a-2) 상기 제1 내지 제N 사용자가 상기 다크넷 마켓에 업로드한 복수 개의 제1 이미지 데이터를 수집한 외부 서버로부터 수집하는 단계;중 어느 하나 이상을 포함하는 다크넷 마켓 사용자의 다중 계정을 탐지하는 방법
|
3 |
3
제1항에 있어서, 상기 (b) 단계는, (b-1) 상기 수집한 제1 이미지 데이터의 제1 전처리로 파일 형식을 JPG로 변환하여 상기 복수 개의 제2 이미지 데이터를 생성하는 단계;(b-2) 상기 수집한 제1 이미지 데이터의 제2 전처리로 상기 제1 이미지 데이터 별로 사용자명(Username)에 대한 정보, 대분류 카테고리에 대한 정보, 상기 대분류 카테고리에 속하는 소분류 카테고리에 대한 정보 및 사용자별 PGP Key에 대한 정보 중 어느 하나 이상을 추출하여 상기 복수 개의 제2 이미지 데이터를 생성하는 단계; 및(b-3) 상기 수집한 제1 이미지 데이터의 제3 전처리로 상기 제1 이미지 데이터가 복수 개의 이미지 데이터가 연결된 이미지 데이터인 경우, 각각의 이미지 데이터가 포함하고 있는 상품 별로 분할(Cropping)하고, 해당 상품명으로 분할한 이미지 데이터를 라벨링(Labeling)하여 상기 복수 개의 제2 이미지 데이터를 생성하는 단계; 중 어느 하나 이상을 포함하는 다크넷 마켓 사용자의 다중 계정을 탐지하는 방법
|
4 |
4
제1항에 있어서, 상기 제2 이미지 데이터로부터 산출한 복수 개의 특징 중 하나가 상기 제2 이미지 데이터의 해시값에 대한 정보인 경우, 상기 (c) 단계는, (c-1) 상기 복수 개의 제2 이미지 데이터 각각에 대하여 복수 개의 해시 타입(Type)별 해시값을 산출하는 단계;(c-2) 상기 산출한 복수 개의 해시 타입별 해시값을 이용하여 상기 복수 개의 해시 타입의 성능을 평가하는 단계; 및(c-3) 상기 성능 평가 결과 가장 우수한 성능의 해시 타입의 해시값을 이용하여 상기 제1 사용자에 대한 제2 이미지 데이터의 해시값과 나머지 사용자에 대한 제2 이미지 데이터의 해시값에 따른 사용자 유사도인 해밍 디스턴스(Hamming distance)를 상기 나머지 사용자 별로 산출하는 단계;중 어느 하나 이상을 포함하는 다크넷 마켓 사용자의 다중 계정을 탐지하는 방법
|
5 |
5
제4항에 있어서, 상기 (c-1) 단계의 해시값 산출은, 파이썬(Python)의 해시 함수(Hash function)을 이용하며, 상기 복수 개의 해시 타입은, AHASH, PHASH, DHASH 및 WHASH중 어느 둘 이상인, 다크넷 마켓 사용자의 다중 계정을 탐지하는 방법
|
6 |
6
제4항에 있어서, 상기 (c-2) 단계는, (c-2-1) 상기 복수 개의 제2 이미지 데이터 각각에 대하여 상기 복수 개의 해시 타입 별로 그룹핑하는 단계;(c-2-2) 상기 복수 개의 해시 타입 별로 그룹핑한 각각의 그룹에 속하는 모든 제2 이미지 데이터에 대하여 페어(Pair)를 전부 생성하는 단계; (c-2-3) 상기 전부 생성한 각각의 페어의 SSIM값을 산출하여 그룹별 평균 SSIM값을 산출하는 단계; 및(c-2-4) 상기 산출한 그룹별 평균 SSIM 값 중, 가장 높은 평균 SSIM 값을 나타내는 그룹에 대한 해시 타입을 가장 우수한 성능의 해시 타입으로 평가하는 단계;중 어느 하나 이상을 포함하는 다크넷 마켓 사용자의 다중 계정을 탐지하는 방법
|
7 |
7
제6항에 있어서, 상기 (c-2-3) 단계와 (c-2-4) 단계 사이에,(c-2-3
|
8 |
8
제1항에 있어서, 상기 제2 이미지 데이터로부터 산출한 복수 개의 특징 중 하나가 상기 제2 이미지 데이터가 포함하고 있는 상품이 속하는 대분류 카테고리에 대한 정보 또는 상기 대분류 카테고리에 속하는 소분류 카테고리에 대한 정보 중 어느 하나인 경우, 상기 (c) 단계는, (c-4) 상기 제1 사용자에 대한 제2 이미지 데이터를 이용하여 각각의 제2 이미지 데이터가 포함하고 있는 상품의 대분류 카테고리 또는 소분류 카테고리가 상기 제1 사용자가 판매하고 있는 전체 상품의 대분류 카테고리 또는 소분류 카테고리에서 차지하는 비중을 상기 대분류 카테고리 또는 소분류 카테고리 별로 산출하는 단계; (c-5) 상기 나머지 사용자에 대한 제2 이미지 데이터를 이용하여 각각의 제2 이미지 데이터가 포함하고 있는 상품의 대분류 카테고리 또는 소분류 카테고리가 상기 나머지 사용자가 판매하고 있는 전체 상품의 대분류 카테고리 또는 소분류 카테고리에서 차지하는 비중을 상기 대분류 카테고리 또는 소분류 카테고리 별로 산출하는 단계; 및(c-6) 상기 대분류 카테고리 또는 소분류 카테고리 별로 산출한 제1 사용자에 대한 비중과 나머지 사용자에 대한 비중을 이용하여 상기 제1 사용자에 대한 대분류 카테고리 또는 소분류 카테고리 비중과 나머지 사용자에 대한 대분류 카테고리 또는 소분류 카테고리 비중에 따른 사용자 유사도인 코사인 유사도(Cosine similarity)를 상기 나머지 사용자 별로 산출하는 단계; 중 어느 하나 이상을 포함하는 다크넷 마켓 사용자의 다중 계정을 탐지하는 방법
|
9 |
9
제8항에 있어서, 상기 (c-4) 단계 이전에, (c-3
|
10 |
10
제1항에 있어서, 상기 제2 이미지 데이터로부터 산출한 복수 개의 특징 중 하나가 상기 제2 이미지 데이터가 포함하고 있는 텍스트에 대한 정보인 경우, 상기 (c) 단계는, (c-7) 상기 복수 개의 제2 이미지 데이터 각각에 대하여 포함하고 있는 텍스트 정보를 추출하는 단계; 및(c-8) 상기 추출한 텍스트 정보를 이용하여 상기 제1 사용자에 대한 제2 이미지 데이터의 텍스트에 대한 정보와 나머지 사용자에 대한 제2 이미지 데이터의 텍스트에 대한 정보에 따른 사용자 유사도인 자카드 유사도(Jaccard similarity)를 상기 나머지 사용자 별로 산출하는 단계;중 어느 하나 이상을 포함하는 다크넷 마켓 사용자의 다중 계정을 탐지하는 방법
|
11 |
11
제10항에 있어서, 상기 (c-7) 단계는, (c-7-1) 상기 복수 개의 제2 이미지 데이터 각각에 대하여 텍스트가 포함된 영역에 대한 바운딩 박스(Bounding box)를 설정하는 단계; 및(c-7-2) 상기 복수 개의 제2 이미지 데이터 각각에 대하여 해상도를 향상시키는 단계; 중 어느 하나 이상을 포함하는 다크넷 마켓 사용자의 다중 계정을 탐지하는 방법
|
12 |
12
제1항에 있어서,상기 (d) 단계는, (d-1) 상기 복수 개의 특징 각각에 대하여 상기 나머지 사용자 별로 산출한 사용자 유사도를 합산하여 나머지 사용자 별 유사도 스코어를 산출하는 단계;(d-2) 상기 복수 개의 특징 각각에 대하여 상기 나머지 사용자 별로 산출한 유사도 스코에 제1 임계값을 적용하여 상기 제1 사용자와 상이한 계정을 사용하지만 동일한 사용자로 볼 수 있는 확률이 가장 높은 사용자를 상기 다중 계정 사용자로 산출하는 단계; 및(d-3) 상기 복수 개의 특징 각각에 대하여 상기 나머지 사용자 별로 산출한 유사도 스코어에 제2임계값을 적용하여 상기 제1 사용자와 상이한 계정을 사용하지만 동일한 사용자로 볼 수 있는 확률이 차순위로 높은 사용자를 다중 계정 사용자 후보로 산출하는 단계;중 어느 하나 이상을 포함하는 다크넷 마켓 사용자의 다중 계정을 탐지하는 방법
|
13 |
13
하나 이상의 프로세서;네트워크 인터페이스;상기 프로세서에 의해 수행되는 컴퓨터 프로그램을 로드(Load)하는 메모리; 및대용량 네트워크 데이터 및 상기 컴퓨터 프로그램을 저장하는 스토리지를 포함하되,상기 컴퓨터 프로그램은 상기 하나 이상의 프로세서에 의해,(A) 다크넷 마켓에 상품을 판매하며, 서로 상이한 계정을 사용하는 제1 내지 제N(N은 2 이상의 자연수) 사용자가 업로드한 복수 개의 제1 이미지 데이터를 수집하는 오퍼레이션;(B) 상기 수집한 제1 이미지 데이터를 전처리하여 복수 개의 제2 이미지 데이터를 생성하는 오퍼레이션;(C) 상기 생성한 제2 이미지 데이터로부터 복수 개의 특징(Feature)을 산출하고, 상기 산출한 복수 개의 특징 각각에 대하여 상기 제1 사용자와 나머지 사용자 간의 사용자 유사도를 상기 나머지 사용자 별로 산출하는 오퍼레이션; 및(D) 상기 복수 개의 특징 각각에 대하여 상기 나머지 사용자 별로 산출한 제1 사용자와 나머지 사용자 간의 사용자 유사도에 임계값을 적용하여 상기 제1 사용자와 상이한 계정을 사용하지만 동일한 사용자로 볼 수 있는 다중 계정 사용자를 하나 이상 산출하는 오퍼레이션;을 포함하며, 상기 제2 이미지 데이터로부터 산출한 복수 개의 특징은, 상기 제2 이미지 데이터의 해시값에 대한 정보, 상기 제2 이미지 데이터가 포함하고 있는 상품이 속하는 대분류 카테고리(Main Category)에 대한 정보, 상기 대분류 카테고리에 속하는 소분류 카테고리(Sub Category)에 대한 정보 및 상기 제2 이미지 데이터가 포함하고 있는 텍스트에 대한 정보 중 어느 하나 이상인,다크넷 마켓 사용자의 다중 계정을 탐지하는 장치
|
14 |
14
컴퓨팅 장치와 결합하여,(AA) 다크넷 마켓에 상품을 판매하며, 서로 상이한 계정을 사용하는 제1 내지 제N(N은 2 이상의 자연수) 사용자가 업로드한 복수 개의 제1 이미지 데이터를 수집하는 단계;(BB) 상기 수집한 제1 이미지 데이터를 전처리하여 복수 개의 제2 이미지 데이터를 생성하는 단계;(CC) 상기 생성한 제2 이미지 데이터로부터 복수 개의 특징(Feature)을 산출하고, 상기 산출한 복수 개의 특징 각각에 대하여 상기 제1 사용자와 나머지 사용자 간의 사용자 유사도를 상기 나머지 사용자 별로 산출하는 단계; 및(DD) 상기 복수 개의 특징 각각에 대하여 상기 나머지 사용자 별로 산출한 제1 사용자와 나머지 사용자 간의 사용자 유사도에 임계값을 적용하여 상기 제1 사용자와 상이한 계정을 사용하지만 동일한 사용자로 볼 수 있는 다중 계정 사용자를 하나 이상 산출하는 단계;를 포함하며, 상기 제2 이미지 데이터로부터 산출한 복수 개의 특징은, 상기 제2 이미지 데이터의 해시값에 대한 정보, 상기 제2 이미지 데이터가 포함하고 있는 상품이 속하는 대분류 카테고리(Main Category)에 대한 정보, 상기 대분류 카테고리에 속하는 소분류 카테고리(Sub Category)에 대한 정보 및 상기 제2 이미지 데이터가 포함하고 있는 텍스트에 대한 정보 중 어느 하나 이상인,컴퓨터로 판독 가능한 매체에 저장된 컴퓨터 프로그램
|