1 |
1
비디오 이상치 탐지를 위한 전자 장치의 동작 방법으로서,비디오의 연속된 프레임들 중에서 적어도 하나의 프레임에 대해 마스킹을 수행하여 적어도 하나의 마스킹되지 않은 프레임에 관한 제1정보 및 적어도 하나의 마스킹된 프레임에 관한 제2정보를 확인하는 단계;상기 제1정보에 대해 인코딩을 수행하여 인코딩된 제1정보를 확인하는 단계;제1모델을 이용하여 상기 인코딩된 제1정보 및 상기 제2정보에 대응되는 상기 프레임들에 관한 제1예측 정보를 확인하고, 제2모델을 이용하여 상기 제1예측 정보에 대응되는 상기 프레임들에 후행하는 후행 프레임에 관한 제2예측 정보를 확인하고, 제3모델을 이용하여 상기 인코딩된 제1정보에 대응되는 상기 후행 프레임에 관한 제3예측 정보를 확인하는 단계; 및상기 제1예측 정보 중 적어도 하나의 마스킹된 프레임에 관한 예측 정보, 상기 제2예측 정보, 및 상기 제3예측 정보를 기초로 상기 비디오의 이상치를 판단하는 단계를 포함하되,상기 제1모델은,상기 인코딩된 제1정보 및 상기 제2정보를 입력 정보로서 이용하여 적어도 하나의 마스킹된 프레임에 관한 정보 및 적어도 하나의 마스킹되지 않은 프레임에 관한 정보를 복원하는 비전 트랜스포머 디코더를 포함하고,상기 제2모델은,선형 함수를 통해 상기 제1예측 정보로부터 상기 제2예측 정보를 생성하는 선형 함수 레이어를 포함하고,상기 제3모델은,상기 인코딩된 제1정보를 입력 정보로서 이용하여 적어도 하나의 마스킹되지 않은 프레임에 관한 정보를 복원하는 비전 트랜스포머 디코더 및 선형 함수를 통해 상기 복원된 적어도 하나의 마스킹되지 않은 프레임에 관한 정보로부터 상기 제3예측 정보를 생성하는 선형 함수 레이어를 포함하는, 동작 방법
|
2 |
2
제1항에 있어서,상기 인코딩된 제1정보를 확인하는 단계는,비전 트랜스포머(Vision Transformer) 인코더를 이용하여 상기 제1정보에 대해 인코딩을 수행하는 단계를 포함하는, 동작 방법
|
3 |
3
삭제
|
4 |
4
비디오 이상치 탐지를 위한 전자 장치의 동작 방법으로서,비디오의 연속된 프레임들 중에서 적어도 하나의 프레임에 대해 마스킹을 수행하여 적어도 하나의 마스킹되지 않은 프레임에 관한 제1정보 및 적어도 하나의 마스킹된 프레임에 관한 제2정보를 확인하는 단계;상기 제1정보에 대해 인코딩을 수행하여 인코딩된 제1정보를 확인하는 단계;제1모델을 이용하여 상기 인코딩된 제1정보 및 상기 제2정보에 대응되는 상기 프레임들에 관한 제1예측 정보를 확인하고, 제2모델을 이용하여 상기 제1예측 정보에 대응되는 상기 프레임들에 후행하는 후행 프레임에 관한 제2예측 정보를 확인하고, 제3모델을 이용하여 상기 인코딩된 제1정보에 대응되는 상기 후행 프레임에 관한 제3예측 정보를 확인하는 단계; 및상기 제1예측 정보 중 적어도 하나의 마스킹된 프레임에 관한 예측 정보, 상기 제2예측 정보, 및 상기 제3예측 정보를 기초로 상기 비디오의 이상치를 판단하는 단계를 포함하되,상기 판단하는 단계는,상기 적어도 하나의 마스킹된 프레임에 관한 예측 정보와 상기 적어도 하나의 마스킹된 프레임에 관한 실측 정보간의 제1유클리드 거리(Euclidean Distance), 상기 제2예측 정보와 상기 후행 프레임에 관한 실측 정보간의 제2유클리드 거리, 및 상기 제3예측 정보와 상기 후행 프레임에 관한 실측 정보간의 제3유클리드 거리를 계산하는 단계; 및제1가중치가 부여된 제1유클리드 거리, 제2가중치가 부여된 제2유클리드 거리, 및 제3가중치가 부여된 제3유클리드 거리로부터 비디오 이상치 탐지를 위한 비디오 이상치 점수를 결정하고, 상기 비디오 이상치 점수를 소정의 임계 값과 비교하여 상기 비디오의 이상치를 판단하는 단계를 포함하는, 동작 방법
|
5 |
5
비디오 이상치 탐지를 위한 전자 장치의 동작 방법으로서,비디오의 연속된 프레임들 중에서 적어도 하나의 프레임에 대해 마스킹을 수행하여 적어도 하나의 마스킹되지 않은 프레임에 관한 제1정보 및 적어도 하나의 마스킹된 프레임에 관한 제2정보를 확인하는 단계;상기 제1정보에 대해 인코딩을 수행하여 인코딩된 제1정보를 확인하는 단계;제1모델을 이용하여 상기 인코딩된 제1정보 및 상기 제2정보에 대응되는 상기 프레임들에 관한 제1예측 정보를 확인하고, 제2모델을 이용하여 상기 제1예측 정보에 대응되는 상기 프레임들에 후행하는 후행 프레임에 관한 제2예측 정보를 확인하고, 제3모델을 이용하여 상기 인코딩된 제1정보에 대응되는 상기 후행 프레임에 관한 제3예측 정보를 확인하는 단계; 및상기 제1예측 정보 중 적어도 하나의 마스킹된 프레임에 관한 예측 정보, 상기 제2예측 정보, 및 상기 제3예측 정보를 기초로 상기 비디오의 이상치를 판단하는 단계를 포함하되,상기 비디오의 연속된 프레임들 중 마지막 프레임 내 객체의 동작 패턴에 관한 정보를 확인하는 단계; 및제4모델을 이용하여 상기 동작 패턴에 관한 정보에 대응되는 상기 객체의 동작 패턴을 재구성한 재구성 정보를 확인하는 단계를 더 포함하고,상기 판단하는 단계는,상기 제1예측 정보 중 적어도 하나의 마스킹된 프레임에 관한 예측 정보, 상기 제2예측 정보, 상기 제3예측 정보, 및 상기 재구성 정보를 기초로 상기 비디오의 이상치를 판단하는 단계를 포함하는, 동작 방법
|
6 |
6
제5항에 있어서,상기 제4모델은,상기 동작 패턴에 관한 정보를 입력 정보로서 이용하여 상기 객체의 동작 패턴을 재구성한 재구성 정보를 생성하는 컨볼루션 오토인코더(Convolutional Autoencoder)를 포함하는, 동작 방법
|
7 |
7
제5항에 있어서,상기 판단하는 단계는,상기 적어도 하나의 마스킹된 프레임에 관한 예측 정보와 상기 적어도 하나의 마스킹된 프레임에 관한 실측 정보간의 유클리드 거리(Euclidean Distance), 상기 제2예측 정보와 상기 후행 프레임에 관한 실측 정보간의 유클리드 거리, 및 상기 제3예측 정보와 상기 후행 프레임에 관한 실측 정보간의 유클리드 거리의 합인 예측 유클리드 거리를 계산하고, 상기 재구성 정보와 상기 동작 패턴에 관한 정보간의 유클리드 거리인 재구성 유클리드 거리를 계산하는 단계; 및제1가중치가 부여된 예측 유클리드 거리 및 제2가중치가 부여된 재구성 유클리드 거리로부터 비디오 이상치 탐지를 위한 비디오 이상치 점수를 결정하고, 상기 비디오 이상치 점수를 소정의 임계 값과 비교하여 상기 비디오의 이상치를 판단하는 단계를 포함하는, 동작 방법
|
8 |
8
제1항에 있어서,통신 디바이스를 통해 비디오 이상치 판단 결과를 외부 장치로 전송하거나, 디스플레이를 통해 상기 비디오 이상치 판단 결과를 출력하는 단계를 더 포함하는, 동작 방법
|
9 |
9
비디오 이상치 탐지를 위한 전자 장치로서,적어도 하나의 프로그램이 저장된 메모리; 및 상기 적어도 하나의 프로그램을 실행함으로써, 비디오의 연속된 프레임들 중에서 적어도 하나의 프레임에 대해 마스킹을 수행하여 적어도 하나의 마스킹되지 않은 프레임에 관한 제1정보 및 적어도 하나의 마스킹된 프레임에 관한 제2정보를 확인하고,상기 제1정보에 대해 인코딩을 수행하여 인코딩된 제1정보를 확인하고,제1모델을 이용하여 상기 인코딩된 제1정보, 및 상기 제2정보에 대응되는 상기 프레임들에 관한 제1예측 정보를 확인하고, 제2모델을 이용하여 상기 제1예측 정보에 대응되는 상기 프레임들에 후행하는 후행 프레임에 관한 제2예측 정보를 확인하고, 제3모델을 이용하여 상기 인코딩된 제1정보에 대응되는 상기 후행 프레임에 관한 제3예측 정보를 확인하고, 및상기 제1예측 정보 중 적어도 하나의 마스킹된 프레임에 관한 예측 정보, 상기 제2예측 정보, 및 상기 제3예측 정보를 기초로 상기 비디오의 이상치를 판단하는 프로세서를 포함하되,상기 제1모델은,상기 인코딩된 제1정보 및 상기 제2정보를 입력 정보로서 이용하여 적어도 하나의 마스킹된 프레임에 관한 정보 및 적어도 하나의 마스킹되지 않은 프레임에 관한 정보를 복원하는 비전 트랜스포머 디코더를 포함하고,상기 제2모델은,선형 함수를 통해 상기 제1예측 정보로부터 상기 제2예측 정보를 생성하는 선형 함수 레이어를 포함하고,상기 제3모델은,상기 인코딩된 제1정보를 입력 정보로서 이용하여 적어도 하나의 마스킹되지 않은 프레임에 관한 정보를 복원하는 비전 트랜스포머 디코더 및 선형 함수를 통해 상기 복원된 적어도 하나의 마스킹되지 않은 프레임에 관한 정보로부터 상기 제3예측 정보를 생성하는 선형 함수 레이어를 포함하는, 전자 장치
|
10 |
10
비디오 이상치 탐지를 위한 전자 장치의 동작 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 비일시적 기록매체로서,상기 동작 방법은,비디오의 연속된 프레임들 중에서 적어도 하나의 프레임에 대해 마스킹을 수행하여 적어도 하나의 마스킹되지 않은 프레임에 관한 제1정보 및 적어도 하나의 마스킹된 프레임에 관한 제2정보를 확인하는 단계;상기 제1정보에 대해 인코딩을 수행하여 인코딩된 제1정보를 확인하는 단계;제1모델을 이용하여 상기 인코딩된 제1정보, 및 상기 제2정보에 대응되는 상기 프레임들에 관한 제1예측 정보를 확인하고, 제2모델을 이용하여 상기 제1예측 정보에 대응되는 상기 프레임들에 후행하는 후행 프레임에 관한 제2예측 정보를 확인하고, 제3모델을 이용하여 상기 인코딩된 제1정보에 대응되는 상기 후행 프레임에 관한 제3예측 정보를 확인하는 단계; 및상기 제1예측 정보 중 적어도 하나의 마스킹된 프레임에 관한 예측 정보, 상기 제2예측 정보, 및 상기 제3예측 정보를 기초로 상기 비디오의 이상치를 판단하는 단계를 포함하되,상기 제1모델은,상기 인코딩된 제1정보 및 상기 제2정보를 입력 정보로서 이용하여 적어도 하나의 마스킹된 프레임에 관한 정보 및 적어도 하나의 마스킹되지 않은 프레임에 관한 정보를 복원하는 비전 트랜스포머 디코더를 포함하고,상기 제2모델은,선형 함수를 통해 상기 제1예측 정보로부터 상기 제2예측 정보를 생성하는 선형 함수 레이어를 포함하고,상기 제3모델은,상기 인코딩된 제1정보를 입력 정보로서 이용하여 적어도 하나의 마스킹되지 않은 프레임에 관한 정보를 복원하는 비전 트랜스포머 디코더 및 선형 함수를 통해 상기 복원된 적어도 하나의 마스킹되지 않은 프레임에 관한 정보로부터 상기 제3예측 정보를 생성하는 선형 함수 레이어를 포함하는, 비일시적 기록매체
|