1 |
1
데이터를 입력 받고, 이를 연산 처리한 결과를 출력하기 위한 입출력부;다중 타겟 분석 방법을 수행하기 위한 프로그램이 저장되는 저장부; 및적어도 하나의 프로세스를 포함하며, 상기 프로그램을 실행시킴으로써 상기 입출력부를 통해 수신된 다중 타겟을 분석하는 제어부를 포함하고,상기 제어부는,지시어를 통해 타겟이 특정되도록 상기 지시어 및 상기 타겟에 관한 상태 정보가 매칭된 지시어-타겟 쌍을 수집하여 복수의 지시어-타겟 쌍을 갖는 지시어-타겟 세트를 생성하고,상기 타겟에 관한 지시어 및 상기 타겟에 관한 상태 정보를 입력받아 행동 정보를 출력하는 강화 학습 기반의 학습 모델을 상기 지시어-타겟 세트를 참고하여 학습하고,상기 강화 학습 기반의 학습 모델은, 상기 타겟에 관한 상태 정보를 입력받아 상태 특징 정보를 출력하는 특징 추출 모델을 포함하고,상기 제어부는, 상기 강화 학습의 에피소드에 따른 업데이트 과정에서 상기 타겟의 성공률을 측정하고 상기 성공률을 기반으로 학습을 집중시킬 타겟의 샘플링 비율을 조절하는 방식을 적용하며, 상기 특징 추출 모델에서 상기 지시어-타겟 세트에 저장된 지시어를 상기 특징 추출 모델의 레이블로 사용하고 상기 성공률의 변화도가 높을수록 상기 타겟에 대한 학습 데이터 양을 증가시키는, 다중 타겟 분석 장치
|
2 |
2
제 1 항에 있어서,상기 강화 학습 기반의 학습 모델은,상기 특징 추출 모델에 연결되며, 상기 타겟에 관한 지시어 및 상기 상태 특징 정보를 입력받아 상기 행동 정보를 출력하는 강화 학습 모델을 포함하는, 다중 타겟 분석 장치
|
3 |
3
삭제
|
4 |
4
제 2 항에 있어서,상기 제어부는,상기 강화 학습을 진행하는 과정에서 상기 지시어를 조절하는 방식을 적용하며, 상기 강화 학습 모델에서 상기 지시어-타겟 세트에 저장된 타겟의 양에 관한 비율을 기준으로 상기 비율에 반비례하도록 상기 지시어를 설정하여 학습이 필요한 타겟에 대한 탐험 횟수를 증가시키는, 다중 타겟 분석 장치
|
5 |
5
다중 타겟 분석 장치에 의한 다중 타겟 분석 방법에 있어서,지시어를 통해 타겟이 특정되도록 상기 지시어 및 상기 타겟에 관한 상태 정보가 매칭된 지시어-타겟 쌍을 수집하여 복수의 지시어-타겟 쌍을 갖는 지시어-타겟 세트를 저장하는 단계; 및상기 타겟에 관한 지시어 및 상기 타겟에 관한 상태 정보를 입력받아 행동 정보를 출력하는 강화 학습 기반의 학습 모델을 상기 지시어-타겟 세트를 참고하여 학습하는 단계를 포함하고,상기 강화 학습 기반의 학습 모델은, 상기 타겟에 관한 상태 정보를 입력받아 상태 특징 정보를 출력하는 특징 추출 모델을 포함하고,상기 학습하는 단계는, 상기 강화 학습의 에피소드에 따른 업데이트 과정에서 상기 타겟의 성공률을 측정하고 상기 성공률을 기반으로 학습을 집중시킬 타겟의 샘플링 비율을 조절하는 방식을 적용하며, 상기 특징 추출 모델에서 상기 지시어-타겟 세트에 저장된 지시어를 상기 특징 추출 모델의 레이블로 사용하고 상기 성공률의 변화도가 높을수록 상기 타겟에 대한 학습 데이터 양을 증가시키는, 다중 타겟 분석 방법
|
6 |
6
제 5 항에 있어서,상기 강화 학습 기반의 학습 모델은,상기 특징 추출 모델에 연결되며, 상기 타겟에 관한 지시어 및 상기 상태 특징 정보를 입력받아 상기 행동 정보를 출력하는 강화 학습 모델을 포함하는, 다중 타겟 분석 방법
|
7 |
7
삭제
|
8 |
8
제 6 항에 있어서,상기 학습하는 단계는,상기 강화 학습을 진행하는 과정에서 상기 지시어를 조절하는 방식을 적용하며, 상기 강화 학습 모델에서 상기 지시어-타겟 세트에 저장된 타겟의 양에 관한 비율을 기준으로 상기 비율에 반비례하도록 상기 지시어를 설정하여 학습이 필요한 타겟에 대한 탐험 횟수를 증가시키는, 다중 타겟 분석 방법
|
9 |
9
제 5 항에 기재된 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체
|
10 |
10
다중 타겟 분석 장치에 의해 수행되며, 제 5 항에 기재된 방법을 수행하기 위해 기록 매체에 저장된 컴퓨터 프로그램
|