맞춤기술찾기

이전대상기술

복수의 에이전트들을 이용한 행동 정책 결정 장치 및 방법

  • 기술번호 : KST2019014266
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 일 측면에 따른 복수의 에이전트들의 행동 정책 결정 방법은, 복수의 에이전트들에 포함되는 제 1 에이전트에 의해 관측된 감각 정보로부터 추출되며, 상기 제 1 에이전트의 행동을 결정하기 위해 필요한 특성 정보를 나타내는 제 1 수신 특성 정보 값을 획득하는 단계, 상기 복수의 에이전트들 각각에 의해 관측된 감각 정보로부터 추출되며, 상기 복수의 에이전트들 각각에 의해 관측된 특성 정보를 나타내는 복수의 송신 특성 정보 값을 획득하는 단계, 상기 제 1 수신 특성 정보 및 상기 복수의 송신 특성 정보들에 기초하여, 상기 복수의 감각 정보들 각각의 가중치를 결정하는 단계 및 상기 복수의 감각 정보들 및 상기 복수의 환경들 각각에 대응하는 가중치에 기초하여, 상태 행동 가치 함수에 따라 산출되는 복수의 행동들의 보상 정보를 미리 학습한 상태 행동 가치 함수 인공신경망을 통해 상기 제 1 에이전트의 행동을 결정하는 단계를 포함할 수 있다.
Int. CL G06N 3/08 (2006.01.01) G06N 3/04 (2006.01.01)
CPC G06N 3/08(2013.01) G06N 3/08(2013.01)
출원번호/일자 1020180005267 (2018.01.15)
출원인 국방과학연구소
등록번호/일자
공개번호/일자 10-2019-0087023 (2019.07.24) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.01.15)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 국방과학연구소 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 장병탁 서울특별시 관악구
2 최진영 서울특별시 관악구
3 이범진 서울특별시 관악구
4 한동식 서울특별시 관악구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 리앤목특허법인 대한민국 서울 강남구 언주로 **길 **, *층, **층, **층, **층(도곡동, 대림아크로텔)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.01.15 수리 (Accepted) 1-1-2018-0048627-44
2 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.02.28 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0209755-02
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.04.23 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0418172-30
4 의견제출통지서
Notification of reason for refusal
2019.08.21 발송처리완료 (Completion of Transmission) 9-5-2019-0605306-40
5 거절결정서
Decision to Refuse a Patent
2019.12.10 발송처리완료 (Completion of Transmission) 9-5-2019-0895089-05
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
복수의 에이전트들의 행동 정책 결정 방법에 있어서,상기 복수의 에이전트들에 포함되는 제 1 에이전트에 의해 관측된 감각 정보로부터 추출되며, 상기 제 1 에이전트의 행동을 결정하기 위해 필요한 특성 정보를 나타내는 제 1 수신 특성 정보 값을 획득하는 단계;상기 복수의 에이전트들 각각에 의해 관측된 감각 정보로부터 추출되며, 상기 복수의 에이전트들 각각에 의해 관측된 특성 정보를 나타내는 복수의 송신 특성 정보 값을 획득하는 단계;상기 제 1 수신 특성 정보 및 상기 복수의 송신 특성 정보들에 기초하여, 상기 복수의 감각 정보들 각각의 가중치를 결정하는 단계; 및상기 복수의 감각 정보들 및 상기 복수의 환경들 각각에 대응하는 가중치에 기초하여, 상태 행동 가치 함수에 따라 산출되는 복수의 행동들의 보상 정보를 미리 학습한 상태 행동 가치 함수 인공신경망을 통해 상기 제 1 에이전트의 행동을 결정하는 단계를 포함하는 방법
2 2
제 1 항에 있어서,상기 제 1 에이전트의 행동을 결정하는 단계는,상기 상태 행동 가치 함수 인공신경망을 통해 제 1 에이전트의 가능한 복수의 행동들 각각에 대하여 복수의 보상 값들 각각을 산출하고, 상기 복수의 보상 값들을 비교하여 상기 제 1 에이전트의 행동을 결정하는 단계를 포함하는 방법
3 3
제 2 항에 있어서,제 1 에이전트의 행동을 결정하는 단계는,상기 산출된 복수의 보상 값들에 기초하여 최대의 보상 값을 갖는 상기 제 1 에이전트의 행동을 선택하기 위해 이용되는 정책 함수를 계산하는 단계;상기 계산된 정책 함수에 기초하여, 상기 제 1 에이전트의 행동을 결정하는 단계를 포함하는 방법
4 4
제 1 항에 있어서,상기 제 1 수신 특성 정보 값을 추출하는 단계는,상기 제 1 에이전트의 관측된 복수의 감각 정보들에 기초하여 수신 특성 정보 값을 추출하기 위해 미리 학습된 수신 특성 정보 추출 인공신경망을 통해 상기 제 1 수신 특성 정보 값을 추출하는 단계를 포함하는 방법
5 5
제 1 항에 있어서,상기 제 1 송신 특성 정보 값을 추출하는 단계는,상기 제 1 에이전트의 관측된 복수의 감각 정보들에 기초하여 송신 특성 정보 값을 추출하기 위해 미리 학습된 송신 특성 정보 추출 인공신경망을 통해 상기 제 1 송신 특성 정보 값을 추출하는 단계를 포함하는 방법
6 6
복수의 에이전트들의 행동 정책 결정 장치에 있어서,제 1 에이전트에 의해 환경으로부터 관측된 감각 정보로부터 상기 에이전트의 행동을 결정하기 위해 필요한 특성 정보를 나타내는 제 1 수신 특성 정보를 추출하고, 상기 제 1 감각 정보로부터 관측된 특성 정보를 나타내는 송신 특성 정보 값을 추출하는, 특성 정보 추출 모듈;상기 제 1 수신 특성 정보 및 상기 제 1 에이전트를 포함하는 복수의 에이전트들 각각에 대응하는 복수의 송신 특성 정보들을 획득하고, 상기 제 1 수신 특성 정보 및 상기 복수의 송신 특성 정보들에 기초하여 상기 복수의 에이전트들 각각에 의해 관측된 복수의 감각 정보들 각각의 가중치를 결정하는 주의 집중 모듈; 및상기 복수의 감각 정보들 및 상기 결정된 가중치에 기초하여, 미리 학습된 상태 행동 가치함수를 산출하기 위한 상태 행동 가치 함수 인공신경망을 통해 상기 제 1 에이전트의 행동을 결정하는 상태 행동 가치 평가 모듈을 포함하는, 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.