맞춤기술찾기

이전대상기술

인간과 상호작용하는 로봇을 가상학습공간에서 학습시키는 방법, 기록매체, 및 그 방법으로 학습된 로봇

  • 기술번호 : KST2015188308
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 인간과 상호작용하는 로봇을 학습시키는 방법에 관한 것으로서 로봇이 동작하는 실제 공간의 특징을 반영하는 가상학습공간상에, 인간에 대응하는 휴먼에이전트(Human Agent)와 로봇에 대응하는 로봇에이전트(Robot Agent)를 생성하는 단계, 가상학습공간상에서 휴먼에이전트가 사용자로부터 인간의 동작을 입력받고, 입력받은 동작을 모방함으로써 인간의 동작을 학습하는 단계, 및 상기 학습된 동작에 기초하여 가상학습공간상에서, 휴먼에이전트와 로봇에이전트간의 상호학습을 통해, 로봇에이전트가 인간과의 상호작용동작을 학습함으로써 로봇의 동작데이터를 생성하는 단계를 포함하는 것을 특징으로 하고, 인간과 상호작용하는 로봇을 학습시키는 방법에서 인간의 참여를 줄임으로써 학습시간과 비용을 절감할 수 있다.
Int. CL B25J 13/00 (2006.01) B25J 9/16 (2006.01) G06F 9/44 (2006.01)
CPC B25J 9/16(2013.01) B25J 9/16(2013.01) B25J 9/16(2013.01) B25J 9/16(2013.01) B25J 9/16(2013.01) B25J 9/16(2013.01)
출원번호/일자 1020110063785 (2011.06.29)
출원인 동국대학교 산학협력단
등록번호/일자 10-1086671-0000 (2011.11.18)
공개번호/일자
공고번호/일자 (20111125) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2011.06.29)
심사청구항수 16

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 동국대학교 산학협력단 대한민국 서울특별시 중구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 조경은 대한민국 서울특별시 강남구
2 성연식 대한민국 서울특별시 노원구
3 엄기현 대한민국 서울특별시 송파구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인충현 대한민국 서울특별시 서초구 동산로 **, *층(양재동, 베델회관)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 동국대학교 산학협력단 대한민국 서울특별시 중구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [우선심사신청]심사청구(우선심사신청)서
[Request for Preferential Examination] Request for Examination (Request for Preferential Examination)
2011.06.29 수리 (Accepted) 1-1-2011-0497763-02
2 [특허출원]특허출원서
[Patent Application] Patent Application
2011.06.29 수리 (Accepted) 1-1-2011-0497534-53
3 [우선심사신청]선행기술조사의뢰서
[Request for Preferential Examination] Request for Prior Art Search
2011.07.05 수리 (Accepted) 9-1-9999-9999999-89
4 [우선심사신청]선행기술조사보고서
[Request for Preferential Examination] Report of Prior Art Search
2011.07.07 수리 (Accepted) 9-1-2011-0056646-45
5 등록결정서
Decision to grant
2011.11.09 발송처리완료 (Completion of Transmission) 9-5-2011-0656542-06
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.12.06 수리 (Accepted) 4-1-2011-5243351-46
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.01.10 수리 (Accepted) 4-1-2014-0002002-62
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.16 수리 (Accepted) 4-1-2019-5163486-33
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
인간과 상호작용하는 로봇을 학습시키는 방법에 있어서,상기 로봇이 동작하는 실제 공간의 특징을 반영하는 가상학습공간상에, 상기 인간에 대응하는 휴먼에이전트(Human Agent)와 상기 로봇에 대응하는 로봇에이전트(Robot Agent)를 생성하는 단계;상기 가상학습공간상에서 상기 휴먼에이전트가 사용자로부터 상기 인간의 동작을 입력받고, 상기 입력받은 동작을 모방함으로써 상기 인간의 동작을 학습하는 단계; 및상기 학습된 동작에 기초하여 상기 가상학습공간상에서, 상기 휴먼에이전트와 상기 로봇에이전트간의 상호학습을 통해, 상기 로봇에이전트가 상기 인간과의 상호작용동작을 학습함으로써 상기 로봇의 동작데이터를 생성하는 단계를 포함하는 방법
2 2
제 1 항에 있어서,상기 로봇에이전트가 상기 상호작용동작을 학습하는 단계는,상기 로봇에이전트가 상기 휴먼에이전트의 동작을 모방하여 반복적으로 학습하는 단계; 및상기 휴먼에이전트와 상기 로봇에이전트간의 상호학습을 통해, 상기 로봇에이전트가 학습한 동작 중 하나의 동작 또는 둘 이상을 조합한 일련의 동작을 학습하는 단계를 포함하는 방법
3 3
제 2 항에 있어서,상기 휴먼에이전트의 동작을 상기 로봇에이전트가 학습하는 단계는,상기 휴먼에이전트의 동작을 입력받아 제 1 동작 제어값을 수집하면서, 마지막으로 양자화한 제2 동작 제어값과 비교하여 두 값의 차이가 임계치 이상이면 상기 제1 동작 제어값을 양자화하여 양자화된 동작을 생성하는 단계; 목표개수의 양자화된 동작이 시간순으로 배열되어 전체 행동이 구성되면, 상기 전체 행동 중 시간 축 상에서 연속하는 양자화된 동작들로 구성할 수 있는 모든 부분 행동들을 추출하는 단계; 및상기 부분 행동들 중 복수의 대표 행동을 추출하고, 상기 대표 행동을 기준으로 상기 부분 행동들을 분류하는 단계를 포함하는 방법
4 4
제 3 항에 있어서,상기 양자화된 동작을 생성하는 단계는,상기 마지막으로 양자화한 제2 동작 제어값과 비교하기 위해, 상기 제1 동작 제어값과 상기 제2 동작 제어값의 유클리드(Euclid) 거리를 계산하여 유클리드 거리가 상기 임계치 이상인지 판단하는 단계를 포함하는 것을 특징으로 하는 방법
5 5
제 2 항에 있어서,상기 로봇에이전트가 일련의 동작을 학습하는 단계는,상기 휴먼에이전트가 각 상태에서 발현 확률이 가장 높은 동작을 수행하는 단계; 및상기 휴먼에이전트의 동작에 따라 상기 로봇에이전트가 수행한 동작에 해당하는 보상값을 누적하는 단계를 반복하여 상기 보상값을 최대화하는 동작을 상기 인간과의 상호작용 동작으로 학습하는 것을 특징으로 하는 방법
6 6
제 5 항에 있어서,상기 로봇에이전트는,상기 휴먼에이전트의 현재 동작과 연결되는 과거의 일련의 동작을 고려하여 상기 보상값을 최대화하는 동작을 학습하는 것을 특징으로 하는 방법
7 7
인간과 상호작용하는 로봇을 학습시키는 방법에 있어서,상기 로봇이 동작하는 실제 공간의 특징을 반영하는 가상학습공간상에, 상기 인간에 대응하는 휴먼에이전트(Human Agent)와 상기 로봇에 대응하는 로봇에이전트(Robot Agent)를 생성하는 단계;상기 가상학습공간상에서 상기 휴먼에이전트가 사용자로부터 상기 인간의 동작을 입력받고, 상기 입력받은 동작을 모방함으로써 상기 인간의 동작을 학습하는 단계;상기 학습된 동작에 기초하여 상기 가상학습공간상에서, 상기 휴먼에이전트와 상기 로봇에이전트간의 상호학습을 통해, 상기 로봇에이전트가 상기 인간과의 상호작용동작을 학습함으로써 상기 로봇의 동작데이터를 생성하는 단계; 및상기 동작데이터를 상기 로봇에 입력하는 단계를 포함하는 방법
8 8
제 7 항에 있어서,상기 동작데이터를 상기 로봇에 입력하는 단계는,상기 입력된 동작데이터에 기초하여 상기 로봇이 상기 인간과 상호작용할 때, 상기 로봇의 동작을 측정하는 단계;상기 로봇의 실제 동작에 대한 측정값과 상기 가상학습공간상의 동작데이터값을 비교하여 오차를 산출하는 단계; 및상기 산출한 오차를 보정하는 단계를 포함하는 방법
9 9
인간과 상호작용하는 캐릭터를 학습시키는 방법에 있어서,상기 캐릭터가 동작하는 가상공간의 특징을 반영하는 가상학습공간상에, 상기 인간에 대응하는 휴먼에이전트(Human Agent)와 상기 캐릭터에 대응하는 캐릭터에이전트(Character Agent)를 생성하는 단계;상기 가상학습공간상에서 상기 휴먼에이전트가 사용자로부터 상기 인간의 동작을 입력받고, 상기 입력받은 동작을 모방함으로써 상기 인간의 동작을 학습하는 단계;상기 학습된 동작에 기초하여 상기 가상학습공간상에서, 상기 휴먼에이전트와 상기 캐릭터에이전트간의 상호학습을 통해, 상기 캐릭터에이전트가 상기 인간과의 상호작용동작을 학습함으로써 상기 캐릭터의 동작데이터를 생성하는 단계;상기 생성된 동작데이터를 상기 캐릭터가 동작하는 가상공간에 대응하는 포맷으로 변환하는 단계; 및상기 캐릭터가 동작하는 가상공간에 대응하는 포맷으로 변환한 동작데이터를 상기 캐릭터에 입력하는 단계를 포함하는 방법
10 10
제 1 항 내지 제 9 항 중 어느 한 항의 방법을 컴퓨터 시스템에서 실행하기 위한 프로그램이 기록된 컴퓨터 시스템이 판독할 수 있는 기록매체
11 11
인간과 상호작용하는 로봇에 있어서,상기 로봇은 가상학습공간의 학습 과정을 통해 학습되고,상기 학습 과정은,상기 로봇이 동작하는 실제 공간의 특징을 반영하는 상기 가상학습공간상에, 상기 인간에 대응하는 휴먼에이전트(Human Agent)와 상기 로봇에 대응하는 로봇에이전트(Robot Agent)를 생성하고,상기 가상학습공간상에서 상기 휴먼에이전트가 사용자로부터 상기 인간의 동작을 입력받고, 상기 입력받은 동작을 모방함으로써 상기 인간의 동작을 학습하며,상기 학습된 동작에 기초하여 상기 가상학습공간상에서, 상기 휴먼에이전트와 상기 로봇에이전트간의 상호학습을 통해, 상기 로봇에이전트가 상기 인간과의 상호작용동작을 학습함으로써 상기 로봇의 동작데이터를 생성하는 것을 특징으로 하는 로봇
12 12
제 11 항에 있어서,상기 로봇에이전트가 상기 상호작용동작을 학습하는 것은,상기 로봇에이전트가 상기 휴먼에이전트의 동작을 모방하여 반복적으로 학습하고,상기 휴먼에이전트와 상기 로봇에이전트간의 상호학습을 통해, 상기 로봇에이전트가 학습한 동작 중 하나의 동작 또는 둘 이상을 조합한 일련의 동작을 학습하는 것을 특징으로 하는 로봇
13 13
제 12 항에 있어서,상기 휴먼에이전트의 동작을 상기 로봇에이전트가 학습하는 것은,상기 휴먼에이전트의 동작을 입력받아 제 1 동작 제어값을 수집하면서, 마지막으로 양자화한 제2 동작 제어값과 비교하여 두 값의 차이가 임계치 이상이면 상기 제1 동작 제어값을 양자화하여 양자화된 동작을 생성하고,목표개수의 양자화된 동작이 시간순으로 배열되어 전체 행동이 구성되면, 상기 전체 행동 중 시간 축 상에서 연속하는 양자화된 동작들로 구성할 수 있는 모든 부분 행동들을 추출하며,상기 부분 행동들 중 복수의 대표 행동을 추출하고, 상기 대표 행동을 기준으로 상기 부분 행동들을 분류하는 것을 특징으로 하는 로봇
14 14
제 13 항에 있어서,상기 양자화된 동작을 생성하는 것은,상기 마지막으로 양자화한 제2 동작 제어값과 비교하기 위해, 상기 제1 동작 제어값과 상기 제2 동작 제어값의 유클리드(Euclid) 거리를 계산하여 유클리드 거리가 상기 임계치 이상인지 판단하는 것을 특징으로 하는 로봇
15 15
제 12 항에 있어서,상기 로봇에이전트가 일련의 동작을 학습하는 것은,상기 휴먼에이전트가 각 상태에서 발현 확률이 가장 높은 동작을 수행하고,상기 휴먼에이전트의 동작에 따라 상기 로봇에이전트가 수행한 동작에 해당하는 보상값을 누적하는 단계를 반복하여 상기 보상값을 최대화하는 동작을 상기 인간과의 상호작용 동작으로 학습하는 것을 특징으로 하는 로봇
16 16
제 15 항에 있어서,상기 로봇에이전트는,상기 휴먼에이전트의 현재 동작과 연결되는 과거의 일련의 동작을 고려하여 상기 보상값을 최대화하는 동작을 학습하는 것을 특징으로 하는 로봇
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 지식경제부 동국대학교 산학협력단 산학협력중심대학육성사업 [산중-기술개발] 실버로봇콘텐츠를 위한 교사학습 기반 프레임워크 개발