맞춤기술찾기

이전대상기술

의미적 제약을 이용한 뉴로-논리 강화학습 최적화 방법

  • 기술번호 : KST2022021947
  • 담당센터 : 경기기술혁신센터
  • 전화번호 : 031-8006-1570
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명의 뉴로-논리 강화학습 최적화 방법은 뉴로-논리 강화학습 모델을 사용하여 학습하되, 미리 정의된 구문 템플릿에 따라 생성되는 서술자와 객체 상수들의 조합으로 생성되는 환경에 존재할 수 있는 상태 및 행동들의 집합인 상태-행동 공간과 에이전트가 선택할 수 있는 정책 공간을 의미적 제약에 위배되는 값들을 제거하여 상태-행동 공간과 정책 공간을 최적화한 후 학습을 효과적으로 수행할 수 있다.
Int. CL G06N 3/08 (2006.01.01) G06N 3/04 (2006.01.01) G06N 5/04 (2006.01.01)
CPC G06N 3/08(2013.01) G06N 3/0472(2013.01) G06N 5/04(2013.01)
출원번호/일자 1020210163383 (2021.11.24)
출원인 경기대학교 산학협력단
등록번호/일자 10-2454700-0000 (2022.10.11)
공개번호/일자
공고번호/일자 (20221013) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.11.24)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 경기대학교 산학협력단 대한민국 경기도 수원시 영통구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김인철 경기도 수원시 영통구
2 이석준 경기도 수원시 영통구
3 강민교 경기도 수원시 영통구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 신지 대한민국 서울특별시 강남구 테헤란로*길 **, *층 ***호실(역삼동, 청원빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 경기대학교 산학협력단 경기도 수원시 영통구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.11.24 수리 (Accepted) 1-1-2021-1357673-10
2 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2021.12.16 수리 (Accepted) 1-1-2021-1462432-65
3 [우선심사신청]심사청구서·우선심사신청서
2022.05.23 수리 (Accepted) 1-1-2022-0540848-63
4 예비심사결과통지서
2022.06.13 발송처리완료 (Completion of Transmission) 9-5-2022-0430294-13
5 [참고자료]정보제출서
[Reference] Written Submission of Information
2022.06.22 수리 (Accepted) 1-1-2022-0654404-01
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2022.06.22 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2022-0654405-46
7 [출원서 등 보완]보정서
2022.06.22 수리 (Accepted) 1-1-2022-0654168-19
8 [공지예외적용 보완 증명서류]서류제출서
2022.06.22 수리 (Accepted) 1-1-2022-0654395-77
9 면담 결과 기록서
2022.06.22 발송처리완료 (Completion of Transmission) 9-6-2022-0109776-45
10 등록결정서
Decision to grant
2022.07.11 발송처리완료 (Completion of Transmission) 9-5-2022-0512113-70
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
각 단계가 컴퓨팅 장치의 프로세서에서 실행되는 프로그램 명령어로 구현되어 프로세서에서 실행되는 뉴로-논리 강화학습(Neural Logic Reinforcement Learning, NLRL) 최적화 방법에 있어서,서술자와 객체 상수를 조합한 구체화된 서술자들의 집합인 상태-행동 공간을 설정하는 단계;미리 정의되며 결론부(head)와 조건부(body)로 구성되는 구문 템플릿에 따라 서술자와 객체 변수를 조합하여 생성된 규칙과 객체 상수를 조합한 구체화된 규칙들의 집합인 정책 공간을 설정하는 단계;시맨틱 웹 표준 언어로 정의된 의미적 제약들로 구성되는 온톨로지를 지식 베이스에 삽입하는 단계;상태-행동 공간에 속하는 구체화된 서술자들에 대하여 지식 베이스를 대상으로 추론하여 의미적 제약에 위배되는 서술자들을 제거하여 상태-행동 공간을 최적화하는 단계;정책 공간에 속하는 구체화된 규칙들에 대하여 지식 베이스를 대상으로 추론하여 의미적 제약에 위배되는 규칙들을 제거하여 정책 공간을 최적화하는 단계; 및최적화된 상태-행동 공간과 최적화된 정책 공간에 기초하여 뉴로-논리 강화학습(NLRL)을 수행하는 단계;를 포함하는 뉴로-논리 강화학습(NLRL) 최적화 방법
2 2
제 1 항에 있어서, 상태-행동 공간을 최적화하는 단계는 :추론되지 않은 구체화된 서술자를 상태-행동 공간에서 선택하는 단계;선택된 구체화된 서술자를 지식 베이스에 삽입하는 단계;지식 베이스를 대상으로 추론을 수행하여 추론 실패 시 선택된 구체화된 서술자를 상태-행동 공간에서 제거하는 단계; 및지식 베이스를 상기 온톨로지로 초기화하는 단계;를 포함하여 상태-행동 공간에 추론되지 않은 구체화된 서술자가 없을 때까지 각 단계를 반복하여 수행하는 뉴로-논리 강화학습(NLRL) 최적화 방법
3 3
제 2 항에 있어서, 정책 공간을 최적화하는 단계는 :추론되지 않은 구체화된 규칙을 정책 공간에서 선택하는 단계;선택된 구체화된 규칙의 조건부의 서술자들을 지식 베이스에 삽입하는 단계;지식 베이스를 대상으로 추론을 수행하여 추론 실패 시 선택된 구체화된 규칙을 정책 공간에서 제거하는 단계;추론 성공 시 선택된 구체화된 규칙의 결론부의 서술자를 지식 베이스에 삽입하는 단계;지식 베이스를 대상으로 추론을 수행하여 추론 실패 시 선택된 구체화된 규칙을 정책 공간에서 제거하는 단계;지식 베이스를 상기 온톨로지로 초기화하는 단계;를 포함하여 정책 공간에 추론되지 않은 구체화된 규칙이 없을 때까지 각 단계를 반복하여 수행하는 뉴로-논리 강화학습(NLRL) 최적화 방법
4 4
제 1 항에 있어서, 상태-행동 공간을 설정하는 단계는 :객체의 상태에 대하여 정의된 모든 상태 서술자들과 객체 상수를 조합하여 상태 서술자 집합을 생성하는 단계;객체를 대상으로 하는 행동에 대하여 정의된 모든 행동 서술자들과 객체 상수를 조합하여 행동 서술자 집합을 생성하는 단계;상태 서술자 집합과 행동 서술자 집합을 결합하여 상태-행동 공간을 설정하는 단계;를 포함하는 뉴로-논리 강화학습(NLRL) 최적화 방법
5 5
제 1 항에 있어서, 정책 공간을 설정하는 단계는 :구문 템플릿을 따라 서술자와 객체 변수들을 조합하여 제1 규칙 집합을 생성하는 단계;제1 규칙 집합에 속하는 규칙들과 객체 상수를 조합하여 정책 공간을 설정하는 단계;를 포함하는 뉴로-논리 강화학습(NLRL) 최적화 방법
6 6
제 1 항에 있어서,의미적 제약은 클래스 유형, 정의역(domain)과 치역(range), 대칭 성질, 비대칭 성질, 역 성질(inverse), 이행 성질(transitive)을 포함하는 제약들의 조합으로 정의되는 뉴로-논리 강화학습(NLRL) 최적화 방법
7 7
각 단계가 컴퓨팅 장치의 프로세서에서 실행되는 프로그램 명령어로 구현되어 프로세서에서 실행되는 뉴로-논리 강화학습(Neural Logic Reinforcement Learning, NLRL) 최적화 방법에 있어서,서술자와 객체 상수를 조합한 구체화된 서술자들의 집합인 상태-행동 공간을 설정하는 단계;미리 정의되며 결론부(head)와 조건부(body)로 구성되는 구문 템플릿에 따라 서술자와 객체 변수를 조합하여 생성한 규칙들의 규칙 집합을 생성하는 단계;시맨틱 웹 표준 언어로 정의된 의미적 제약들로 구성되는 온톨로지를 지식 베이스에 삽입하는 단계;상태-행동 공간에 속하는 구체화된 서술자들에 대하여 지식 베이스를 대상으로 추론하여 의미적 제약에 위배되는 서술자들을 제거하여 상태-행동 공간을 최적화하는 단계;규칙 집합에 속하는 규칙들에 대하여 지식 베이스를 대상으로 추론하여 의미적 제약에 위배되는 규칙들을 제거하여 규칙 집합을 최적화하는 단계;최적화된 상태-행동 공간에 속하는 구체화된 서술자와 최적화된 규칙 집합의 조건부를 조합하여 최적화된 정책 공간을 생성하는 단계; 및최적화된 상태-행동 공간과 최적화된 정책 공간에 기초하여 뉴로-논리 강화학습(NLRL)을 수행하는 단계;를 포함하는 뉴로-논리 강화학습(NLRL) 최적화 방법
8 8
제 7 항에 있어서, 상태-행동 공간을 최적화하는 단계는 :추론되지 않은 구체화된 서술자를 상태-행동 공간에서 선택하는 단계;선택된 구체화된 서술자를 지식 베이스에 삽입하는 단계;지식 베이스를 대상으로 추론을 수행하여 추론 실패 시 선택된 구체화된 서술자를 상태-행동 공간에서 제거하는 단계지식 베이스를 상기 온톨로지로 초기화하는 단계;를 포함하여 상태-행동 공간에 추론되지 않은 구체화된 서술자가 없을 때까지 각 단계를 반복하여 수행하는 뉴로-논리 강화학습(NLRL) 최적화 방법
9 9
제 8 항에 있어서, 규칙 집합을 최적화하는 단계는 :추론되지 않은 규칙을 규칙 집합에서 선택하는 단계;선택된 규칙의 조건부의 서술자들을 지식 베이스에 삽입하는 단계;지식 베이스를 대상으로 추론을 수행하여 추론 실패 시 선택된 규칙을 규칙 집합에서 제거하는 단계;추론 성공 시 선택된 규칙의 결론부의 서술자를 지식 베이스에 삽입하는 단계;지식 베이스를 대상으로 추론을 수행하여 추론 실패 시 선택된 규칙을 규칙 집합에서 제거하는 단계;지식 베이스를 상기 온톨로지로 초기화하는 단계;를 포함하여 규칙 집합에 추론되지 않은 규칙이 없을 때까지 각 단계를 반복하여 수행하는 뉴로-논리 강화학습(NLRL) 최적화 방법
10 10
제 7 항에 있어서, 상태-행동 공간을 설정하는 단계는 :객체의 상태에 대하여 정의된 모든 상태 서술자들과 객체 상수를 조합하여 상태 서술자 집합을 생성하는 단계;객체를 대상으로 하는 행동에 대하여 정의된 모든 행동 서술자들과 객체 상수를 조합하여 행동 서술자 집합을 생성하는 단계;상태 서술자 집합과 행동 서술자 집합을 결합하여 상태-행동 공간을 설정하는 단계;를 포함하는 뉴로-논리 강화학습(NLRL) 최적화 방법
11 11
제 7 항에 있어서,의미적 제약은 클래스 유형, 정의역(domain)과 치역(range), 대칭 성질, 비대칭 성질, 역 성질(inverse), 이행 성질(transitive)을 포함하는 제약들의 조합으로 정의되는 뉴로-논리 강화학습(NLRL) 최적화 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술연구원(KIST) 클라우드로봇복합인공지능기술개발(R&D) 클라우드에 연결된 개별 로봇 및 로봇그룹의 작업 계획 기술 개발
2 과학기술정보통신부 인하대학교 산학협력단 정보통신방송혁신인재양성(R&D) 인공지능을 활용한 콘텐츠 창작 기술