기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

행동 결정 장치 및 방법, 컴퓨터 판독 가능한 저장 매체

기술번호 : KST2018010943
담당센터 : 경기기술혁신센터
전화번호 : 031-8006-1570

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	프로세서에 의해 수행되는, NFQ (Neural Fitted Q-Iteration) 기반의 강화 학습에 따른 행동 결정 방법이 제공된다. 방법은, 복수의 상태 전이 샘플 데이터를 기반으로, 현재 상태 (state) 및 행동 (action) 을 입력으로 가지고 행동에 따른 Q 값을 출력으로 가지는 Q 값 함수를 인공 신경망에 훈련시키는 단계와, Q 값 함수를 기반으로 소정 상태에서의 복수의 행동들에 따른 Q 값을 각각 산출하는 단계, 그리고 복수의 행동들 중 Q 값이 가장 큰 행동을 다음 행동으로 결정하는 단계를 포함할 수 있고, 훈련시키는 단계는 학습 대상인 샘플 데이터의 시퀀스의 길이를 기반으로 다음 상태로의 전이 비용 (transition cost) 을 결정할 수 있다. 따라서, 인공 신경망이 보다 빠르게 수렴될 수 있고, 더 정확한 결과 값을 산출할 수 있다.
Int. CL	G06N 3/08 (2006.01.01)
CPC	G06N 3/08(2013.01) G06N 3/08(2013.01)
출원번호/일자	1020170014504 (2017.02.01)
출원인	성균관대학교산학협력단
등록번호/일자
공개번호/일자	10-2018-0089769 (2018.08.09) 문서열기
공고번호/일자	문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	등록
심사진행상태	수리
심판사항
구분	신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2017.02.01)
심사청구항수	15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	성균관대학교산학협력단	대한민국	경기도 수원시 장안구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	세르게이	대한민국	경기도 수원시 장안구
2	이세희	대한민국	경기도 수원시 장안구
3	이지형	대한민국	서울특별시 용산구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	인비전 특허법인	대한민국	서울특별시 강남구 테헤란로 길, *층(대치동, 동산빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
1	성균관대학교산학협력단	대한민국	경기도 수원시 장안구

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2017.02.01	수리 (Accepted)	1-1-2017-0107951-16
2	출원인정보변경(경정)신고서 Notification of change of applicant's information	2017.02.23	수리 (Accepted)	4-1-2017-5028829-43
3	선행기술조사의뢰서 Request for Prior Art Search	2018.07.12	수리 (Accepted)	9-1-9999-9999999-89
4	심사처리보류(연기)보고서 Report of Deferment (Postponement) of Processing of Examination	2018.08.17	발송처리완료 (Completion of Transmission)	9-6-2018-0103172-11
5	선행기술조사보고서 Report of Prior Art Search	2018.08.27	수리 (Accepted)	9-1-2018-0043089-72
6	의견제출통지서 Notification of reason for refusal	2018.09.17	발송처리완료 (Completion of Transmission)	9-5-2018-0636844-73
7	[명세서등 보정]보정서 [Amendment to Description, etc.] Amendment	2018.11.19	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2018-1151466-18
8	[공지예외적용대상(신규성, 출원시의 특례)증명서류]서류제출서 [Document Verifying Exclusion from Being Publically Known (Novelty, Special Provisions for Application)] Submission of Document	2018.11.19	수리 (Accepted)	1-1-2018-1151386-53
9	[출원서 등 보정(보완)]보정서	2018.11.19	수리 (Accepted)	1-1-2018-1151322-42
10	[거절이유 등 통지에 따른 의견]의견(답변, 소명)서 [Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)	2018.11.19	수리 (Accepted)	1-1-2018-1151465-62
11	등록결정서 Decision to grant	2018.12.14	발송처리완료 (Completion of Transmission)	9-5-2018-0862571-04
12	[명세서등 보정]보정서(심사관 직권보정)	2019.03.16	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2019-5007528-01

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 프로세서에 의해 수행되는, NFQ (Neural Fitted Q-Iteration) 기반의 강화 학습에 따른 행동 결정 방법으로서, 복수의 상태 전이 샘플 데이터를 기반으로, 현재 상태 (state) 및 행동 (action) 을 입력으로 가지고 상기 행동에 따른 Q 값을 출력으로 가지는 Q 값 함수를 인공 신경망에 훈련시키는 단계; 상기 Q 값 함수를 기반으로 소정 상태에서의 복수의 행동들에 따른 Q 값을 각각 산출하는 단계; 및상기 복수의 행동들 중 Q 값이 가장 큰 행동을 다음 행동으로 결정하는 단계를 포함하고, 상기 훈련시키는 단계는 학습 대상인 샘플 데이터의 시퀀스의 길이를 기반으로 다음 상태로의 전이 비용 (transition cost) 을 결정하는 것을 포함하고, 상기 전이 비용은 학습 대상인 샘플 데이터의 시퀀스의 길이 및 상기 시퀀스의 최종 상태 보상을 기반으로 결정되며, 상기 전이 비용은 학습 대상인 샘플 데이터의 시퀀스의 최종 상태 보상을 상기 시퀀스의 길이로 나눈 값에서 1 을 뺀 값으로 결정되는, 강화 학습에 따른 행동 결정 방법
2	2 제 1 항에 있어서, 상기 훈련시키는 단계는, 다음 상태가 최종 상태일 경우, 다음 상태의 보상 (Reward) 을 상기 Q 값으로 설정하는 것을 포함하는, 강화 학습에 따른 행동 결정 방법
3	3 제 1 항에 있어서, 상기 훈련시키는 단계는, 다음 상태가 최종 상태가 아닐 경우, 다음 상태로의 전이 비용 및 다음 상태의 최대 Q 값을 기반으로 상기 Q 값을 설정하는 것을 포함하는, 강화 학습에 따른 행동 결정 방법
4	4 제 1 항에 있어서, 상기 훈련시키는 단계는, 다음 상태가 최종 상태가 아닐 경우, 다음 상태로의 전이 비용과 디스카운트된 다음 상태의 최대 Q 값의 합을 상기 Q 값으로 설정하는 것을 포함하는, 강화 학습에 따른 행동 결정 방법
5	5 삭제
6	6 삭제
7	7 제 1 항에 있어서, 상기 최종 상태 보상은 정규화 (Normalize) 된 값인, 강화 학습에 따른 행동 결정 방법
8	8 제 1 항에 있어서, 상기 현재 상태는 현재까지 수행된 활동들을 나타내는, 강화 학습에 따른 행동 결정 방법
9	9 제 1 항에 있어서, 상기 행동은 현재 수행하고자 하는 활동을 나타내는, 강화 학습에 따른 행동 결정 방법
10	10 NFQ (Neural Fitted Q-Iteration) 기반의 강화 학습에 따른 행동 결정 장치로서, 상기 장치는 프로세서를 포함하고, 상기 프로세서는, 복수의 상태 전이 샘플 데이터를 기반으로, 현재 상태 (state) 및 행동 (action) 을 입력으로 가지고 상기 행동에 따른 Q 값을 출력으로 가지는 Q 값 함수를 인공 신경망에 훈련시키는 것; 상기 Q 값 함수를 기반으로 소정 상태에서의 복수의 행동들에 따른 Q 값을 각각 산출하는 것; 및상기 복수의 행동들 중 Q 값이 가장 큰 행동을 다음 행동으로 결정하는 것을 수행하도록 구성되고, 상기 훈련시키는 것은 학습 대상인 샘플 데이터의 시퀀스의 길이를 기반으로 다음 상태로의 전이 비용 (transition cost) 을 결정하는 것을 포함하고, 상기 전이 비용은 학습 대상인 샘플 데이터의 시퀀스의 길이 및 상기 시퀀스의 최종 상태 보상을 기반으로 결정되며, 상기 전이 비용은 학습 대상인 샘플 데이터의 시퀀스의 최종 상태 보상을 상기 시퀀스의 길이로 나눈 값에서 1 을 뺀 값으로 결정되는, 강화 학습에 따른 행동 결정 장치
11	11 제 10 항에 있어서, 상기 훈련시키는 것은, 다음 상태가 최종 상태일 경우, 다음 상태의 보상 (Reward) 을 상기 Q 값으로 설정하는 것을 포함하는, 강화 학습에 따른 행동 결정 장치
12	12 제 10 항에 있어서, 상기 훈련시키는 것은, 다음 상태가 최종 상태가 아닐 경우, 다음 상태로의 전이 비용 및 다음 상태의 최대 Q 값을 기반으로 상기 Q 값을 설정하는 것을 포함하는, 강화 학습에 따른 행동 결정 장치
13	13 제 10 항에 있어서, 상기 훈련시키는 것은, 다음 상태가 최종 상태가 아닐 경우, 다음 상태로의 전이 비용과 디스카운트된 다음 상태의 최대 Q 값의 합을 상기 Q 값으로 설정하는 것을 포함하는, 강화 학습에 따른 행동 결정 장치
14	14 삭제
15	15 삭제
16	16 제 10 항에 있어서, 상기 최종 상태 보상은 정규화 (Normalize) 된 값인, 강화 학습에 따른 행동 결정 장치
17	17 제 10 항에 있어서, 상기 현재 상태는 현재까지 수행된 활동들을 나타내는, 강화 학습에 따른 행동 결정 장치
18	18 제 10 항에 있어서, 상기 행동은 현재 수행하고자 하는 활동을 나타내는, 강화 학습에 따른 행동 결정 장치
19	19 컴퓨터 판독 가능한 저장 매체로서, NFQ (Neural Fitted Q-Iteration) 기반의 강화 학습에 따른 행동 결정을 수행하게 하기 위해, 상기 컴퓨터에 포함된 프로세서로 하여금, 복수의 상태 전이 샘플 데이터를 기반으로, 현재 상태 (state) 및 행동 (action) 을 입력으로 가지고 상기 행동에 따른 Q 값을 출력으로 가지는 Q 값 함수를 인공 신경망에 훈련시키도록 하기 위한 명령어; 상기 Q 값 함수를 기반으로 소정 상태에서의 복수의 행동들에 따른 Q 값을 각각 산출하도록 하기 위한 명령어; 및상기 복수의 행동들 중 Q 값이 가장 큰 행동을 다음 행동으로 결정하도록 하기 위한 명령어를 저장하고, 상기 훈련시키도록 하기 위한 명령어에는 학습 대상인 샘플 데이터의 시퀀스의 길이를 기반으로 다음 상태로의 전이 비용 (transition cost) 을 결정하는 명령어를 포함하고, 상기 전이 비용은 학습 대상인 샘플 데이터의 시퀀스의 길이 및 상기 시퀀스의 최종 상태 보상을 기반으로 결정되며, 상기 전이 비용은 학습 대상인 샘플 데이터의 시퀀스의 최종 상태 보상을 상기 시퀀스의 길이로 나눈 값에서 1 을 뺀 값으로 결정되는, 컴퓨터 판독 가능한 저장 매체

순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번	연구부처	주관기관	연구사업	연구과제
1	문화체육관광부	한국전자통신연구원	2016년 문화기술 연구개발 지원사업	지능형 라이브 서비스를 위한 게임 운영 시나리오 최적화 플랫폼 기술 개발
2	미래창조과학부	성균관대학교(자연과학캠퍼스)	차세대정보·컴퓨팅기술개발사업	의미 분석을 통한 연구내용 기반 상시 모니터링 시스템 개발

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2017.02.01	수리 (Accepted)	1-1-2017-0107951-16
2	출원인정보변경(경정)신고서	2017.02.23	수리 (Accepted)	4-1-2017-5028829-43
3	선행기술조사의뢰서	2018.07.12	수리 (Accepted)	9-1-9999-9999999-89
4	심사처리보류(연기)보고서	2018.08.17	발송처리완료 (Completion of Transmission)	9-6-2018-0103172-11
5	선행기술조사보고서	2018.08.27	수리 (Accepted)	9-1-2018-0043089-72
6	의견제출통지서	2018.09.17	발송처리완료 (Completion of Transmission)	9-5-2018-0636844-73
7	[명세서등 보정]보정서	2018.11.19	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2018-1151466-18
8	[공지예외적용대상(신규성, 출원시의 특례)증명서류]서류제출서	2018.11.19	수리 (Accepted)	1-1-2018-1151386-53
9	[출원서 등 보정(보완)]보정서	2018.11.19	수리 (Accepted)	1-1-2018-1151322-42
10	[거절이유 등 통지에 따른 의견]의견(답변, 소명)서	2018.11.19	수리 (Accepted)	1-1-2018-1151465-62
11	등록결정서	2018.12.14	발송처리완료 (Completion of Transmission)	9-5-2018-0862571-04
12	[명세서등 보정]보정서(심사관 직권보정)	2019.03.16	보정승인간주 (Regarded as an acceptance of amendment)	1-1-2019-5007528-01

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2024000278][성균관대학교]	D2D 기반의 무선 전력 송수신 장치 및 방법	새창보기
[KST2022005923][성균관대학교]	연합학습 모델에서 이상 클라이언트를 제거하는 방법	새창보기
[KST2020002515][성균관대학교]	자동화된 영상 인식 모델 생성과 영상 인식 장치 및 이를 이용한 관리 방법	새창보기
[KST2019023178][성균관대학교]	스마트 디바이스 및 그 메모리 관리 방법	새창보기
[KST2019023210][성균관대학교]	다중 사용자 환경에서 사용자 기반 어플리케이션 그룹핑 방법 및 이를 수행하는 테이블탑 디스플레이 장치	새창보기
[KST2024000283][성균관대학교]	딥러닝 모델을 이용하여 송수신 모드를 결정하는 D2D 기반의 무선 전력 송수신 장치 및 방법	새창보기
[KST2022001501][성균관대학교]	강인한 학습 및 인식을 위한 다단계 딥러닝 방법 및 이를 수행하는 장치	새창보기
[KST2020010303][성균관대학교]	인공지능 학습 기반의 사이클로트론 아킹 방지 시스템	새창보기
[KST2018002813][성균관대학교]	리뷰 데이터의 감성을 분류하기 위한 방법 및 장치(AN APPARATUS FOR ANALYZING SENTIMENT OF REVIEW DATA AND METHOD THEREOF)	새창보기
[KST2024000277][성균관대학교]	D2D 기반의 무선 전력 수신 장치 및 방법	새창보기
[KST2022000364][성균관대학교]	환경 변화에 고속 응답 가능한 인공지능 알고리즘 기반 멀티 디바이스 무선 충전 시스템	새창보기
[KST2023010501][성균관대학교]	단일 딥러닝 모델을 이용하는 색상 양자화 방법 및 장치	새창보기
[KST2019000288][성균관대학교]	딥러닝 기반 FDG 합성장치	새창보기
[KST2023006266][성균관대학교]	음 합성 방법, 음 합성 장치, 음 합성 학습 방법, 음 합성 학습 장치 및 음 합성 방법을 수행하는 컴퓨터 프로그램 및 음 합성 방법을 수행하는 컴퓨터 프로그램이 저장된 기록 매체	새창보기
[KST2022022525][성균관대학교]	경제급전을 위한 발전량 결정 장치 및 방법	새창보기
[KST2020011514][성균관대학교]	인공지능을 이용한 사이클로트론 기반 가속기 질량 분석시스템	새창보기
[KST2023002748][성균관대학교]	기계학습을 사용한 연소기의 연소 모니터링 방법 및 장치	새창보기
[KST2018002812][성균관대학교]	인공 신경망 기반의 문단 생성 방법 및 장치(AN APPARATUS FOR GENERATING PARAGRAPH BASED ON ARTIFICIAL NEURAL NETWORK AND METHOD THEREOF)	새창보기
[KST2023002717][성균관대학교]	논리 질의를 이용한 확률 기반의 설명 가능 아이템 추천 방법 및 그 장치	새창보기
[KST2021003184][성균관대학교]	강화 학습 기반 적응형 변복조를 위한 수신기, 시스템 및 그 방법	새창보기
[KST2021012951][성균관대학교]	포인트 오토인코더, 듀얼 오토인코더, 및 이를 이용한 포인트 클라우드의 차원 변환 방법	새창보기
[KST2023002714][성균관대학교]	레이더 및 메타표면을 이용한 딥러닝 기반의 키포인트 인식 시스템	새창보기
[KST2020016827][성균관대학교]	지능화된 제어기를 가진 직류-직류 변환기	새창보기
[KST2020007639][성균관대학교]	기계학습을 이용한 고해상도 영상의 처리 방법 및 장치	새창보기
[KST2019000290][성균관대학교]	적외선 영상을 이용한 연속적인 피부 상태 측정 방법	새창보기
[KST2022017742][성균관대학교]	온도 분포 측정 방법	새창보기
[KST2022016609][성균관대학교]	반려견 행동 추측 장치 및 그 동작방법	새창보기
[KST2020002190][성균관대학교]	학습 안정화를 위한 생성적 적대 신경망 방법 및 장치	새창보기
[KST2023010351][성균관대학교]	사용자 단말의 이동성 예측을 위한 서버의 동작 방법 및 그 서버	새창보기
[KST2023002786][성균관대학교]	딥러닝 기반 다결정 소재의 결정 구조 및 배향 자동 맵핑법	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택

기술이전 상담신청 드립니다.
기업명
신청자 성명		직책
연락처	- -
이메일	@
상담희망전담센터	※ 사업장(본점) 소재지가 속한 지역의 기술혁신센터를 지정해주세요.