기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

강화학습을 이용한 입고물품의 적치순서 최적화 방법

기술번호 : KST2022017710
담당센터 : 서울동부기술혁신센터
전화번호 : 02-2155-3662

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명은 강화학습(Reinforcement Learning) 머신러닝(machine Learning) 기술을 이용하여 컨테이너 부두, 강재 적치장 등과 같이 적치 및 반출 효율이 중요한 곳에서 크레인의 이동을 최소화하기 위한 강화학습을 이용한 입고물품의 적치순서 최적화 방법에 관한 것이다. 또한, 본 발명은 선별작업이 요구되는 종래기술의 조선소의 강재 적치방법의 문제점을 해결하기 위한 것이다. 이를 위해, 본 발명은, 강화학습 문제의 상태를 각 강재의 계획된 반출일까지의 남은 시간을 포함하도록 정의하고, 빠른 반출일을 가지는 강재가 파일의 위쪽에 적치되는 경우에 보상이 더 큰 값을 가지도록 설정하여 투입일정에 따라 강재가 정렬되는 방식으로 에이전트의 학습이 이루어지도록 구성된다. 따라서 본 발명에 따르면, 강재의 가공일정을 고려하여 입고된 강재의 적치파일을 결정하는 것에 의해 선별작업을 최소화하는 적치계획을 수행할 수 있으므로, 크레인의 사용을 최소화하고 전체적인 작업시간 및 비용을 절감하여 생산성 향상에 기여할 수 있다.
Int. CL	G06Q 10/04 (2012.01.01) G06Q 10/08 (2012.01.01) G06N 20/00 (2019.01.01) G06N 3/08 (2006.01.01)
CPC	G06Q 10/043(2013.01) G06Q 10/087(2013.01) G06Q 10/0633(2013.01) G06N 20/00(2013.01) G06N 3/08(2013.01)
출원번호/일자	1020210032819 (2021.03.12)
출원인	서울대학교산학협력단
등록번호/일자
공개번호/일자	10-2022-0128142 (2022.09.20) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	공개
심사진행상태	수리
심판사항
구분	국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2021.03.12)
심사청구항수	11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	서울대학교산학협력단	대한민국	서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	우종훈		서울특별시 강남구
2	조영인		경기도 파주시 후곡로 *,

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	김정수	대한민국	서울시 송파구 올림픽로 **(방이동) 층(이수국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
최종권리자 정보가 없습니다

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2021.03.12	수리 (Accepted)	1-1-2021-0296036-69
2	특허고객번호 정보변경(경정)신고서·정정신고서	2021.07.29	수리 (Accepted)	4-1-2021-5205564-29
3	특허고객번호 정보변경(경정)신고서·정정신고서	2022.04.04	수리 (Accepted)	4-1-2022-5079741-71
4	선행기술조사의뢰서 Request for Prior Art Search	2022.06.15	수리 (Accepted)	9-1-9999-9999999-89
5	특허고객번호 정보변경(경정)신고서·정정신고서	2022.08.11	수리 (Accepted)	4-1-2022-5189083-38

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 강화학습(Reinforcement Learning)을 이용한 입고물품의 적치순서 최적화 방법에 있어서, 미리 정의된 강화학습 알고리즘을 이용하여, 에이전트(agent)와 환경(environment)의 상호작용을 통해 물품의 적치계획에 대한 학습을 행하여 상기 물품의 적치순서를 최적화 하기 위한 에이전트(agent) 모델을 구축하는 처리가 수행되는 학습단계; 및 상기 학습단계에서 구축된 상기 에이전트 모델을 상기 물품의 적치문제에 적용하여 적치계획을 수립하고, 수립된 상기 적치계획에 따라 입고되는 물품을 적치하는 처리가 수행되는 적용단계를 포함하는 처리가 전용의 하드웨어 또는 컴퓨터를 통해 실행되도록 구성되는 것을 특징으로 하는 강화학습을 이용한 입고물품의 적치순서 최적화 방법
2	2 제 1항에 있어서, 상기 학습단계는, 상기 에이전트의 행동(Action)에 따라 상기 환경으로부터 피드백되는 상태(State)와 보상(Reward)에 근거하여 상기 에이전트의 인공신경망(neural network)의 가중치를 업데이트하는 마르코프 결정과정(Markov decision process ; MDP)에 기반한 강화학습 알고리즘에 따라 학습이 이루어지는 처리가 수행되며, 상기 상태는 상기 에이전트가 행동을 결정하는 시점에서의 상기 물품의 입고현황과 적치현황으로 정의되고, 상기 행동(Action)은 입고된 상기 물품을 적치할 위치를 결정하는 것으로 정의되며, 상기 보상(Reward)은 크레인을 포함하는 상기 물품의 이송수단에 대한 사용횟수를 기준으로 정의되는 것을 특징으로 하는 강화학습을 이용한 입고물품의 적치순서 최적화 방법
3	3 제 2항에 있어서, 상기 학습단계에서, 상기 입고현황은 적치될 위치가 아직 결정되지 않은 채로 대기하고 있는 물품에 대한 정보이고, 상기 적치현황은 이미 적치장에 적치되어 있는 물품에 대한 정보로 구성되는 것을 특징으로 하는 강화학습을 이용한 입고물품의 적치순서 최적화 방법
4	4 제 3항에 있어서, 상기 학습단계에서, 상기 물품에 대한 정보는, 각각의 물품마다 계획된 작업공정 투입일 또는 반출일까지의 남은 시간 또는 일자를 의미하는 잔여기간에 대한 정보를 포함하여 구성되는 것을 특징으로 하는 강화학습을 이용한 입고물품의 적치순서 최적화 방법
5	5 제 4항에 있어서, 상기 학습단계는, 상기 에이전트에 의해 선택된 위치에 처음으로 상기 물품이 적치되는 경우 상기 보상이 미리 정해진 제 1 값으로 설정되고, 상기 에이전트에 의해 선택된 위치에 상기 물품을 적치하였을 때 상기 에이전트에 의해 선택된 위치에 적치된 물품들이 하단부터 차례대로 상기 잔여기간이 긴 순서대로 정렬되어 있지 않은 경우 상기 보상이 미리 정해진 제 2 값으로 설정되며, 상기 에이전트에 의해 선택된 위치에 상기 물품을 적치하였을 때 상기 에이전트에 의해 선택된 위치에 적치된 물품들이 하단부터 차례대로 상기 잔여기간이 긴 순서대로 정렬된 경우 상기 보상이 미리 정해진 제 3 값으로 설정되도록 하는 처리가 수행되도록 구성되는 것을 특징으로 하는 강화학습을 이용한 입고물품의 적치순서 최적화 방법
6	6 제 5항에 있어서, 상기 학습단계에서, 상기 제 1 값은 상기 제 2 값보다 작고, 상기 제 2 값은 상기 제 3 값보다 작게(제 1 값 003c# 제 2 값 003c# 제 3 값) 설정되는 것을 특징으로 하는 강화학습을 이용한 입고물품의 적치순서 최적화 방법
7	7 제 6항에 있어서, 상기 학습단계에서, 상기 제 2 값은 상기 에이전트에 의해 선택된 위치에 적치된 물품을 반출하기 위해 사용되는 크레인의 최대 사용횟수에 근거하여 결정되는 것을 특징으로 하는 강화학습을 이용한 입고물품의 적치순서 최적화 방법
8	8 제 7항에 있어서, 상기 제 2 값은, 상기 에이전트에 의해 선택된 위치에 적치되어 있는 각각의 물품에 대하여 해당 물품보다 위쪽에 적치되어 있는 물품들 중 해당 물품보다 상기 잔여기간이 긴 물품의 수를 각각 계산하고, 계산된 값들 중 최대값을 구하여 상기 최대값의 역수로 설정되는 것을 특징으로 하는 강화학습을 이용한 입고물품의 적치순서 최적화 방법
9	9 제 1항에 있어서, 상기 강화학습 알고리즘은, A3C(Asynchronous Advantage Actor-Critic) 알고리즘을 이용하여 구성되는 것을 특징으로 하는 강화학습을 이용한 입고물품의 적치순서 최적화 방법
10	10 청구항 1항 내지 청구항 9항 중 어느 한 항에 기재된 강화학습을 이용한 입고물품의 적치순서 최적화 방법을 컴퓨터나 전용의 하드웨어에 실행시키도록 구성되는 프로그램이 기록된 컴퓨터에서 판독 가능한 기록매체
11	11 물품 적치 시스템에 있어서, 청구항 1항 내지 청구항 9항 중 어느 한 항에 기재된 강화학습을 이용한 입고물품의 적치순서 최적화 방법을 이용하여 입고되는 물품의 적치계획을 수립하는 적치계획 수립부; 및 크레인을 포함하는 이송수단을 포함하여, 상기 적치계획 수립부에 의해 수립된 적치계획에 따라 상기 물품의 적치를 수행하도록 이루어지는 물품이송부를 포함하여 구성되는 것을 특징으로 하는 물품 적치 시스템

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2021.03.12	수리 (Accepted)	1-1-2021-0296036-69
2	특허고객번호 정보변경(경정)신고서·정정신고서	2021.07.29	수리 (Accepted)	4-1-2021-5205564-29
3	특허고객번호 정보변경(경정)신고서·정정신고서	2022.04.04	수리 (Accepted)	4-1-2022-5079741-71
4	선행기술조사의뢰서	2022.06.15	수리 (Accepted)	9-1-9999-9999999-89
5	특허고객번호 정보변경(경정)신고서·정정신고서	2022.08.11	수리 (Accepted)	4-1-2022-5189083-38

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2020011193][서울대학교]	원단의 불량 위치 자동 검출 방법 및 이를 위한 시스템	새창보기
[KST2020017350][서울대학교]	순환형 3차원 완전 합성곱망을 활용한 초분광영상의 변화탐지 방법	새창보기
[KST2020014559][서울대학교]	유동 인구 판단 시스템 및 제어 방법	새창보기
[KST2019011607][서울대학교]	멀티 모달리티 데이터 복원을 위한 심층 개념망 구축 방법 및 그 시스템	새창보기
[KST2015158890][서울대학교]	ｎｃＲＮＡ 서열의 컴퓨터적 동정 방법	새창보기
[KST2015160946][서울대학교]	다기준 의사결정기법을 이용한 대안평가지수 산정방법	새창보기
[KST2023002151][서울대학교]	뉴럴 렌더링을 위한 저정밀도 하드웨어 가속기 및 그 동작 방법	새창보기
[KST2021007455][서울대학교]	사용자 상태에 기반한 응답 음성을 생성하는 음성 에이전트 시스템 및 방법	새창보기
[KST2024000097][서울대학교]	차량의 충돌안전 제어로직의 작동원인을 분석하는 시스템 및 그의 동작 방법	새창보기
[KST2022008751][서울대학교]	관절염 진단 장치 및 관절염 진단 방법, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램	새창보기
[KST2020013124][서울대학교]	DNN 프레임워크를 이용하는 단일 가속기용 프로그램을 복수의 가속기에서 처리하는 방법 및 컴퓨터 프로그램	새창보기
[KST2024000063][서울대학교]	소화 기관의 3차원 맵을 생성하는 방법 및 상기 방법을 수행하는 3차원 맵 생성 장치	새창보기
[KST2023002025][서울대학교]	미디어 스트리밍 처리 장치 및 방법	새창보기
[KST2015159108][서울대학교]	전자거래코드를 이용한 공급체인 관리 시스템 및 방법	새창보기
[KST2022022180][서울대학교]	비정상 단말을 포함하는 무선 분산 학습 시스템 및 그의 동작 방법	새창보기
[KST2020000969][서울대학교]	기흉 검출 방법 및 시스템	새창보기
[KST2021001623][서울대학교]	기흉 검출 방법 및 시스템	새창보기
[KST2023010710][서울대학교]	복셀 기반 방사선 선량 평가 방법 및 장치	새창보기
[KST2022002930][서울대학교]	소화 기관의 3차원 맵을 생성하는 방법 및 상기 방법을 수행하는 3차원 맵 생성 장치	새창보기
[KST2022007282][서울대학교]	발화 스타일 인코딩 네트워크 이용한 스타일 음성 합성 장치 및 음성 합성 방법	새창보기
[KST2021010204][서울대학교]	AI를 이용한 일회박출량 산출 장치 및 방법	새창보기
[KST2023008664][서울대학교]	라이다 센서 모듈을 이용한 수변 공간의 보행자 관리 방법	새창보기
[KST2018011958][서울대학교]	구동기 능력을 고려한 안전 비행 운송 시스템 및 실시간 경로 계획 방법	새창보기
[KST2019021868][서울대학교]	출석 확인 시스템 및 방법	새창보기
[KST2019020950][서울대학교]	딥-러닝을 통한 무선신호 전파 채널 해석을 이용한 실내공간의 구조를 예측하는 방법	새창보기
[KST2023002161][서울대학교]	강화 학습을 사용한 UAV BS 기반의 통신 방법 및 이러한 방법을 수행하는 장치	새창보기
[KST2024000128][서울대학교]	기능적 분석 장치 및 방법	새창보기
[KST2022012950][서울대학교]	사운드 기반 다중 기기 운영 모니터링 방법과 이를 위한 시스템	새창보기
[KST2022002049][서울대학교]	동형 암호에서 오차 분산에 기초한 암호화 방법 및 장치	새창보기
[KST2023001967][서울대학교]	합성곱 신경망을 위한 부동소수점 압축이 포함된 캐시	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택

기술이전 상담신청 드립니다.
기업명
신청자 성명		직책
연락처	- -
이메일	@
상담희망전담센터	※ 사업장(본점) 소재지가 속한 지역의 기술혁신센터를 지정해주세요.