맞춤기술찾기

이전대상기술

머신러닝을 통한 QSAR 모델 구축 웹 기반 연구자 관심 신약후보물질 도출 플랫폼 제공 시스템

  • 기술번호 : KST2021012273
  • 담당센터 : 부산기술혁신센터
  • 전화번호 : 051-606-6561
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 머신러닝을 통한 QSAR 모델 구축 웹 기반 연구자 관심 신약후보물질 도출 플랫폼 제공 시스템에 관한 것으로, 본 발명에 따른 웹 기반 연구자 관심 신약후보물질 도출 플랫폼 제공 시스템은 디스크립터 최적화부(104)를 적용함에 따라서 예측 정확도를 현저히 향상시키는 효과가 있을 뿐만 아니라, 인공지능에 관한 전문지식이 없는 일반 연구자들도 쉽게 사용할 수 있는 효과가 있다.
Int. CL G16C 20/50 (2019.01.01) G16C 20/70 (2019.01.01) G06N 20/00 (2019.01.01)
CPC G16C 20/50(2013.01) G16C 20/70(2013.01) G06N 20/00(2013.01)
출원번호/일자 1020200031386 (2020.03.13)
출원인 경상국립대학교산학협력단
등록번호/일자
공개번호/일자 10-2021-0115506 (2021.09.27) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.03.13)
심사청구항수 21

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 경상국립대학교산학협력단 대한민국 경상남도 진주시

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이근우 경상남도 사천시 사남면

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 위병갑 대한민국 서울특별시 강남구 테헤란로**길 * *층(대영빌딩)(위특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.03.13 수리 (Accepted) 1-1-2020-0268823-49
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.05.11 수리 (Accepted) 4-1-2020-5103872-83
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2021.03.05 수리 (Accepted) 4-1-2021-5079964-11
4 의견제출통지서
Notification of reason for refusal
2021.10.13 발송처리완료 (Completion of Transmission) 9-5-2021-0803719-30
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
내부 또는 외부의 화합물 데이터베이스(database, DB)로부터 화합물 데이터를 수집하여, 가용한 데이터 형태로 파싱하는 데이터 수집부(101);상기 데이터 수집부로부터 출력되는 화합물의 메타데이터로부터 연구자 관심 신약후보물질군 화합물에 대한 데이터를 분석하여 변환하는 데이터 큐레이션부(102);상기 데이터 큐레이션부로부터 전달받은 데이터로부터, 공개된 계산과학 모듈인 파델 디스크립터(PaDEL Descriptor)를 이용하여, 연구자 관심 신약후보물질군 화합물의 분자구조를 해석하여 화합물의 특성을 추출하고 복수의 디스크립터를 생성하기 위한 디스크립터 생성부(103);공개된 기계학습 알고리즘인 사이킷-런(scikit-learn)을 이용하여 상기 생성된 복수의 디스크립터 중에서 최적화된 디스크립터를 1-15개 선별하기 위한 디스크립터 최적화부(104);상기 최적화된 1-15개의 디스크립터들의 가능한 모든 조합을 공개된 기계학습 알고리즘인 사이킷-런(scikit-learn)으로 수행하여 복수의 QSAR(Quantitative Structure-Activity Relationships) 모델을 생성하는 QSAR 모델 생성부(105);상기 복수의 QSAR 모델들에 연구자 관심 신약후보물질군 화합물 데이터 세트를 대입하여, 예측값과 실측값을 확인하여 연구자 관심 신약후보물질을 도출함에 있어 최적의 QSAR 모델을 선별하는 QSAR 모델 선별부(106);상기 최적의 QSAR 모델을 이용하여 상기 디스크립터 생성부(103)에서 얻은 디스크립터 데이터베이스(DB)로부터 연구자 관심 신약후보물질을 도출하는 버츄얼 스크리닝부(107); 및웹(web) 기반 연구자 관심 신약후보물질 도출 시스템을 사용자 단말에서 실행가능한 인터페이스를 제공하고, 상기 사용자 단말에서의 선택 및 설정에 따라 워크플로우를 구성하고, 상기 버츄얼 스크리닝 결과를 출력하기 위한 웹 기반 서비스 제공부(108);를 포함하는,웹 기반 연구자 관심 신약후보물질 도출 플랫폼 제공 시스템
2 2
제1항에 있어서,상기 데이터 수집부(101)에서,내부 화합물 데이터는 한국화학연구원(KRICT)으로부터 어플리케이션 프로그램 인터페이스(API)를 전달 받아 사용하는 것을 특징으로 하는 시스템
3 3
제1항에 있어서,상기 데이터 수집부(101)에서,외부 화합물 데이터는 펍켐(PubChem), 켐블(CheMBL), 드럭뱅크(DrugBank), 티3디비(T3DB), 에이치엠디비(HMDB), 피디비(PDB), 바인딩DB(BindingDB), 티씨엠에스피(TCMSP) 및 씨티디(CTD) 중 1종 이상으로부터 어플리케이션 프로그램 인터페이스(API)를 전달 받아 사용하는 것을 특징으로 하는 시스템
4 4
제1항에 있어서,상기 데이터 큐레이션부(102)는,공개된 계산과학 모듈인 켐액손 제이켐 카트리지(ChemAxon JChem Cartridge)를 이용하여 화합물 데이터를 분석하고 변환하는 것을 특징으로 하는 시스템
5 5
제1항에 있어서,상기 디스크립터 최적화부(104)는,공개된 기계학습 알고리즘인 사이킷-런(scikit-learn)의 하기 군으로 이루어진 파라미터를 사용하여 디스크립터를 최적화하는 것을 특징으로 하는 시스템:결측치 처리 파라미터로서 Mean, Median 또는 Frequency;저분산 처리 파라미터로서 0-1;밀접 상관관계의 임계치 파라미터로서 0-1; 및다변량 특징선택의 파라미터로서 1-20
6 6
제5항에 있어서,상기 디스크립터 최적화부(104)는,머신러닝에 대한 초보 연구자들을 위한 기본 값으로,공개된 기계학습 알고리즘인 사이킷-런(scikit-learn)의 하기 군으로 이루어진 파라미터를 사용하여 디스크립터를 최적화하는 것을 특징으로 하는 시스템:결측치 처리 파라미터로서 Mean;저분산 처리 파라미터로서 0
7 7
제5항에 있어서,상기 디스크립터 최적화를 통해 결측값(missing value)의 처리, 저분산(low variance), 밀접 상관관계(high correlation) 및 단변량 특징선택(Univariate Feature selection)의 구현 안정성을 향상시키는 것을 특징으로 하는 시스템
8 8
제1항에 있어서,상기 QSAR 모델 생성부(105)는,상기 최적화된 디스크립터들의 가능한 모든 조합의 데이터 세트를 트레인 데이터 세트(train data set) 및 테스트 데이터 세트(test data set)로 무작위 분류하되, 이를 각각 8:2의 비율로 분류하고, 상기 트레인 데이터 세트를 이용하여 QSAR 모델을 구축하고, 상기 테스트 데이터 세트를 상기 구축된 QSAR 모델에 적용하여 예측값을 출력한 다음, 실측값과 비교하여 구축된 QSAR 모델의 성능을 검증하는 것을 특징으로 하는 시스템
9 9
제8항에 있어서,상기 QSAR 모델 생성부(105)는 공개된 기계학습 알고리즘인 사이킷-런(scikit-learn)의,sklearn
10 10
제8항에 있어서,상기 QSAR 모델 생성부(105)는 예측값과 실측값을 비교하여 사용자에게 회귀분석의 R2(R-Squared) 값, MSE(mean squared error) 값 및 그래프를 제공하고,상기 그래프는 X축을 실측값으로 하고 Y축을 예측값으로 하는 것을 특징으로 하는 시스템
11 11
제1항의 시스템을 이용하여 연구자 관심 신약후보물질군의 스크리닝 결과를 제공하는 방법
12 12
제11항에 있어서,상기 스크리닝 결과는 csv(Comma-separated values) 파일 형태로 제공받는 것을 특징으로 하는 방법
13 13
제11항에 있어서,상기 스크리닝 결과는 화합물의 smile 데이터 교환 형식(data interchange format) 정보 및 IC50 농도 예측치를 제공하는 것을 특징으로 하는 방법
14 14
제1항의 시스템을 이용하여 내부 또는 외부의 화합물 데이터베이스(database, DB)로부터 연구자 관심 신약후보물질 화합물 리스트를 제공하는 방법
15 15
제1항의 시스템을 이용하여 내부 또는 외부의 화합물 데이터베이스(database, DB)로부터 연구자 관심 신약후보물질 화합물 화학구조식을 제공하는 방법
16 16
제1항의 시스템을 이용하여 내부 또는 외부의 화합물 데이터베이스(database, DB)로부터 연구자 관심 신약후보물질 화합물의 IC50(Half maximal inhibitory concentration) 예측치를 제공하는 방법
17 17
제1항의 시스템을 이용하여 내부 또는 외부의 화합물 데이터베이스(database, DB)로부터 연구자 관심 신약후보물질 화합물의 EC50(Half maximal effective concentration) 예측치를 제공하는 방법
18 18
제1항의 시스템을 이용하여 내부 또는 외부의 화합물 데이터베이스(database, DB)로부터 연구자 관심 신약후보물질 화합물의 GI50(Half maximal growth inhibition concentration) 예측치를 제공하는 방법
19 19
제1항의 시스템을 이용하여 내부 또는 외부의 화합물 데이터베이스(database, DB)로부터 연구자 관심 신약후보물질 화합물의 LD50(Lethal dose 50) 예측치를 제공하는 방법
20 20
제1항의 시스템을 이용하여 내부 또는 외부의 화합물 데이터베이스(database, DB)로부터 연구자 관심 신약후보물질 화합물의 smile 데이터 교환 형식(data interchange format) 정보를 제공하는 방법
21 21
제1항에 있어서,상기 QSAR 모델 선별부(106)는 공개된 기계학습 알고리즘인 사이킷-런(scikit-learn)의,결측치 처리를 위한 sklearn
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 경상대학교 바이오·의료기술개발사업 [EZBARO] 신약개발 빅데이터 플랫폼 및 기계학습 기반 예측 솔루션 구축 및 검증(2차년도)