맞춤기술찾기

이전대상기술

자연어 처리 기법을 활용한 화합물의 새로운 분자지문 표현식 및 이를 활용한 정량적 구조기반 활성 예측 방법

  • 기술번호 : KST2020010335
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 자연어 처리기법을 이용하여 화합물을 임베딩하여 임베딩 벡터로서 표현하는 분자 표현식에 관한 것이며, 이를 이용하여 정량적 구조-활성 예측을 하는 모델에 관한 것이다. 구체적으로, 본 발명은 하나의 화합물에 대한 분자지문(molecular fingerprints) 표현식을 도출하는 단계; 상기 분자지문 표현식에 포함된 지문들에 대응하는 인덱스들을 추출하는 단계; 상기 인덱스들 각각을 임베딩하여 2차원의 지문 임베딩 벡터를 획득하는 단계; 상기 지문 임베딩 벡터를 뉴럴 네트워크를 포함하는 모델에 인가하여 입력된 화합물로부터 대응되는 활성 결과를 예측하는 단계;를 포함하는, 화합물이 가지는 활성을 정량적으로 예측하는 방법에 관한 것이다.
Int. CL G16C 20/20 (2019.01.01) G16C 20/10 (2019.01.01) G16C 20/30 (2019.01.01) G16C 20/70 (2019.01.01)
CPC G16C 20/20(2013.01) G16C 20/20(2013.01) G16C 20/20(2013.01) G16C 20/20(2013.01)
출원번호/일자 1020190012037 (2019.01.30)
출원인 한국과학기술원
등록번호/일자
공개번호/일자 10-2020-0094490 (2020.08.07) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2019.01.30)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김동섭 대전광역시 유성구
2 전우성 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이원희 대한민국 서울특별시 강남구 테헤란로 ***, 성지하이츠빌딩*차 ***호 (역삼동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2019.01.30 수리 (Accepted) 1-1-2019-0110482-44
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.04.24 수리 (Accepted) 4-1-2019-5081392-49
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.05.15 수리 (Accepted) 4-1-2020-5108396-12
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.12 수리 (Accepted) 4-1-2020-5131486-63
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
하나의 화합물에 대한 분자지문(Molecular fingerprints) 표현식을 도출하는 단계;상기 분자지문 표현식에 포함된 지문들 각각에 대응하는 인덱스들을 추출하는 단계;상기 인덱스들 각각을 임베딩하여 2차원의 지문 임베딩 매트릭스 벡터를 획득하는 단계; 상기 지문 임베딩 벡터를 뉴럴 네트워크를 포함하는 모델에 인가하여 입력된 화합물로부터 대응되는 활성 결과를 예측하는 단계;를 포함하는,화합물이 가지는 활성을 정량적으로 예측하는 방법
2 2
제1항에 있어서,상기 분자지문 표현식은 ECFP(extended connectivity fingerprints), RDKit, Avalon, Atom Pairs, Topological Torsions, MACCS keys, Morgan, 2D Pharmacophore, Pattern 및 Extended Reduced Graphs로 이루어지는 분자지문 표현식인, 방법
3 3
제1항에 있어서,상기 도출하는 단계는 상기 하나의 화합물의 SMILES(simplified molecular-input line-entry system), InChI(International Chemical Identifier), WLN(Wiswesser line notation), ROSDAL(Representation of Organic Structure Descriptions Arranged Linearly), 및 SLN(SYBYL Line Notation)으로부터 선택되는 분자 구조의 선형 문자 표현으로부터 분자지문 표현식으로 변환하는 단계를 포함하는, 방법
4 4
제1항에 있어서,상기 도출하는 단계는 상기 하나의 화합물의 기 설정된 n 비트 크기의 2진수로 표시되며 각각의 비트마다 인덱스가 부여된 분자지문 표현식으로 변환하는 단계를 포함하는, 방법
5 5
제1항에 있어서,상기 지문 임베딩 벡터는 저장된 룩업 테이블을 참조함으로써 획득하는, 방법
6 6
제5항에 있어서, 상기 룩업 테이블은 주어진 화합물과 활성에 관한 데이터셋을 이용하여 미리 학습을 통하여 저장된, 방법
7 7
제5항에 있어서, 상기 룩업테이블은 (n, k) 2차원 행렬이며, 상기 n은 분자지문 표현식의 비트 크기를 나타내는 정수, k는 기 설정된 임베딩 크기를 나타내는 정수인, 방법
8 8
제6항에 있어서, 상기룩업 테이블은,상기 데이터셋에 포함된 화합물에 대하여 화합물 별로, 상기 도출하는 단계 내지 활성 결과를 획득하는 단계까지를 수행한 후 데이터셋 내의 활성과 비교하여 조정되어 저장된, 방법
9 9
제1항에 있어서, 상기 뉴럴 네트워크는 CNN(Convolutional Neural Network), RNN(Recurrent Neural Network), 양방향 RNN을 포함하는, 방법
10 10
제9항에 있어서,상기 CNN 모델은 2차원 컨볼루셔널 레이어 (Conv2d), 맥스 풀링 및 드롭아웃 레이어 및 풀리 커넥티드 레이어로 구성되는, 방법
11 11
준비된 화합물들의 활성에 관한 데이터셋 내에서 선택되는 하나의 화합물에 대한 분자지문(molecular fingerprints) 표현식을 도출하는 단계;상기 분자지문 표현식에 포함된 지문들에 대응하는 인덱스들을 추출하는 단계;상기 인덱스들 각각을 기 저장된 룩업테이블에 따라 임베딩하여 2차원의 지문 임베딩 벡터를 획득하는 단계; 상기 지문 임베딩 벡터를 뉴럴 네트워크를 포함하는 모델에 인가하여 입력된 화합물로부터 대응되는 활성 결과를 예측하는 단계;상기 예측된 활성 결과를 상기 데이터셋 내의 활성결과와 비교하여 상기 임베딩에 사용는 단계;상기 활성 결과를 상기 데이터셋 내의 활성결과와 비교하여 룩업테이블을 조정하는 단계; 이전 단계들을 반복하여 학습시키는 단계; 및활성을 예측하고자 하는 화합물에 대하여 상기 지문 표현식을 도출하고, 상기 인덱스들을 추출하고, 상기 지문 임베딩 벡터를 획득하는 단계;를 포함하는, 정량적 구조-활성 분석 모델에 입력데이터로서 사용될 수 있는 유기 화합물의 지문 임베딩 벡터 획득 방법
12 12
준비된 화합물들의 활성에 관한 데이터셋 내에서 선택되는 하나의 화합물에 대한 분자지문(Molecular fingerprints) 표현식을 도출하는 단계;상기 분자지문 표현식에 포함된 지문들에 대응하는 인덱스들을 추출하는 단계;상기 인덱스들 각각을 기 저장된 룩업테이블에 따라 임베딩하여 2차원의 지문 임베딩 매트릭스를 획득하는 단계; 상기 지문 임베딩 벡터를 뉴럴 네트워크를 포함하는 모델에 인가하여 입력된 화합물로부터 대응되는 활성 결과를 예측하는 단계;상기 예측된 활성 결과를 상기 데이터셋 내의 활성결과와 비교하여 룩업테이블을 조정하는 단계; 및이전 단계들을 반복하여 학습시키는 단계;를 포함하는, 뉴럴 네트워크를 포함하는 정량적 구조-활성 예측 모델 설계 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 원천기술개발사업 (EZBARO)천연물의 다중분자표적 예측시스템 개발(2018)