맞춤기술찾기

이전대상기술

염기 프로파일과 조성을 이용하여 단백질과 결합하는 RNA 서열 영역을 예측하는 방법 및 시스템(Method and System of Predicting protein-binding regions in RNA Using Nucleotide Profiles and Compositions)

  • 기술번호 : KST2018001903
  • 담당센터 : 인천기술혁신센터
  • 전화번호 : 032-420-3580
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 RNA 서열을 구성하는 단일염기 및 올리고염기 각각에 대한 위치가중행렬을 서열 프로파일 정보로 사용하고, 선택적으로 RNA 서열을 구성하는 단일염기 및 올리고염기를 기준으로 하는 빈도수로 정의되는 서열 조성 정보에 기초한 특징 벡터를 학습시킴으로써, 표적 단백질과 결합하는 RNA을 예측하는 방법 및 시스템에 관한 것이다. 본 발명의 방법과 시스템을 채택함으로써, 표적 단백질에 대한 정보 없이도 양호한 예측 성능을 발휘할 수 있으며, 표적 단백질에 대한 정보가 있을 경우에도 양호한 예측 성능을 발휘한다. 본 발명의 방법 및 시스템은 신약 개발 과정에서 신약 후보 물질을 스크리닝 하고자 하는 경우나, 단백질과 RNA의 상호작용 메커니즘을 규명하기 위한 연구-툴(research-tool)로도 활용될 수 있을 것으로 기대된다.
Int. CL G06F 19/18 (2016.09.09) G06F 19/24 (2016.09.09)
CPC G16B 30/10(2013.01) G16B 30/10(2013.01) G16B 30/10(2013.01)
출원번호/일자 1020160102252 (2016.08.11)
출원인 인하대학교 산학협력단
등록번호/일자
공개번호/일자 10-2018-0017827 (2018.02.21) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2016.08.11)
심사청구항수 20

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 인하대학교 산학협력단 대한민국 인천광역시 미추홀구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 한경숙 대한민국 서울특별시 양천구
2 최대식 대한민국 경기도 안양시 만안구
3 박병규 대한민국 인천광역시 남동구
4 채한주 대한민국 인천광역시 남구
5 이욱 대한민국 충청남도 서산시 남부순환로 *

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 네이트특허법인 대한민국 서울특별시 강남구 역삼로 ***, ***호(역삼동, 하나빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 인하대학교 산학협력단 인천광역시 미추홀구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.08.11 수리 (Accepted) 1-1-2016-0780217-39
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2016.09.05 수리 (Accepted) 4-1-2016-5127132-49
3 선행기술조사의뢰서
Request for Prior Art Search
2016.11.10 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2017.02.10 수리 (Accepted) 9-1-2017-0004510-11
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2018.03.02 수리 (Accepted) 4-1-2018-5036549-31
6 의견제출통지서
Notification of reason for refusal
2018.03.20 발송처리완료 (Completion of Transmission) 9-5-2018-0192878-22
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2018.05.04 수리 (Accepted) 1-1-2018-0442869-17
8 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2018.05.04 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2018-0442867-26
9 등록결정서
Decision to grant
2018.08.07 발송처리완료 (Completion of Transmission) 9-5-2018-0536540-86
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2018.12.27 수리 (Accepted) 4-1-2018-5266647-91
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
컴퓨터에서 구현되는, RNA 서열에서 단백질 결합 영역을 예측하는 방법으로서, a) 훈련 데이터(training data)를 포함하는 학습 데이터를 추출하는 단계로서, 상기 훈련 데이터로서 단백질과 결합하는 RNA 영역을 가지는 포지티브 데이터와, 단백질과 결합하지 않는 RNA 영역인 네거티브 데이터를 추출하는 단계; b) 상기 훈련 데이터로서 추출된 RNA 서열에 대한 서열 프로파일(sequence profile) 정보를 연산하는 단계로서, 상기 서열 프로파일 정보는 상기 추출된 RNA 서열에 대한 단일염기(mono-nucleotide) 위치가중행렬(position weight matrix) 정보와, 상기 추출된 RNA 서열에 대한 올리고염기 위치가중행렬 정보를 포함하고, 상기 단일염기 위치가중행렬은 상기 추출된 RNA 서열을 구성하는 단일염기 각각에 대한 로그-오즈 스코어(log-odds score)를 토대로 연산되고, 상기 올리고염기 위치가중행렬은 상기 추출된 RNA 서열을 구성하는 제 1 올리고염기 각각에 대한 로그-오즈 스코어(log-odds score)를 토대로 연산되고, 상기 제 1 올리고염기는 상기 추출된 RNA 서열에서 중첩적으로 배열되는 2-염기(di-nucleotide) 내지 5-염기(penta-nucleotide) 중에서 적어도 하나의 올리고염기로 이루어지는 단계; c) 상기 연산된 단일염기 위치가중행렬 정보 및 상기 올리고염기 위치가중행렬 정보를 조합하여 상기 RNA 서열에 대한 특징 벡터(feature vector)를 구축하는 단계; 및d) 상기 구축된 특징 벡터에 기초하여 예측 대상 RNA 서열을 훈련시킴으로써, 단백질과 결합하는 RNA 결합 영역을 예측하는 단계를 포함하는 RNA 서열에서 단백질 결합 영역을 예측하는 방법
2 2
제 1항에 있어서, 상기 b) 단계에서 상기 서열 프로파일 정보와 별도로 상기 추출된 RNA 서열을 구성하는 염기의 빈도수로 정의되는 서열 조성(composition) 정보가 또한 연산되고, 상기 c) 단계에서 상기 서열 조성 정보가 상기 단일염기 위치가중행렬 정보 및 상기 올리고염기 위치가중행렬 정보와 조합되어 특징 벡터를 구축하는 것을 특징으로 하는 RNA 서열에서 단백질 결합 영역을 예측하는 방법
3 3
제 2항에 있어서, 상기 b) 단계에서 상기 서열 조성 정보는, 상기 추출된 RNA 서열을 구성하는 각각의 단일염기의 빈도수와, 상기 추출된 RNA 서열을 구성하는 제 2 올리고염기 각각의 빈도수를 포함하고, 상기 제 2 올리고염기는 상기 추출된 RNA 서열에서 중첩적으로 배열되는 2-염기 내지 5-염기 중에서 적어도 하나의 올리고염기로 이루어지는 것을 특징으로 하는 RNA 서열에서 단백질 결합 영역을 예측하는 방법
4 4
제 3항에 있어서, 상기 제 2 올리고염기는 상기 추출된 RNA 서열에서 중첩적으로 배열되는 2-염기(di-nucleotide) 및 3-염기(tri-nucleotide)로 이루어지는 것을 특징으로 하는 RNA 서열에서 단백질 결합 영역을 예측하는 방법
5 5
제 1항에 있어서, 상기 a) 단계에서 추출된 RNA 서열 중에서 중복된 RNA 서열을 제거하는 단계를 포함하는 RNA 서열에서 단백질 결합 영역을 예측하는 방법
6 6
제 1항에 있어서, 상기 제 1 올리고염기는 상기 추출된 RNA 서열에서 중첩적으로 배열되는 2-염기(di-nucleotide) 및 3-염기(tri-nucleotide) 중에서 적어도 어느 하나인 RNA 서열에서 단백질 결합 영역을 예측하는 방법
7 7
제 1항에 있어서, 상기 d) 단계 이후에, e) 상기 d) 단계에서 수행된 예측 대상 RNA 서열의 예측 결과를, 평가 척도를 사용하여 평가하는 단계를 더욱 포함하는 RNA 서열에서 단백질 결합 영역을 예측하는 방법
8 8
제 7항에 있어서, 상기 평가 척도는 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy), 양성예측도(Positive predictive value), 음성예측도(Negative predictive value) 및 매튜 상관계수(Matthews correlation coefficient) 중에서 선택되는 적어도 하나인 것을 특징으로 하는 RNA 서열에서 단백질 결합 영역을 예측하는 방법
9 9
제 7항에 있어서, 상기 a) 단계에서 상기 훈련 데이터와 별도로 테스트 데이터로서 단백질과 결합하는 RNA 영역을 가지는 포지티브 데이터와, 단백질과 결합하지 않는 RNA 영역인 네거티브 데이터가 또한 추출되고, 상기 e) 단계는, 상기 테스트 데이터를 대상으로 수행되는 RNA 서열에서 단백질 결합 영역을 예측하는 방법
10 10
제 1항에 있어서, 상기 d) 단계는 서포트-벡터 머신(support vector machine) 모형을 이용하는 것을 특징으로 하는 RNA 서열에서 단백질 결합 영역을 예측하는 방법
11 11
RNA 서열에서 단백질 결합 영역을 예측하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장 매체로서, 훈련 데이터(training data)를 포함하는 학습 데이터로서 RNA에서 단백질과 결합하는 영역인 포지티브 데이터와, 단백질과 결합하지 않는 영역인 네거티브 데이터를 추출하는 서열 추출 수단; 상기 훈련 데이터로서 추출된 RNA 서열에 대한 서열 프로파일(sequence profile) 정보를 연산하는 연산 수단으로서, 상기 서열 프로파일 정보는 상기 추출된 RNA 서열에 대한 단일염기(mono-nucleotide) 위치가중행렬(position weight matrix) 정보와, 상기 추출된 RNA 서열에 대한 올리고염기 위치가중행렬 정보를 포함하고, 상기 단일염기 위치가중행렬은 상기 추출된 RNA 서열을 구성하는 단일염기 각각에 대한 로그-오즈 스코어(log-odds score)를 토대로 연산되고, 상기 올리고염기 위치가중행렬은 상기 RNA 서열을 구성하는 제 1 올리고염기 각각에 대한 로그-오즈 스코어(log-odds score)를 토대로 연산되고, 상기 제 1 올리고염기는 상기 추출된 RNA 서열에서 중첩적으로 배열되는 2-염기(di-nucleotide) 내지 5-염기(penta-nucleotide) 중에서 적어도 하나의 올리고염기로 이루어지는 연산 수단; 상기 연산된 단일염기 위치가중행렬 정보 및 상기 올리고염기 위치가중행렬 정보를 조합하여 상기 RNA 서열에 대한 특징 벡터(feature vector)를 구축하는 벡터 구축 수단; 및상기 구축된 특징 벡터에 기초하여 예측 대상 RNA 서열을 훈련시킴으로써, 단백질과 결합하는 RNA 결합 영역을 예측하는 훈련 수단으로 기능시키기 위한 RNA 서열에서 단백질 결합 영역을 예측하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장 매체
12 12
제 11항에 있어서, 상기 연산 수단은 상기 서열 프로파일 정보와 별도로 상기 추출된 RNA 서열을 구성하는 염기의 빈도수로 정의되는 서열 조성(composition) 정보를 또한 연산하고, 상기 벡터 구축 수단은 상기 서열 조성 정보를 상기 단일염기 위치가중행렬 정보 및 상기 올리고염기 위치가중행렬 정보와 조합하여 특징 벡터를 구축하는 것을 특징으로 하는 RNA 서열에서 단백질 결합 영역을 예측하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장 매체
13 13
제 12항에 있어서, 상기 서열 조성 정보는, 상기 추출된 RNA 서열을 구성하는 각각의 단일염기의 빈도수와, 상기 추출된 RNA 서열을 구성하는 제 2 올리고염기 각각의 빈도수를 포함하고, 상기 제 2 올리고염기는 상기 추출된 RNA 서열에서 중첩적으로 배열되는 2-염기 내지 5-염기 중에서 적어도 하나의 올리고염기로 구성되는 것을 특징으로 하는 RNA 서열에서 단백질 결합 영역을 예측하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장 매체
14 14
제 13항에 있어서, 상기 제 2 올리고염기는 상기 추출된 RNA 서열에서 중첩적으로 배열되는 2-염기(di-nucleotide) 및 3-염기(tri-nucleotide)로 이루어지는 것을 특징으로 하는 RNA 서열에서 단백질 결합 영역을 예측하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장 매체
15 15
제 11항에 있어서, 상기 서열 추출 수단은 추출된 RNA 서열 중에서 중복된 RNA 서열을 제거하는 것을 특징으로 하는 RNA 서열에서 단백질 결합 영역을 예측하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장 매체
16 16
제 11항에 있어서, 상기 제 1 올리고염기는 상기 추출된 RNA 서열에서 중첩적으로 배열되는 2-염기(di-nucleotide) 및 3-염기(tri-nucleotide) 중에서 적어도 어느 하나인 RNA 서열에서 단백질 결합 영역을 예측하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장 매체
17 17
제 11항에 있어서, 상기 프로그램은 상기 훈련 수단에서의 단백질과 결합하는 RNA 서열과 단백질과 결합하지 않는 RNA 서열의 예측 결과를, 평가 척도를 사용하여 평가하는 평가 수단을 더욱 포함하는 RNA 서열에서 단백질 결합 영역을 예측하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장 매체
18 18
제 17항에 있어서, 상기 척도는 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy), 양성예측도(Positive predictive value), 음성예측도(Negative predictive value) 및 매튜 상관계수(Matthews correlation coefficient) 중에서 선택되는 적어도 하나인 것을 특징으로 하는 RNA 서열에서 단백질 결합 영역을 예측하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장 매체
19 19
제 17항에 있어서, 상기 서열 추출 수단은 상기 훈련 데이터와 별도로 테스트 데이터로서 단백질과 결합하는 RNA 영역을 가지는 포지티브 데이터와, 단백질과 결합하지 않는 RNA 영역인 네거티브 데이터를 또한 추출하고, 상기 평가 수단은 상기 테스트 데이터에 대한 평가를 수행하는 RNA 서열에서 단백질 결합 영역을 예측하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장 매체
20 20
제 11항에 있어서, 상기 훈련 수단은 서포트-벡터 머신(support vector machine) 모형을 이용하는 것을 특징으로 하는 RNA 서열에서 단백질 결합 영역을 예측하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장 매체
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.