맞춤기술찾기

이전대상기술

단백질 동정을 위한 단백질 데이터베이스의 재구성방법 및이를 이용한 단백질 동정 방법

  • 기술번호 : KST2014050136
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 단백질 동정을 위한 단백질 데이터베이스의 재구성 방법 및 이를 이용한 단백질 검색 방법에 대한 것으로, 구체적으로 i) 단백질의 중복을 최소화한 1차 데이터베이스로부터 클러스터링 소프트웨어를 이용하여 일정 유사도 이상을 갖는 단백질 그룹으로 그룹화한 다음, 각각의 단백질 그룹의 서열 정보를 컴퓨터의 기록장치에 독립적으로 저장하는 단계; 및ⅱ) 상기 그룹화된 단백질 그룹에서 대표 단백질을 지정하여 대표 단백질로만 구성된 대표 단백질 데이터베이스(representative protein database)를 구축하여, 서열 정보를 컴퓨터의 기록장치에 저장하는 단계를 포함하는 단백질 서열 데이터베이스의 재구성 방법 및 상기 방법을 이용한 단백질의 동정방법에 관한 것이다. 본 발명의 단백질 검색용 데이터베이스의 재구성 및 이를 이용한 검색 방법은 생체 내에 존재하는 단백질의 상태를 효과적으로 밝혀내는 데 유용하므로, 생체 내에서의 단백질의 기능과 상호작용을 이해하고, 질병 예방 및 진단, 치료하는 방법의 개발 등에 유용하게 이용할 수 있다. 단백질, 질량분석기, 단백질 동정, 데이터베이스, 검색시스템
Int. CL G06F 17/40 (2011.01) G06F 19/18 (2011.01) G06F 17/30 (2011.01)
CPC
출원번호/일자 1020060065533 (2006.07.12)
출원인 한국기초과학지원연구원
등록번호/일자 10-0853786-0000 (2008.08.18)
공개번호/일자 10-2008-0006382 (2008.01.16) 문서열기
공고번호/일자 (20080822) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2006.07.12)
심사청구항수 21

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국기초과학지원연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 권경훈 대한민국 대전 서구
2 유종신 대한민국 대전 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이원희 대한민국 서울특별시 강남구 테헤란로 ***, 성지하이츠빌딩*차 ***호 (역삼동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국기초과학지원연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2006.07.12 수리 (Accepted) 1-1-2006-0498824-05
2 선행기술조사의뢰서
Request for Prior Art Search
2007.06.07 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2007.07.11 수리 (Accepted) 9-1-2007-0039666-87
4 의견제출통지서
Notification of reason for refusal
2007.07.25 발송처리완료 (Completion of Transmission) 9-5-2007-0403538-28
5 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2007.09.27 수리 (Accepted) 1-1-2007-0697086-18
6 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2007.10.25 수리 (Accepted) 1-1-2007-0764704-87
7 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2007.11.26 수리 (Accepted) 1-1-2007-0849257-95
8 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2007.12.26 수리 (Accepted) 1-1-2007-0934353-42
9 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2008.01.25 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2008-0063472-15
10 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2008.01.25 수리 (Accepted) 1-1-2008-0063475-52
11 등록결정서
Decision to grant
2008.05.22 발송처리완료 (Completion of Transmission) 9-5-2008-0273555-78
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.10.21 수리 (Accepted) 4-1-2011-5212108-42
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.08.31 수리 (Accepted) 4-1-2012-5184293-13
14 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.08.31 수리 (Accepted) 4-1-2012-5184331-50
15 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.04.15 수리 (Accepted) 4-1-2013-5058545-81
16 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.04.15 수리 (Accepted) 4-1-2013-5058386-17
17 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.22 수리 (Accepted) 4-1-2020-5135881-88
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
i) 단백질의 중복을 최소화한 1차 데이터베이스로부터 클러스터링 소프트웨어를 이용하여 일정 유사도 이상을 갖는 단백질 그룹으로 그룹화한 다음, 각각의 단백질 그룹의 서열 정보를 컴퓨터의 기록장치에 독립적으로 저장하는 단계; 및ⅱ) 상기 클러스터링 소프트웨어를 이용하여 상기 그룹화된 단백질 그룹에서 대표 단백질을 지정하여 대표 단백질로만 구성된 대표 단백질 데이터베이스(representative protein database)를 구축하여, 그 서열 정보를 컴퓨터의 기록장치에 저장하는 단계를 포함하는 단백질 검색용 데이터베이스의 재구성 방법
2 2
제 1항에 있어서, 1차 데이터베이스는 IPI 데이터베이스, UniprotKB/Swissprot 데이터베이스 또는 nrdb90 데이터베이스인 것을 특징으로 하는 방법
3 3
제 1항에 있어서, 상기 클러스터링 소프트웨어는 CD-HIT, GeneRAGE , TribeMCL 또는 nrdb90인 것을 특징으로 하는 방법
4 4
제 1항에 있어서, 유사도는 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%인 것을 특징으로 하는 방법
5 5
제 1항에 있어서, 유사도는 60%인 것을 특징으로 하는 방법
6 6
제 1항에 있어서, 하기 단계를 추가적으로 포함하는 것을 특징으로 하는 방법:ⅲ) 질량분석기를 통해 수득한 특정 시료의 탠덤 질량 스펙트럼을 상기 대표 단백질 데이터베이스를 대상으로 하여, 서열 검색 알고리즘을 채용한 서열 검색용 소프트웨어를 이용하여 검색한 뒤, 매칭이 된 1차 단백질 목록을 얻는 단계; 및ⅳ) 상기 1차 단백질 목록과 동일 그룹에 속하는 상기 단계 ⅰ의 단백질 그룹을 모아 2차 데이터베이스를 구축하여, 서열 정보를 컴퓨터의 기록장치에 저장하는 단계
7 7
제 6항에 있어서, 하기 단계를 추가적으로 포함하는 것을 특징으로 하는 방법:ⅴ) 질량분석기를 통해 수득한 특정 시료의 탠덤 질량 스펙트럼을 상기 2차 데이터베이스를 대상으로 하여, 서열 검색 알고리즘을 채용한 서열 검색용 소프트웨어를 이용하여 검색한 뒤, 매칭이 된 2차 단백질 목록을 얻는 단계; 및ⅵ) NCBI nr 데이터베이스, EST 데이터베이스 및 게놈 염기서열에서 해독된 단백질 서열 데이터베이스로 구성된 군으로부터 선택되는 다양성이 풍부한 3차 데이터베이스에서 상기 단계 ⅲ에서 수득한 1차 단백질 목록의 단백질이 속한 단백질 그룹을 선별한 다음, 상기 단백질 그룹들은 하나로 모아 4차 데이터베이스를 구축하여, 그 서열 정보를 컴퓨터의 기록장치에 저장하는 단계
8 8
제 7항에 있어서, 하기 단계를 추가적으로 포함하는 것을 특징으로 하는 방법:ⅶ) 질량분석기를 통해 수득한 특정 시료의 탠덤 질량 스펙트럼을 상기 4차 데이터베이스를 대상으로 하여, 통상의 서열 검색 알고리즘을 채용한 서열 검색용 소프트웨어를 이용하여 검색한 뒤, 매칭이 된 4차 단백질 목록을 얻는 단계;ⅷ) 상기 4차 단백질 데이터베이스를 대상으로 하여 수식화 조건에 대한 알고리즘이 추가적으로 포함된 서열 검색용 소프트웨어를 이용하여 검색함으로써 매칭이 된 수식화 단백질의 3차 단백질 목록을 얻는 단계; 및ⅸ) 상기 1차 내지 3차 단백질 목록들을 취합하여 전체 동정 단백질 목록을 작성하고, 검색 결과를 컴퓨터 출력장치에 출력하는 단계
9 9
제 6항 또는 제 7항에 있어서, 상기 단계 ⅱ, ⅳ 및 ⅵ의 서열정보는 FASTA 포맷인 것을 특징으로 하는 방법
10 10
제 6항 또는 제 7항에 있어서, 상기 단계 ⅱ, ⅳ 및 ⅵ에서의 컴퓨터의 기록장치는 HDD, FDD, CD-ROM, CD-R, CD-RW, DVD-ROM, DVD-RAM, DVD-RW±, MD(MiniDisk), MMC(MultiMedia Card), SMC(Smart Media Card), Flashmemory, SD(Secure Didital) 카드, CF(CompactFlash) 카드, MemoryStick 또는 자기테이프인 것을 특징으로 하는 방법
11 11
제 6항 또는 제 7항에 있어서, 상기 단계 ⅲ 및 ⅴ에서 사용하는 서열 검색용 소프트웨어는 SEQUEST®, TurboSEQUEST®, Mascot, Sonar 또는 X!Tandem인 것을 특징으로 하는 방법
12 12
삭제
13 13
제 1항 내지 제 8항 중 어느 한 항의 방법으로 재구성된 단백질 검색용 데이터베이스를 이용한 단백질 검색 방법
14 14
제 13항에 있어서,ⅰ) 크로마토그래피와 탄템 질량분석기를 이용하여 생체 시료로부터 수득된탠덤 질량 스펙트럼이 단백질 검색용 컴퓨터 시스템에 전송되는 단계;ⅱ) 상기 전송된 탠덤 질량 스펙트럼을 단백질 검색용 알고리즘을 이용하여 1차 데이터베이스로부터 클러스터링 소프트웨어를 이용하여 일정 유사도 이상을 갖는 단백질 그룹으로 그룹화한 후 상기 그룹화된 단백질 그룹에서 지정된 대표 단백질로만 구성된 대표 단백질 데이터베이스로부터 검색한 후 동정 된 1차 단백질 목록을 작성하여, 그 서열 정보를 컴퓨터의 기록장치에 저장하는 단계;ⅲ) 상기 단계 ⅱ에서 동정 되지 않은 탠덤 질량 스펙트럼을 단백질 검색용 알고리즘을 이용하여 상기 1차 단백질 목록과 동일 그룹에 속하는 상기 단계 ⅱ의 그룹을 모아 구축된 2차 단백질 데이터베이스로부터 검색한 후 동정된 2차 단백질 목록을 작성하여, 그 서열 정보를 컴퓨터의 기록장치에 저장하는 단계;ⅳ) 상기 단계 ⅱ 및 ⅲ에서 동정 되지 않은 탠덤 질량 스펙트럼을 단백질 검색용 알고리즘을 이용하여 NCBI nr 데이터베이스, EST 데이터베이스 및 게놈 염기서열에서 해독된 단백질 서열 데이터베이스로 구성된 군으로부터 선택되는 다양성이 풍부한 3차 데이터베이스에서 상기 단계 ⅱ에서 수득한 1차 단백질 목록의 단백질이 속한 단백질 그룹을 선별한 다음, 상기 단백질 그룹들은 하나로 모아 구축된 4차 단백질 데이터베이스로부터 검색한 후 동정 된 3차 단백질 목록을 작성하여, 그 서열 정보를 컴퓨터의 기록장치에 저장하는 단계; 및ⅴ) 상기 1 내지 3차 단백질 목록을 취합하여, 전체 동정 단백질 목록을 작성하여, 검색 결과를 컴퓨터의 출력장치에 출력하는 단계를 포함하는 단백질 검색 방법
15 15
제 14항에 있어서, 하기 단계를 추가적으로 포함하는 것을 특징으로 하는 방법:ⅵ) 상기에서 구성된 4차 단백질 데이터베이스로부터 통상의 단백질 검색용 알고리즘을 이용하여 검색 조건의 추가로 수식화된 펩타이드 서열을 검색한 후 동정된 4차 단백질 목록을 작성하여, 그 서열 정보를 컴퓨터의 기록장치에 저장하는 단계; 및ⅶ) 상기 1 내지 4차 단백질 목록을 취합하여, 전체 동정 단백질 목록을 작성하여, 검색 결과를 컴퓨터의 출력장치에 출력하는 단계
16 16
제 14항에 있어서, 상기 단계 ⅰ에서의 탠덤 질량 스펙트럼의 전송은 RS-232C 시리얼 버스, 패러럴 버스, 유니버설 시리얼 버스(USB), IEEE1394 및 블루투스로 구성되는 군으로부터 선택되는 버스를 통해 수행되거나 질량분석기에 장착된 기록장치에 기록된 후, USB 메모리, CD-ROM, 자기테이프 또는 이동형 저장매체에 옮긴 다음 다시 단백질 검색용 컴퓨터로 옮김으로써 수행되는 것을 특징으로 하는 단백질 검색 방법
17 17
제 14항에 있어서, 단백질 검색용 알고리즘은 MOWSE 알고리즘 또는 SEQUEST 알고리즘인 것을 특징으로 하는 단백질 검색 방법
18 18
제 14항에 있어서, 상기 단계 ⅱ 내지 ⅳ의 컴퓨터의 기록장치는 하드디스크드라이브, 플로피디스크드라이브, CD-ROM, CD-R, CD-RW, DVD-ROM, DVD-RAM, DVD-RW±, MD(MiniDisk), MMC(MultiMedia Card), SMC(Smart Media Card), 플래시메모리, SD(Secure Didital) 카드, CF(CompactFlash) 카드, 메모리스틱 또는 자기테이프인 것을 특징으로 하는 단백질 검색 방법
19 19
제 13항에 있어서, ⅰ) FT-ICR 질량분석기로 분석되어 수득된 효소 처리하지 않은 온전한 단백질의 탠덤 질량 스펙트럼이 단백질 검색용 컴퓨터 시스템에 전송되는 단계;ⅱ) 상기에서 구축된 대표 단백질 데이터베이스로 시퀀스 태그(Sequence Tag)을 검색하여 단백질의 일부 서열로부터 가능한 단백질 그룹을 도출하는 단계;ⅲ) 단계 ⅱ에서 도출된 단백질 그룹으로부터 상기 1차 단백질 데이터베이스에 속한 그룹만을 선별하여 2차 단백질 데이터베이스를 구성하는 단계;ⅳ) 상기 2차 단백질 데이터베이스로부터 통상의 단백질 검색용 알고리즘을 이용하여, 단백질의 분자량과 시퀀스 태그를 동시에 만족하는 단백질을 검색한 후, 동정된 2차 단백질 목록을 작성하고 그 서열 정보를 컴퓨터의 기록장치에 저장하는 단계;ⅴ) 상기 단계 ⅱ에서 도출된 단백질 그룹으로부터 상기 3차 단백질 데이터베이스에 속한 그룹만을 선별하여 4차 단백질 데이터베이스를 구성하는 단계;ⅵ) 상기 4차 단백질 데이터베이스로부터 통상의 단백질 검색용 알고리즘을 이용하여 단백질의 분자량과 시퀀스 태그를 동시에 만족하는 단백질을 검색한 후, 동정 된 3차 단백질 목록을 작성하고 그 서열 정보를 컴퓨터의 기록장치에 저장하는 단계; 및ⅶ) 상기 1차 내지 3차 단백질 목록을 취합하여, 전체 동정 단백질 목록을 작성하여, 검색 결과를 컴퓨터의 출력장치에 출력하는 단계를 포함하는 단백질 검색 방법
20 20
제 19항에 있어서, 탠덤 질량 스펙트럼의 전송은 RS-232C 시리얼 버스, 패러럴 버스, 유니버설 시리얼 버스(USB), IEEE1394 및 블루투스로 구성된 군으로부터 선택되는 버스를 통해 수행되거나, 질량분석기에 장착된 기록장치에 기록된 후, USB 메모리, CD-ROM, 자기테이프 또는 이동형 저장매체에 옮긴 다음 다시 단백질 검색용 컴퓨터로 옮김으로써 수행되는 것을 특징으로 하는 단백질 검색 방법
21 21
제 19항에 있어서, 상기 iv 및 ⅵ 단계에서 사용되는 단백질 검색용 알고리즘은 Mascot 알고리즘, Sequence Tag 알고리즘 또는 ProSightPTM 알고리즘인 것을 특징으로 하는 단백질 검색 방법
22 22
제 19항에 있어서, 상기 단계 ⅳ 및 ⅵ의 컴퓨터의 기록장치는 하드디스크드라이브, 플로피디스크드라이브, CD-ROM, CD-R, CD-RW, DVD-ROM, DVD-RAM, DVD-RW±, MD(MiniDisk), MMC(MultiMedia Card), SMC(Smart Media Card), 플래시메모리, SD(Secure Didital) 카드, CF(CompactFlash) 카드, 메모리스틱 또는 자기테이프인 것을 특징으로 하는 단백질 검색 방법
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US08296300 US 미국 FAMILY
2 US20090319558 US 미국 FAMILY
3 WO2008007821 WO 세계지적재산권기구(WIPO) FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2009319558 US 미국 DOCDBFAMILY
2 US8296300 US 미국 DOCDBFAMILY
3 WO2008007821 WO 세계지적재산권기구(WIPO) DOCDBFAMILY
국가 R&D 정보가 없습니다.