1 |
1
(a) 대상 생물정보의 구조 및 그 내재된 시멘틱을 선언적으로 기술하여 랩퍼를 명세하는 단계; (b) 상기 랩퍼 명세로부터 그 정의된 엔트리의 시멘틱에 따라 랩퍼 템플릿에 데이터 추출 및 정의 규칙을 추가하여 랩퍼 템플릿을 구축하고, 통합 관점에서 필요한 랩퍼 관련 메타정보를 포함하는 모델 템플릿을 구축하고, 대상 생물정보에 대한 구조 및 연산을 파싱하여 랩퍼를 생성하는 단계; 및 (c) 상기 생성된 랩퍼를 실행하여 네트워크상의 대상 생물정보를 추출하고, 그 누적되는 생물정보를 변형하여 통합 메타 모델을 구축하는 단계;를 포함하는 것을 특징으로 하는 랩퍼 명세 언어에 기반한 인터넷상의 반구조화된 생물정보 추출 방법
|
2 |
2
제 1항에 있어서, 상기 (a)단계는, DOM 트리 및 플랫파일의 특정 위치에 대한 대상 생물정보의 상대적인 접근 위치를 정의하는 단계; 정규식과 DOM 트리 경로식의 제약조건을 포함하여 속성을 정의하는 단계; 상기 정의된 속성으로부터 타 생물정보와의 참조 링크를 정의하는 단계; 개별 생물정보가 제공하는 분석도구에 대한 접근 질의를 정의하는 단계;를 포함하는 것을 특징으로 하는 랩퍼 명세 언어에 기반한 인터넷상의 반구조화된 생물정보 추출 방법
|
3 |
3
제 2항에 있어서, 상기 접근 위치 정의단계는, 조건문을 사용하여 파싱 트리내의 특정 태그 또는 데이터 자체를 생물정보 추출 영역으로 지정함으로써 생물정보 접근위치를 정의하는 것을 특징으로 하는 랩퍼 명세 언어에 기반한 인터넷상의 반구조화된 생물정보 추출 방법
|
4 |
4
제 2항에 있어서, 상기 속성 정의단계는, 파싱트리 경로 지정 연산자, 값 추출 연산자, 배열 지정 연산자, 중첩정보 명시 연산자, 정규식 관련 연산자들을 사용하여 속성을 정의하는 것을 특징으로 하는 랩퍼 명세 언어에 기반한 인터넷상의 반구조화된 생물정보 추출 방법
|
5 |
5
제 2항에 있어서, 상기 참조 링크 정의단계는, 대상 타 생물정보의 별명과 접근시 사용할 기본 키의 명칭을 포함하는 TARGET 절과, 실제 키값 추출을 위한 참조 속성명과 추출 패턴을 포함하는 EXTRACT절을 정의하는 것을 특징으로 하는 랩퍼 명세 언어에 기반한 인터넷상의 반구조화된 생물정보 추출 방법
|
6 |
6
삭제
|
7 |
7
제 1항에 있어서, 상기 (b)단계는, 상기 랩퍼 명세로부터 대상 생물정보의 위치를 지정하는 영역 엔트리를 파싱하는 경우, 랩퍼 템플릿에서 영역을 초기화하고, 상기 랩퍼 명세로부터 영역의 위치명과 정보 소스를 추출한 후, 정보 추출에 평가식의 존재여부를 검사하여, 평가식이 존재하지 않으면 상기 추출된 위치노드와 정보소스를 랩퍼 템플릿에 추가하고, 평가식이 존재할 경우는, 파싱트리의 루트로부터 해당 정보소스의 추적여부에 따라, DOM 모델에 의해 영역에 대한 평가식을 추출하거나 해당 정보소스로부터 연산자를 직접 정의하여 평가식을 정의한 후, 그 평가식을 상기 추출된 위치노드와 정보소스에 대한 조건으로서 랩 템플릿에 추가하는 것을 특징으로 하는 랩퍼 명세 언어에 기반한 인터넷상의 반구조화된 생물정보 추출 방법
|
8 |
8
제 1항에 있어서, 상기 (b)단계는, 상기 랩퍼 명세로부터 속성 엔트리를 파싱하는 경우, 속성 구조를 초기화한 후, 상기 랩퍼 명세로부터 속성명과 정보소스를 추출하는 제 1단계; 속성에 대한 메타정보 생성을 위해 상기 추출된 속성명을 모델 템플릿에 추가하고, 상기 추출된 정보소스를 평가하여 모델 템플릿에 해당 속성형을 설정하는 제 2단계; 및 상기 정보소스에 평가절의 정의여부를 검사하여, 평가식이 존재하지 않을 경우 상기 추출된 속성명과 정보소스를 랩퍼 템플릿에 추가하고, 평가식이 존재할 경우는, 해당 정보소스가 경로식으로 명세되었는지 여부에 따라, 파싱 트리에서 평가식을 추출하거나 해당 정보소스에서 연산자를 직접 추출하여 속성에 대한 평가식을 생성한 후, 그 평가식을 상기 추출된 속성명 및 정보소스에 대한 조건식으로 정의하여 랩퍼 템플릿에 추가하는 제 3단계;를 수행하는 것을 특징으로 하는 랩퍼 명세 언어에 기반한 인터넷상의 반구조화된 생물정보 추출 방법
|
9 |
9
제 8항에 있어서, 상기 제 2단계에서 추출된 정보소스를 평가한 결과 그 속성값이 기본형의 배열, 리스트, 또는 중첩 형태인 복합형일 경우, 각 기본형 단위로 복합형내의 모든 속성요소를 제 8항에 따라 처리한 후, 모델 템플릿에 해당 속성을 복합형인 것으로 설정하는 것을 특징으로 하는 랩퍼 명세 언어에 기반한 인터넷상의 반구조화된 생물정보 추출 방법
|
10 |
10
제 1항에 있어서, 상기 (b)단계는, 상기 랩퍼 명세로부터 참조 링크 엔트리를 파싱하는 경우, 링크를 초기화한 후, 상기 랩퍼 명세로부터 참조데이터를 추출하는 단계; 상기 참조데이터를 파싱하여 타 생물정보로의 접근을 위해 정의한 필드를 추출하는 단계; 상기 추출된 필드를 검사하여 그 필드가 속성절에 정의되었는지 여부를 판단하는 단계; 및 필드가 속성절에 정의된 경우, 상기 참조데이터의 파싱을 통해 대상 생물정보를 명시하는 별명과 접근 속성을 추출한 후, 이를 모델 템플릿과 랩퍼 템플릿에 추가하는 단계;를 수행하는 것을 특징으로 하는 랩퍼 명세 언어에 기반한 인터넷상의 반구조화된 생물정보 추출 방법
|
11 |
11
제 1항에 있어서, 상기 (b)단계는, 상기 랩퍼 명세로부터 분석도구인 연산 엔트리를 파싱하는 경우, 연산의 정의 구조를 초기화한 후, 상기 랩퍼 명세로부터 연산이 명칭 및 질의를 추출하여 모델 템플릿에 추가하는 단계; 상기 랩퍼 명세로부터 그 연산과 관련된 모든 파라미터를 추출하고, 각 파라미터의 특성을 추출하는 단계; 상기 추출된 특성정보를 모델 템플릿에 해당 연산의 파라미터 정보로 추가하는 단계; 및 그 연산의 결과를 인식할 랩퍼의 별명을 추출한 후, 그 랩퍼 별명을 모델 템플릿에 연산의 결과로서 설정하는 것을 특징으로 하는 랩퍼 명세 언어에 기반한 인터넷상의 반구조화된 생물정보 추출 방법
|
12 |
11
제 1항에 있어서, 상기 (b)단계는, 상기 랩퍼 명세로부터 분석도구인 연산 엔트리를 파싱하는 경우, 연산의 정의 구조를 초기화한 후, 상기 랩퍼 명세로부터 연산이 명칭 및 질의를 추출하여 모델 템플릿에 추가하는 단계; 상기 랩퍼 명세로부터 그 연산과 관련된 모든 파라미터를 추출하고, 각 파라미터의 특성을 추출하는 단계; 상기 추출된 특성정보를 모델 템플릿에 해당 연산의 파라미터 정보로 추가하는 단계; 및 그 연산의 결과를 인식할 랩퍼의 별명을 추출한 후, 그 랩퍼 별명을 모델 템플릿에 연산의 결과로서 설정하는 것을 특징으로 하는 랩퍼 명세 언어에 기반한 인터넷상의 반구조화된 생물정보 추출 방법
|