1
자연언어 입력 문장의 형태소 분석과정에서 생성되는 중간 산물들을 표현하는 형태소 접속 그래프를 구성하는 형태소 접속 노드를 기록한 컴퓨터로 읽을 수 있는 기록매체에 있어서, 하나 이상의 형태소의 표층을 저장하는 표층 정보 필드; 상기 하나 이상의 형태소의 품사, 주형태, 이형태 및 형태소의 접속정보를 저장하는 사전 정보 필드; 상기 입력 문장을 음소들로 구분하여 각각 순차적인 번호를 부여할 때, 상기 하나 이상의 형태소의 첫 번째 음소가 위치한 번호를 나타내는 음소열 시작번호 필드와 상기 하나 이상의 형태소의 마지막 음소가 위치한 번호를 나타내는 음소열 끝번호 필드; 상기 입력 문장을 형태소들로 구분하여 각각 순차적인 번호를 부여할 때, 상기 하나 이상의 형태소의 첫 번째 형태소가 위치한 번호를 나타내는 형태소 시작번호 필드와 상기 하나 이상의 형태소의 마직막 형태소가 위치한 번호를 나타내는 형태소 끝번호 필드; 상기 하나 이상의 형태소의 어휘 확률값을 저장하는 형태소 확률 필드; 상기 하나 이상의 형태소의 어휘 확률값, 문맥 확률값 및 음절 트라이그램 확률값을 이용하여 계산한 누적확률값을 저장하는 누적 확률 필드; 및 상기 하나 이상의 형태소에 접속된 직전의 모든 형태소 접속 노드들에 대한 포인터를 저장하는 이전 노드들 포인터 필드와 상기 하나 이상의 형태소에 접속된 직후의 모든 형태소 접속 노드들에 대한 포인터를 저장하는 다음 노드들 포인터 필드를 구비하고, 상기 이전 노드들 포인터 필드와 상기 다음 노드들 포인트 필드는 형태소 접속 노드들이 가지는 확률값에 따라 정렬된 우선순위 큐 구조로 구성되어, N-Best 품사 태깅 결과를 얻을 때 상기 우선순위 큐에서 하나씩 꺼내서 품사 태깅된 N개의 형태소열들을 출력하도록 하는 것을 특징으로 하는 형태소 접속 노드를 기록한 컴퓨터가 읽을 수 있는 기록매체
|