맞춤기술찾기

이전대상기술

형태소 접속 그래프를 사용한 형태소 및 구문 분석 방법

  • 기술번호 : KST2015186550
  • 담당센터 : 대구기술혁신센터
  • 전화번호 : 053-550-1450
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 형태소 분석, 품사 태깅 및 구문분석 등을 포함한 자연언어처리에 관한 것이다.본 발명에 의한 형태소 분석 과정에서는 하나의 형태소를 표현하는 자료구조로서 형태소 접속 노드를 구성하고, 이 노드들을 서로 연결하여 형태소 접속 그래프를 구성한다.본 발명에 의하면, 한국어 처리 과정에서 나타나는 여러 형태소 분석 후보들을 그래프 형태로 표현할 수 있어서, 기존의 N-링크드 리스트 형태로 표현할 때 발생하는 메모리 낭비를 줄일 수 있고, 검색 과정을 효율적으로 처리할 수 있다.
Int. CL G06F 17/28 (2006.01)
CPC G06F 17/2755(2013.01) G06F 17/2755(2013.01)
출원번호/일자 1019990044750 (1999.10.15)
출원인 학교법인 포항공과대학교
등록번호/일자 10-0303171-0000 (2001.07.09)
공개번호/일자 10-2001-0037309 (2001.05.07) 문서열기
공고번호/일자 (20011102) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (1999.10.15)
심사청구항수 4

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 학교법인 포항공과대학교 대한민국 경상북도 포항시 남구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이근배 대한민국 경상북도포항시남구
2 김준석 대한민국 경상북도포항시남구
3 심준혁 대한민국 경상북도포항시남구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이영필 대한민국 서울 강남구 언주로 **길 **, *층, **층, **층, **층(도곡동, 대림아크로텔)(리앤목특허법인)
2 이상용 대한민국 서울특별시 서초구 서초중앙로 **, *층(서초동, 준영빌딩)(특허법인필앤온지)
3 권석흠 대한민국 서울특별시 강남구 테헤란로 ***, 서림빌딩 **층 (역삼동)(유미특허법인)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 학교법인 포항공과대학교 대한민국 경북 포항시 남구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
1999.10.15 수리 (Accepted) 1-1-1999-0130591-76
2 전자문서첨부서류제출서
Submission of Attachment to Electronic Document
1999.10.16 수리 (Accepted) 1-1-1999-5361901-27
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2000.01.31 수리 (Accepted) 4-1-2000-0012365-15
4 등록사정서
Decision to grant
2001.06.27 발송처리완료 (Completion of Transmission) 9-5-2001-0128595-74
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.07.25 수리 (Accepted) 4-1-2019-5149263-30
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1

자연언어 입력 문장의 형태소 분석과정에서 생성되는 중간 산물들을 표현하는 형태소 접속 그래프를 구성하는 형태소 접속 노드를 기록한 컴퓨터로 읽을 수 있는 기록매체에 있어서,

하나 이상의 형태소의 표층을 저장하는 표층 정보 필드;

상기 하나 이상의 형태소의 품사, 주형태, 이형태 및 형태소의 접속정보를 저장하는 사전 정보 필드;

상기 입력 문장을 음소들로 구분하여 각각 순차적인 번호를 부여할 때, 상기 하나 이상의 형태소의 첫 번째 음소가 위치한 번호를 나타내는 음소열 시작번호 필드와 상기 하나 이상의 형태소의 마지막 음소가 위치한 번호를 나타내는 음소열 끝번호 필드;

상기 입력 문장을 형태소들로 구분하여 각각 순차적인 번호를 부여할 때, 상기 하나 이상의 형태소의 첫 번째 형태소가 위치한 번호를 나타내는 형태소 시작번호 필드와 상기 하나 이상의 형태소의 마직막 형태소가 위치한 번호를 나타내는 형태소 끝번호 필드;

상기 하나 이상의 형태소의 어휘 확률값을 저장하는 형태소 확률 필드;

상기 하나 이상의 형태소의 어휘 확률값, 문맥 확률값 및 음절 트라이그램 확률값을 이용하여 계산한 누적확률값을 저장하는 누적 확률 필드; 및

상기 하나 이상의 형태소에 접속된 직전의 모든 형태소 접속 노드들에 대한 포인터를 저장하는 이전 노드들 포인터 필드와 상기 하나 이상의 형태소에 접속된 직후의 모든 형태소 접속 노드들에 대한 포인터를 저장하는 다음 노드들 포인터 필드를 구비하고,

상기 이전 노드들 포인터 필드와 상기 다음 노드들 포인트 필드는 형태소 접속 노드들이 가지는 확률값에 따라 정렬된 우선순위 큐 구조로 구성되어, N-Best 품사 태깅 결과를 얻을 때 상기 우선순위 큐에서 하나씩 꺼내서 품사 태깅된 N개의 형태소열들을 출력하도록 하는 것을 특징으로 하는 형태소 접속 노드를 기록한 컴퓨터가 읽을 수 있는 기록매체

2 2

제1항에 있어서,

접속검사를 통해 상기 형태소 접속 노드가 접속이 실패하면, 그 형태소 접속 노드가 차지하는 메모리 공간을 메모리 관리자가 회수하도록 하기 위한 포인터를 저장한 자유기억공간 포인터 필드;

비터비 검색을 통해서 품사가 결정된 바로 이전 형태소 접속 노드에 대한 포인터를 저장하여 1-Best의 품사 태깅된 형태소 접속 노드들을 찾을 수 있는 전 형태소 포인터 필드;

상기 하나 이상의 형태소가 사전에 등록된 등록어인지, 등록되지 않은 미등록어인지를 구별해 주는 정보를 저장하는 등록/미등록 정보 필드;

서로 다른 품사의 형태소들이 상위 개념의 품사로서 분석되는 병렬 태그 및 다수의 형태소들이 하나의 형태소로서 합해져 분석되는 직렬 태그에 대한 정보를 저장하는 직/병렬태그 정보 필드;

상기 하나 이상의 형태소에서 형태소의 개수를 저장하는 형태소 개수 정보 필드;

상기 하나 이상의 형태소가 어절의 시작에 위치하는지 여부를 저장하는 어절시작 형태소노드 정보 필드; 및

접속검사 테이블을 이용하여 접속검사를 수행한 결과를 저장하는 접속 플래그 필드를 더 구비함을 특징으로 하는 형태소 접속 노드를 기록한 컴퓨터가 읽을 수 있는 기록매체

3 3

형태소 접속 그래프를 사용하여 자연언어 입력 문장을 형태소 분석하는 방법에 있어서,

(a) 상기 입력 문장의 형태소 단위로 형태소 사전 및 형태소 패턴 사전의 정보를 이용하여 후보 형태소 접속 노드들을 구성하고, 접속 테이블의 정보를 이용하여 상기 후보 형태소 접속 노드의 접속 여부를 확인하여 접속이 되면, 상기 후보 형태소 접속 노드를 형태소 접속 그래프에 추가하고, 접속이 되지 않으면 상기 후보 형태소 접속 노드에 할당된 메모리 공간을 메모리 관리자에 이양하여 초기 형태소 접속 그래프를 생성하는 단계;

(b) 상기 초기 형태소 접속 그래프에 추가된 후보 형태소 접속 노드에 대하여 어휘 확률값, 문맥확률값 및 음절 트라이그램 확률값을 이용하여 비트비 검색을 수행하여 누적 확률값을 계산하고, 계산된 누적 확률값을 이용하여 후보 형태소 접속 노드들의 개수를 줄여 여과된 형태소 접속 그래프를 생성하는 단계;

(c) 상기 입력 문장의 모든 형태소에 대하여 상기 (a) 단계 및 상기 (b) 단계를 반복하여, 상기 여과된 형태소 접속 그래프에서 최적의 패스를 기록한 태깅된 형태소 접속 그래프를 생성하는 단계; 및

(d) 사전에 학습된 에러 수정 규칙을 이용하여 상기 태깅된 형태소 접속 그래프의 태깅 에러를 수정하여 에러 수정된 형태소 접속 그래프를 생성하는 단계를 포함함을 특징으로 하는 형태소 접속 그래프를 사용한 형태소 분석방법

4 4

형태소 접속 그래프를 사용하여 자연언어 입력 문장을 형태소 분석하는 형태소 분석 프로그램을 기록한 기록매체에 있어서,

(a) 상기 입력 문장의 형태소 단위로 형태소 사전 및 형태소 패턴 사전의 정보를 이용하여 후보 형태소 접속 노드들을 구성하고, 접속 테이블의 정보를 이용하여 상기 후보 형태소 접속 노드의 접속 여부를 확인하여 접속이 되면, 상기 후보 형태소 접속 노드를 형태소 접속 그래프에 추가하고, 접속이 되지 않으면 상기 후보 형태소 접속 노드에 할당된 메모리 공간을 메모리 관리자에 이양하여 초기 형태소 접속 그래프를 생성하는 모듈;

(b) 상기 초기 형태소 접속 그래프에 추가된 후보 형태소 접속 노드에 대하여 어휘 확률값과 음절 트라이그램 확률값을 이용하여 비트비 검색을 수행하여 누적 확률값을 계산하고, 계산된 누적 확률값을 이용하여 후보 형태소 접속 노드들의 개수를 줄여 여과된 형태소 접속 그래프를 생성하는 모듈;

(c) 상기 입력 문장의 모든 형태소에 대하여 상기 (a) 모듈 및 상기 (b) 모듈을 반복하여, 상기 여과된 형태소 접속 그래프에서 최적의 패스를 기록한 태깅된 형태소 접속 그래프를 생성하는 모듈; 및

(d) 사전에 학습된 에러 수정 규칙을 이용하여 상기 태깅된 형태소 접속 그래프의 태깅 에러를 수정하여 에러 수정된 형태소 접속 그래프를 생성하는 모듈을 포함함을 특징으로 하는 형태소 접속 그래프를 사용한 형태소 분석 프로그램을 기록한 컴퓨터가 읽을 수 있는 기록매체

지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.