맞춤기술찾기

이전대상기술

문장의 구조정보를 이용한 명사구 추출장치 및 그 방법

  • 기술번호 : KST2015076475
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 한국어에서 명사구 색인을 위한 기존의 연구들은 간단한 구문패턴이나 경험적 규칙에만 의존하여 명사구를 추출함으로써 유용한 색인어 구성에 많은 한계를 보였다. 본 발명에서는 이를 극복하기 위한 구문적 방법론으로서 단문의 구조정보를 이용한 효율적인 명사구 색인 방법을 고안한다. 일반적으로 하나의 문장은 여러개의 단문(절)을 포함하고 있으며, 동일 단문 내의 단어(용어)들은 서로 다른 단문 내의 단어들보다 상대적으로 높은 개념적 연관성을 보인다. 따라서 색인을 위한 명사구 추출은 이러한 단문 단위로 이루어져야 한다. 이를 위해, 본 발명은 첫째, 의존관계 파싱과 용언-격조사 간의 공기강도 정보를 이용하여 문장을 단문 단위로 분할하고 둘째, 부분 구문분석을 통해 분할된 각 단문의 구조정보로부터 먼저 2 어절로 이루어진 명사구를 생성규칙에 의하여 생성한 후 각 단문 내에서 2 어절 명사구에 할당된 구조정보를 이용하여 3 어절 이상의 명사구로 통합하여 추출함으로써 문장 내에서 가능한 모든 명사구를 추출할 수 있게 한다.
Int. CL G06F 17/28 (2006.01)
CPC G06F 17/2775(2013.01) G06F 17/2775(2013.01) G06F 17/2775(2013.01)
출원번호/일자 1019970063250 (1997.11.26)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-1999-0042430 (1999.06.15) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 거절
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (1997.11.26)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박재득 대한민국 대전광역시 서구
2 이현아 대한민국 대전광역시 유성구
3 박동인 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이화익 대한민국 서울시 강남구 테헤란로*길** (역삼동,청원빌딩) *층,***,***호(영인국제특허법률사무소)
2 김명섭 대한민국 서울특별시 강남구 테헤란로**길 *, 테헤란오피스빌딩 ***호 시몬국제특허법률사무소 (역삼동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
1997.11.26 수리 (Accepted) 1-1-1997-0199108-17
2 대리인선임신고서
Notification of assignment of agent
1997.11.26 수리 (Accepted) 1-1-1997-0199109-63
3 출원심사청구서
Request for Examination
1997.11.26 수리 (Accepted) 1-1-1997-0199110-10
4 의견제출통지서
Notification of reason for refusal
1999.11.25 발송처리완료 (Completion of Transmission) 9-5-1999-0352801-67
5 거절사정서
Decision to Refuse a Patent
2000.02.29 발송처리완료 (Completion of Transmission) 9-5-2000-0045113-88
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2001.04.19 수리 (Accepted) 4-1-2001-0046046-20
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2002.08.08 수리 (Accepted) 4-1-2002-0065009-76
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1

형태소 사전(120)을 이용하여 텍스트로 입력된 문장을 형태소 해석하는 형태소 분석부(110)와, 그 형태소 해석에 의해 형태소와 구문정보가 할당된 어절을 가장 마지막 어절부터 왼쪽으로 진행하면서 차례로 각 어절에 대한 단문 분할 알고리즘을 적용, 지배소를 설정하여 문장을 단문 단위로 분할 하는 부분 구문분석부(130)와, 부분 구문분석을 위해 필요한 격조사-용언간의 공기정보를 저장하고 있는 공기정보 데이타 베이스(140)로 이루어진 단문분할 장치(100)와,

분할된 단문 내에서 각 어절에 할당된 구조정보를 이용하여 명사구 생성이 가능한 의존관계에 속하는 경우에 2어절 명사로 생성하는 명사구 생성부(210)와, 그 2어절 명사들에 대해서 명사구 삭제조건을 적용시켜 구조적으로 오류가 있는 잘못된 구조정보로부터 생성된 명사구를 삭제하는 명사구 삭제부(220)와, 오류가 있는 명사구가 삭제된 2어절 명사구를 바탕으로 명사구를 이루는 어절 수에 따라 3어절 이상의 명사구로 통합하는 명사구 통합부(230)와, 명사에 대한 불용어 리스트를 '가능 불용어'와 '불가능 불용어'의 2가지로 구축하여 의미적으로 가치가 떨어지는 명사구를 여과시키는 명사 필터링부(240)로 이루어진 명사구 추출 장치(200)로 구성된 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출장치

2 2

텍스트로 입력된 문장에 대해 형태소를 해석하는 과정과,

텍스트로 입력된 문장에 대한 형태소 해석이 성공하면, 문장의 마지막 어절부터 왼쪽으로 진행하면서 각 어절의 종류에 따른 분할 알고리즘을 적용, 각 어절의 지배소를 설정하여 단문으로 분할하는 과정과,

분할된 단문 내에서 각 어절에 할당된 구조정보를 이용하여 2어절 명사구를 생성하는 과정과,

2어절 명사구중 구조적 오류가 있는 명사구를 삭제하는 과정과,

명사구 종류에 따라 2어절 명사구로부터 차츰 긴 어절수를 가진 명사구로 통합하는 과정과,

명사에 대한 '가능 불용어'와 '불가능 불용어' 리스트를 이용하여 의미적으로 가치가 떨어지는 명사구를 필터링하는 과정을 수행하도록 이루어진 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법

3 3

제 2 항에 있어서, 상기 각 어절의 지배소를 설정하는 과정은,

입력 문장에 대한 형태소 해석이 성공하면, 문장의 마지막 어절부터 왼쪽으로 진행하면서 현재 어절이 각각 용언일 때(S6), 필수격 결합 체언일 때(S10), 부사격 결합 체언일 때(S17), 부사나 보조사 결합 체언일 때(S19), 접속조사 결합 체언이나 관형어일 때(S21) 그리고 접속부사일 때(S23) 각기 적용되는 지배소 설정 알고리즘에 의해 지배소 및 의존관계를 설정하는 단계를 수행하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법

4 4

제 3 항에 있어서,

상기 용언에는 동사와 형용사 및 조용보조어간이 결합된 어절이 포함되고,

상기 필수격 결합 체언은 체언에 주격조사나 목적격 조사가 결합된 형태와 조사가 생략된 체언이며,

상기 부사격 결합 체언은 체언에 부사격 조사가 결합된 형태이고,

상기 부사에는 문장부사와 부사형 전성어미 결합 어절이 속하며,

상기 보조사 결합 체언은 체언에 보조사가 결합된 형태를 말하고 접속조사 결합 체언은 체언에 접속조사가 결합된 어절이며,

상기 관형어에는 체언에 관형격조사가 결합된 형태와 관형사가 속하는 것으로 어절을 분류하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법

5 5

제 3 항에 있어서, 상기 현재 어절이 용언일 때(S6)는,

그 형태가 관형형일 때(S7)와 관형형이 아닐 때의 두 가지 경우로 다시 나누고, 용언의 형태가 관형형이면 오른쪽으로 가장 가까운 피수식 단문의 지배소를 현재 어절의 지배소로 설정하고(S9),

관형형이 아닌 연결형이나 종지형이면 현재 용언은 그 용언이 포함된 단문의 지배소로 설정하여(S8) 현재 어절의 지배소는 그 자신이 되는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법

6 6

제 3 항에 있어서, 현재 어절이 필수격 결합 체언인 경우(S10)는,

오른쪽으로 바로 인접한 어절과 먼저 의존관계를 찾고(S11),

의존관계가 있는 지를 판단하여(S12) 의존관계가 있으면, 현재 어절의 지배소는 오른쪽으로 인접한 어절로 설정하며,

의존관계가 없으면 오른쪽에 위치한 어절 중 현재 어절의 지배소로 가능한 어절에 대해서만 의존관계를 찾아(S13) 의존관계가 둘 이상인지를 판단하고(S14),

둘 이상의 의존관계가 찾아질 경우에는(S15) 애매성 해소를 위해서 필수격과 용언 간의 공기정보를 이용하여 높은 값을 가지는 한 개의 의존관계만을 택하여 현재 어절의 지배소로 설정(S16) 하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법

7 7

제 3 항에 있어서, 상기 현재 어절이 부사격 결합 체언이면(S17),

오른쪽에 위치한 용언들 중 현재 어절을 지배 가능한 용언들과의 공기정보를 각각 조사하여 가장 높은 값을 가지는 용언을 택하여 현재 어절의 지배소로 설정(S18)는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법

8 8

제 3 항에 있어서, 현재 어절이 부사나 보조사 결합 체언이면(S19),

현재 어절의 지배소로 가능한 용언들 중 오른쪽으로 가장 가까운 용언을 현재 어절의 지배소로 설정(S20) 하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법

9 9

제 3 항에 있어서, 현재 어절이 접속조사 결합 체언이거나 관형어이면(S21),

지배소로 가능한 체언들 중 오른쪽으로 가장 가까운 체언을 지배소로 설정(S22)는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법

10 10

제 3 항에 있어서, 현재 어절이 접속부사일 때(S23)는,

문장의 첫어절 인지를 판단(S23) 하여 문장의 첫어절에 위치하면 문장의 마지막 어절을 지배소로 설정하고(S25), 그렇지 않으면 오른쪽으로 인접한 어절과 의존관계를 설정(S26)하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법

11 11

제 2 항에 있어서, 상기 2어절 명사구를 생성하는 과정은,

단문 단위로 할당된 구조정보를 읽고(S31), 그 구조정보가 명사구로 생성 가능한 의존관계에 속하는지를 검사하며(S32),

명사구로 생성 가능한 의존관계에 속하는 경우에 2어절 명사구를 생성(S33)하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법

12 12

제 2 항에 있어서, 상기 명사구 통합 과정은,

명사구 삭제 단계가 완료되면(S38), 각 문장내에서 명사구 통합조건을 검사(S39)하고,

통합조건에 부합되는지를 체크하며(S40),

통합조건에 부합되면, 단문 내에서 생성된 2어절 명사구를 바탕으로 3어절 이상의 명사구로 통합(S41)하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법

13 13

제 2 항에 있어서, 상기 명사구 필터링 과정은

의미적으로 가치가 떨어지는 명사구를 여과하기 위한 명사에 대한 불용어 리스트를 미리 '가능 불용어'와 '불가능 불용어'로 나누어 구축하여 두고, 명사구 통합이 완료(S42) 되면, 상기 불용어 리스트에 의거하여 통합된 명사들을 여과(S43) 시키는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법

지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.