맞춤기술찾기

이전대상기술

하이브리드 정답유형 인식 장치 및 방법

  • 기술번호 : KST2015080475
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 질의 응답 시스템을 위한 한국어의 정답유형을 인식하도록 하는 하이브리드 정답유형 인식 장치 및 방법에 관한 것이다. 이와 같은 본 발명은 입력 텍스트의 형태소를 분석하는 형태소 분석부와, 상기 형태소 분석부에서 분석된 형태소 리스트 각각에 대해 일정 크기의 음절을 추출하여 그 추출된 음절을 기반으로 하여 정답 유형을 인식하는 음절 기반 정답 유형 인식부와, 상기 각 형태소 리스트의 구성 형태소별 해당 자질을 할당하여 그 해당 자질을 인식하는 어휘 자질 인식부와, 상기 어휘 자질 인식부에서 인식된 하나 이상의 자질을 갖는 형태소들에 대하여 어휘 자질 중의성을 해소하는 어휘 자질 중의성 해소부와, 상기 형태소들의 연속된 나열과 형태소에 연결된 구성 자질들의 연속된 나열을 기 구축된 패턴 규칙들과 비교하여 정답 유형을 인식하는 패턴 규칙 기반 정답 유형 인식부와, 상기 형태소들의 연속된 나열과 형태소에 연결된 구성 자질들의 연속된 나열에 통계 모델을 적용하여 정답 유형을 인식하는 통계 기반 정답 유형 인식부와, 상기 통계 기반 정답 유형 인식부에서 대분류로 인식된 정답 유형에 대한 정답 유형 세부 범주를 인식하는 정답 유형 세부 범주 인식부로 구성된다. 정답 유형 인식, 하이브리드 정답유형 인식, 통계기반 정답유형 인식, 규칙기반 정답유형 인식, 개체명 인식, 하이브리드 개체명 인식, 질의응답
Int. CL G06F 17/27 (2006.01) G06F 17/25 (2006.01) G06F 17/20 (2006.01)
CPC
출원번호/일자 1020040108121 (2004.12.17)
출원인 한국전자통신연구원
등록번호/일자 10-0597437-0000 (2006.06.29)
공개번호/일자 10-2006-0069616 (2006.06.21) 문서열기
공고번호/일자 (20060706) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2004.12.17)
심사청구항수 21

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 정의석 대한민국 대전시 유성구
2 임수종 대한민국 대전시 서구
3 황이규 대한민국 대전시 유성구
4 장명길 대한민국 대전시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 권태복 대한민국 서울시 강남구 테헤란로*길 **, *층 (역삼동, 청원빌딩)(아리특허법률사무소)
2 이화익 대한민국 서울시 강남구 테헤란로*길** (역삼동,청원빌딩) *층,***,***호(영인국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2004.12.17 수리 (Accepted) 1-1-2004-0597333-64
2 등록결정서
Decision to grant
2006.06.23 발송처리완료 (Completion of Transmission) 9-5-2006-0357828-16
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
입력 텍스트의 형태소를 분석하는 형태소 분석부와; 상기 형태소 분석부에서 분석된 형태소 리스트 각각에 대해 일정 크기의 음절을 추출하여 그 추출된 음절을 기반으로 하여 정답 유형을 인식하는 음절 기반 정답 유형 인식부와; 상기 각 형태소 리스트의 구성 형태소별 해당 자질을 할당하여 그 해당 자질을 인식하는 어휘 자질 인식부와; 상기 어휘 자질 인식부에서 인식된 하나 이상의 자질을 갖는 형태소들에 대하여 어휘 자질 중의성을 해소하는 어휘 자질 중의성 해소부와; 상기 형태소들의 연속된 나열과 형태소에 연결된 구성 자질들의 연속된 나열을 기 구축된 패턴 규칙들과 비교하여 정답 유형을 인식하는 패턴 규칙 기반 정답 유형 인식부와; 상기 형태소들의 연속된 나열과 형태소에 연결된 구성 자질들의 연속된 나열에 통계 모델을 적용하여 정답 유형을 인식하는 통계 기반 정답 유형 인식부와; 상기 통계 기반 정답 유형 인식부에서 대분류로 인식된 정답 유형에 대한 정답 유형 세부 범주를 인식하는 정답 유형 세부 범주 인식부를 포함하여 구성되는 것을 특징으로 하는 하이브리드 정답유형 인식 장치
2 2
제 1 항에 있어서, 상기 음절 기반 정답 유형 인식부는 상기 형태소 분석부에서 분석된 형태소 리스트 각각에 대해 고정 크기의 음절을 추출하는 음절 추출부와; 정답 유형 태깅 코퍼스에 태깅된 정답 유형들중 제1 일정 크기 이상의 정답 유형들에 대하여 제2 일정 크기의 음절 색인을 추출하여 구축된 음절 색인 DB와; 상기 음절 색인 DB를 조회하는 음절 색인 검색부와; 해당 음절별 정답 유형 엔트리를 추출하여 구축된 음절 기반 정답 유형 사전 DB와; 상기 음절 기반 정답 유형 사전 DB를 검색하여 정답 유형 어휘가 존재할 경우 음절 기반 정답 유형 인식 결과를 출력하는 정답 유형 사전 검색부로 구성되는 것을 특징으로 하는 하이브리드 정답유형 인식 장치
3 3
제 1 항에 있어서, 상기 어휘 자질 인식부는 기 구축된 자질 사전 DB와; 상기 자질 사전 DB를 검색하여 각 형태소 리스트의 구성 형태소별 해당 자질을 할당하는 자질 할당부로 구성되는 것을 특징으로 하는 하이브리드 정답유형 인식 장치
4 4
제 1 항에 있어서, 상기 어휘 자질 중의성 해소부는 상기 중의성 자질 대상에서 자질 문맥 정보를 추출하는 자질 문맥 정보 추출부와; 정답 유형 자료 구조의 정보들을 이용하여 자질 문맥 통계 정보를 추출하여 기 구축된 자질 문맥 통계정보 DB와; 상기 자질 문맥 정보 추출부에서 추출된 자질 문맥 정보와 상기 자질 문맥 통계정보 DB에 기 저장된 자질 문맥 통계 정보를 이용하여 자질 중의성을 해소하는 자질 중의성 해소부로 구성되는 것을 특징으로 하는 하이브리드 정답유형 인식 장치
5 5
제 1 항에 있어서, 상기 패턴 규칙 기반 정답 유형 인식부는 패턴 규칙을 추출한 후 그 추출된 패턴들을 필터링하여 기 구축된 패턴 규칙 DB와; 상기 패턴 규칙 DB에 저장된 패턴 규칙을 로딩하는 패턴 규칙 로딩부와; 상기 패턴 규칙 로딩부에 의해 로딩된 패턴 규칙을 이용하여 FSA를 생성하는 FSA 생성부와; 상기 FSA 생성부에서 생성된 FSA 및 상기 자질 중의성 해소 결과를 이용하여 정답 유형을 인식한 후, 그 정답 유형 인식 결과를 출력하는 정답 유형 인식부로 구성되는 것을 특징으로 하는 하이브리드 정답유형 인식 장치
6 6
제 5 항에 있어서, 상기 패턴 규칙은 '정답 유형=어휘/의미/자질패턴'으로 구성되는 것을 특징으로 하는 하이브리드 정답유형 인식 장치
7 7
제 1 항에 있어서, 상기 통계 기반 정답 유형 인식부는 상기 자질 중의성 해소 결과를 이용하여 상위 정답 유형 자질 함수를 추출하는 상위 정답 유형 자질 함수 추출부와; 상위 정답 유형 자질 함수을 추출한 후 IIS 알고리즘을 통해 기 기축된 상위 정답 유형 λ벡터 DB와; 상기 상위 정답 유형 자질 함수 추출부에서 추출된 상위 정답 유형 자질 함수와 상기 상위 정답 유형 λ벡터 DB에 저장된 상위 정답 유형 λ벡터를 이용하여 최대 확률 상위 정답 유형 범주를 도출하는 최대 확률 상위 정답 유형 범주 도출부로 구성되는 것을 특징으로 하는 하이브리드 정답유형 인식 장치
8 8
제 1 항에 있어서, 상기 정답 유형 세부 범주 인식부는 상기 통계 기반 정답 유형 인식부에서 인식된 ME 기반 상위 정답 유형을 이용하여 세부 정답 유형 자질 함수를 추출하는 세부 정답 유형 자질 함수 추출부와; 세부 정답 유형 자질 함수를 추출한 후 IIS 알고리즘을 통해 기 구축된 세부 정답 유형 λ벡터 DB와; 상기 세부 정답 유형 자질 함수 추출부에서 추출된 세부 정답 유형 자질 함수와 상기 세부 정답 유형 λ벡터 DB에 저정된 세부 정답 유형 λ벡터를 이용하여 최대 확률 세부 정답 유형 범주를 도출하는 최대 확률 세부 정답 유형 범주 도출부로 구성되는 것을 특징으로 하는 하이브리드 정답유형 인식 장치
9 9
입력 텍스트의 형태소를 분석하는 형태소 분석 단계와; 상기 형태소 분석 단계에서 분석된 형태소 리스트 각각에 대해 일정 크기의 음절을 추출하여 그 추출된 음절을 기반으로 하여 정답 유형을 인식하는 음절 기반 정답 유형 인식 단계와; 상기 각 형태소 리스트의 구성 형태소별 해당 자질을 할당하여 그 해당 자질을 인식하는 어휘 자질 인식 단계와; 상기 어휘 자질 인식 단계에서 인식된 하나 이상의 자질을 갖는 형태소들에 대하여 어휘 자질 중의성을 해소하는 어휘 자질 중의성 해소 단계와; 상기 형태소들의 연속된 나열과 형태소에 연결된 구성 자질들의 연속된 나열을 기 구축된 패턴 규칙들과 비교하여 정답 유형을 인식하는 패턴 규칙 기반 정답 유형 인식 단계와; 상기 형태소들의 연속된 나열과 형태소에 연결된 구성 자질들의 연속된 나열에 통계 모델을 적용하여 정답 유형을 인식하는 통계 기반 정답 유형 인식 단계와; 상기 통계 기반 정답 유형 인식 단계에서 대분류로 인식된 정답 유형에 대한 정답 유형 세부 범주를 인식하는 정답 유형 세부 범주 인식 단계를 포함하여 이루어 지는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
10 10
제 9 항에 있어서, 상기 음절 기반 정답 유형 인식 단계는 학습 자료를 구축하여 음절 색인 DB와 음절 기반 정답 유형 사전 DB를 구축하는 학습 자료 구축 과정과; 상기 형태소 분석 단계에서 분석된 형태소 리스트 각각에 대해 고정 크기의 음절을 추출하는 음절 추출 과정과; 상기 학습 자료 구축 과정에서 구축된 상기 음절 색인 DB를 조회하는 음절 색인 검색 과정과; 상기 학습 자료 구축 과정에서 구축된 음절 기반 정답 유형 사전 DB를 검색하여 정답 유형 어휘가 존재할 경우 음절 기반 정답 유형 인식 결과를 출력하는 정답 유형 사전 검색 과정으로 이루어 지는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
11 11
제 10 항에 있어서, 상기 학습 자료 구축 과정은 정답 유형 태깅 코퍼스가 입력되면 음절 색인을 추출하여 음절 색인 DB를 구축하는 음절 색인 DB 구축 과정과; 상기 추출된 음절 색인을 이용하여 음절 기반 정답 유형 사전을 추출하여 음절 기반 정답 유형 사전 DB를 구축하는 음절 기반 정답 유형 사전 DB 구축 과정으로 이루어 지는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
12 12
제 9 항에 있어서, 상기 어휘 자질 인식 단계는 기 구축된 자질 사전 DB를 검색하여 각 형태소 리스트의 구성 형태소별 해당 자질을 할당하는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
13 13
제 9 항에 있어서, 상기 어휘 자질 중의성 해소 단계는 학습 자료를 구축하여 자질 문맥 통계정보 DB를 구축하는 학습 자료 구축 과정과; 상기 중의성 자질 대상에서 자질 문맥 정보를 추출하는 자질 문맥 정보 추출하는 자질 문잭 정보 추출 과정과; 상기 자질 문맥 정보 추출 과정에서 추출된 자질 문맥 정보와 상기 자질 문맥 통계정보 DB에 기 저장된 자질 문맥 통계 정보를 이용하여 자질 중의성을 해소하는 자질 중의성 해소 과정으로 이루어 지는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
14 14
제 13 항에 있어서, 상기 학습 자료 구축 과정은 정답 유형 태깅 코퍼스가 입력되면 그 정답 유형 태깅 코퍼스의 형태소를 분석하는 형태소 분석 과정과; 기 구축된 자질 사전을 이용하여 상기 형태소 분석 과정에서 분석된 각 형태소에 대하여 자질을 할당하는 자질 할당 과정과; 상기 형태소와 관련된 자질들과 태깅 정보로 부터 추출된 정답 유형 정보에 따라 정답 유형 자료 구조를 생성하는 정답 유형 자료 구조 생성과정과; 상기 정답 유형 자료 구조 생성과정의 정보들을 이용하여 자질 문맥 통계 정보를 추출하여 상기 자질 문맥 통계 정보 DB를 구축하는 자질 문맥 통계 정보 DB 구축 과정으로 이루어 지는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
15 15
제 9 항에 있어서, 상기 패턴 규칙 기반 정답 유형 인식 단계는 패턴 규칙을 구축하여 패턴 규칙 DB를 구축하는 패턴 규칙 구축 과정과; 상기 패턴 규칙 DB에 저장된 패턴 규칙을 로딩하는 패턴 규칙 로딩 과정과와; 상기 패턴 규칙 로딩 과정에 의해 로딩된 패턴 규칙을 이용하여 FSA를 생성하는 FSA 생성 과정과; 상기 FSA 생성 과정에서 생성된 FSA 및 상기 자질 중의성 해소 결과를 이용하여 정답 유형을 인식한 후, 그 정답 유형 인식 결과를 출력하는 정답 유형 인식과정으로 이루어 지는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
16 16
제 15 항에 있어서, 상기 패턴 규칙 구축 과정은 개체명 태깅 코퍼스가 입력되면, 그 개체명 태깅 코퍼스의 형태소를 분석하는 형태소 분석 과정과; 기 구축된 자질 사전을 이용하여 상기 형태소 분석 과정에서 분석된 각 형태소에 대하여 자질을 할당하는 자질 할당 과정과; 상기 자질 할당 과정에서 할당된 자질의 중의성을 해소하는 자질 중의성 해소 과정과; 상기 형태소와 관련된 자질들과 태깅 정보로 부터 추출된 정답 유형 정보에 따라 정답 유형 자료 구조를 생성하는 정답 유형 자료 구조 생성과정과; 상기 정답 유형 자료 구조 생성과정의 정보들에서 패턴 규칙을 추출하는 패턴 규칙 추출 과정과; 상기 패턴 규칙 추출 과정에서 추출된 패턴들을 필터링하여 패턴 규칙으로 적합한 패턴들만을 규칙화하는 패턴 필터링 과정과; 상기 패턴 필터링 과정에서 필터링된 패턴들을 이용하여 패턴 규칙 DB를 구축하는 패턴 규칙 DB 구축 과정으로 이루어 지는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
17 17
제 16 항에 있어서, 상기 패턴 규칙은 '정답 유형=어휘/의미/자질패턴'으로 구성되는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
18 18
제 9 항에 있어서, 상기 통계 기반 정답 유형 인식 단계는 통계 정보를 구축하여 상위 정답 유형 λ벡터 DB를 구축하는 통계 정보 구축 과정과; 상기 자질 중의성 해소 결과를 이용하여 상위 정답 유형 자질 함수를 추출하는 상위 정답 유형 자질 함수 추출 과정과; 상기 상위 정답 유형 자질 함수 추출 과정에서 추출된 상위 정답 유형 자질 함수와 상기 상위 정답 유형 λ벡터 DB에 저장된 상위 정답 유형 λ벡터를 이용하여 최대 확률 상위 정답 유형 범주를 도출하는 최대 확률 상위 정답 유형 범주 도출 과정으로 이루어 지는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
19 19
제 18 항에 있어서, 상기 통계 정보 구축 과정은 정답 유형 태깅 코퍼스가 입력되면, 그 정답 유형 태깅 코퍼스의 형태소를 분석하는 형태소 분석 과정과; 기 구축된 자질 사전을 이용하여 상기 형태소 분석 과정에서 분석된 각 형태소에 대하여 자질을 할당하는 자질 할당 과정과; 상기 자질 할당 과정에서 할당된 자질의 중의성을 해소하는 자질 중의성 해소 과정과; 상기 형태소와 관련된 자질들과 태깅 정보로 부터 추출된 정답 유형 정보에 따라 정답 유형 자료 구조를 생성하는 정답 유형 자료 구조 생성과정과; 상기 정답 유형 자료 구조 생성과정의 정보들에서 상위 정답 유형 자질 함수를 추축하는 상위 정답 유형 자질 함수 추출 과정과; 상기 상위 정답 유형 자질 함수 추출 과정에서 추출된 상위 정답 유형 자질 함수를 이용하여 IIS 알고리즘을 수행하는 IIS 알고리즘 수행 과정과; 상기 IIS 알고리즘 수행 과정에서의 수행 결과를 이용하여 상위 정답 유형 λ벡터 DB를 구축하는 상위 정답 유형 λ벡터 DB 구축 과정으로 이루어 지는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
20 20
제 9 항에 있어서, 상기 정답 유형 세부 범주 인식 단계는 통계 정보를 구축하여 세부 정답 유형 λ벡터 DB를 구축하는 통계 정보 구축 과정과; 상기 통계 기반 정답 유형 인식 단계에서 인식된 ME 기반 상위 정답 유형을 이용하여 세부 정답 유형 자질 함수를 추출하는 세부 정답 유형 자질 함수 추출 과정과; 상기 세부 정답 유형 자질 함수 추출 과정에서 추출된 세부 정답 유형 자질 함수와 상기 세부 정답 유형 λ벡터 DB에 저정된 세부 정답 유형 λ벡터를 이용하여 최대 확률 세부 정답 유형 범주를 도출하는 최대 확률 세부 정답 유형 범주 도출 과정으로 이루어 지는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
21 21
제 20 항에 있어서, 상기 통계 정보 구축 과정은 정답 유형 태깅 코퍼스가 입력되면, 그 정답 유형 태깅 코퍼스의 어휘 자질을 처리하는 어휘 자질 처리 과정과; 상기 어휘 자질 처리 과정에서 처리된 어휘 자질에서 세부 정답 유형 자질 함수를 추출하는 세부 정답 유형 자질 함수 추출 과정과; 상기 세부 정답 유형 자질 함수 추출 과정에서 추출된 세부 정답 유형 자질 함수를 이용하여 IIS 알고리즘을 수행하는 IIS 알고리즘 수행 과정과; 상기 IIS 알고리즘 수행 과정에서의 수행 결과를 이용하여 세부 정답 유형 λ벡터 DB를 구축하는 세부 정답 유형 λ벡터 DB 구축 과정으로 이루어 지는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
22 21
제 20 항에 있어서, 상기 통계 정보 구축 과정은 정답 유형 태깅 코퍼스가 입력되면, 그 정답 유형 태깅 코퍼스의 어휘 자질을 처리하는 어휘 자질 처리 과정과; 상기 어휘 자질 처리 과정에서 처리된 어휘 자질에서 세부 정답 유형 자질 함수를 추출하는 세부 정답 유형 자질 함수 추출 과정과; 상기 세부 정답 유형 자질 함수 추출 과정에서 추출된 세부 정답 유형 자질 함수를 이용하여 IIS 알고리즘을 수행하는 IIS 알고리즘 수행 과정과; 상기 IIS 알고리즘 수행 과정에서의 수행 결과를 이용하여 세부 정답 유형 λ벡터 DB를 구축하는 세부 정답 유형 λ벡터 DB 구축 과정으로 이루어 지는 것을 특징으로 하는 하이브리드 정답유형 인식 방법
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US07412093 US 미국 FAMILY
2 US20060136208 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2006136208 US 미국 DOCDBFAMILY
2 US7412093 US 미국 DOCDBFAMILY
국가 R&D 정보가 없습니다.